Skip to content
Open
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
Original file line number Diff line number Diff line change
@@ -0,0 +1,197 @@
---
date: '2026-02-09'
description: تعلم كيفية استخدام تقنية OCR لاستخراج النص من الصور والمستندات في Java
باستخدام GroupDocs.Parser. يغطي هذا الدليل الإعداد، تحويل الصور إلى نص في Java،
وحالات الاستخدام العملية لمعالجة المستندات بكفاءة.
keywords:
- OCR Text Extraction
- GroupDocs.Parser Java
- Java OCR Integration
title: 'كيفية استخدام OCR مع GroupDocs.Parser Java: استخراج النص من الصور والوثائق'
type: docs
url: /ar/java/ocr-integration/ocr-text-extraction-groupdocs-parser-java/
weight: 1
---

# كيفية استخدام OCR مع GroupDocs.Parser Java

هل تبحث عن استخراج النص بكفاءة من الصور أو المستندات الممسوحة ضوئياً؟ **كيفية استخدام OCR** مع مكتبة GroupDocs.Parser للغة Java تقدم حلاً قوياً، يتيح دمج تقنية التعرف الضوئي على الأحرف (OCR) بسلاسة في تطبيقاتك. سيوجهك هذا الدليل الشامل خلال استخراج مناطق النص من ملفات الصور باستخدام موصل Aspose OCR مع GroupDocs.Parser في Java، مما يعزز قدرات معالجة المستندات لديك.

**ما ستتعلمه**
- إعداد واستخدام GroupDocs.Parser للغة Java.
- تهيئة `ParserSettings` باستخدام موصل OCR.
- تقنيات استخراج مناطق النص من الصور باستخدام تقنية Aspose OCR.
- تطبيقات عملية لهذه الميزة في سيناريوهات العالم الحقيقي مثل تحويل **java image to text** واستخراج مواضع النص في Java.

## إجابات سريعة
- **ماذا يعني “how to use OCR”؟** يشير إلى دمج محرك OCR لقراءة النص من الملفات القائمة على الصور.
- **ما المكتبة التي توفر OCR للغة Java؟** GroupDocs.Parser مع موصل Aspose OCR.
- **هل أحتاج إلى ترخيص؟** يتوفر نسخة تجريبية مجانية؛ يلزم ترخيص دائم للإنتاج.
- **هل يمكنني الحصول على إحداثيات النص؟** نعم، تُعيد API مواضع مناطق النص (اليسار، الأعلى، العرض، الارتفاع).
- **ما نسخة Java المطلوبة؟** يُنصح باستخدام Java 8 أو أحدث.

## ما هو استخراج نص OCR؟
التعرف الضوئي على الأحرف (OCR) يحول النص المرئي—الموجود في الصور الممسوحة ضوئياً أو ملفات PDF أو الصور الفوتوغرافية—إلى أحرف قابلة للقراءة آلياً. عندما تستخدم OCR في Java، فإنك تمكّن تطبيقاتك من البحث، والتحرير، وتحليل المستندات الثابتة سابقاً.

## لماذا نستخدم GroupDocs.Parser لـ OCR؟
- **Unified API** – يتعامل مع ملفات PDF، الصور، والعديد من الصيغ الأخرى باستخدام قاعدة شفرة واحدة.
- **Accurate Recognition** – مدعوم بـ Aspose OCR، الذي يدعم لغات وخطوط متعددة.
- **Position Data** – يسترجع الإحداثيات الدقيقة لكل كتلة نصية، وهو مثالي للمعالجة المدركة للتخطيط.
- **Scalable** – يعمل مع صور صغيرة أو وظائف دفعات كبيرة، ويمكن تشغيله محلياً أو في السحابة.

## المتطلبات المسبقة

قبل أن نبدأ، تأكد من وجود التالي:

### المكتبات والاعتمادات المطلوبة
- **GroupDocs.Parser for Java**: الإصدار 25.5 أو أحدث.
- **Maven** أو إعداد التحميل المباشر لتثبيت المكتبة.
- **Aspose OCR Connector**: الوصول إلى تقنية OCR من Aspose ضروري.

### متطلبات إعداد البيئة
- بيئة تطوير متكاملة متوافقة (IntelliJ IDEA، Eclipse، إلخ) تعمل على Java 8+.
- تثبيت Maven إذا كنت تفضّل طريقة مستودع Maven.

### المتطلبات المعرفية
- مهارات برمجة أساسية في Java.
- الإلمام بإدارة تبعيات المشروع.

## إعداد GroupDocs.Parser للغة Java

يمكنك إضافة المكتبة عبر Maven أو تحميلها مباشرة.

### استخدام Maven
أضف التكوينات التالية إلى ملف `pom.xml` الخاص بك:

```xml
<repositories>
<repository>
<id>repository.groupdocs.com</id>
<name>GroupDocs Repository</name>
<url>https://releases.groupdocs.com/parser/java/</url>
</repository>
</repositories>

<dependencies>
<dependency>
<groupId>com.groupdocs</groupId>
<artifactId>groupdocs-parser</artifactId>
<version>25.5</version>
</dependency>
</dependencies>
```

### التحميل المباشر
بدلاً من ذلك، حمّل أحدث نسخة من [GroupDocs.Parser for Java releases](https://releases.groupdocs.com/parser/java/).

#### خطوات الحصول على الترخيص
- **Free Trial** – تقييم المكتبة بدون تكلفة.
- **Temporary License** – استخدم مفتاحاً محدوداً زمنياً للاختبار الموسع.
- **Purchase** – احصل على ترخيص كامل للنشر في بيئة الإنتاج.

### التهيئة الأساسية والإعداد

بمجرد توفر المكتبة، يمكنك تهيئة المحلل. أدناه الكود الأساسي في Java الذي ينشئ مثيل `ParserSettings` مع موصل Aspose OCR:

```java
import com.groupdocs.parser.Parser;
import com.groupdocs.parser.options.ParserSettings;
import com.groupdocs.parser.ocr.AsposeOcrOnPremise;

ParserSettings settings = new ParserSettings(new AsposeOcrOnPremise());
```

بعد الانتهاء من الأساسيات، دعنا نتعمق في استخراج مناطق نص OCR.

## كيفية استخراج مناطق النص باستخدام OCR (خطوة بخطوة)

### 1. تهيئة `ParserSettings` مع موصل OCR
موصل OCR يتيح التعرف على النص في المستندات التي تحتوي على صور فقط.

```java
// Initialize ParserSettings with OCR Connector
ParserSettings settings = new ParserSettings(new AsposeOcrOnPremise());
```

### 2. فتح المستند وتكوين خيارات الاستخراج
نستخدم `PageTextAreaOptions` لإخبار المحلل بإرجاع بيانات الموقع لكل كلمة تم التعرف عليها.

```java
try (Parser parser = new Parser("YOUR_DOCUMENT_DIRECTORY", settings)) {
// Configure PageTextAreaOptions for OCR processing
PageTextAreaOptions options = new PageTextAreaOptions(true);

// Extract text areas from the document
java.lang.Iterable<PageTextArea> areas = parser.getTextAreas(options);

if (areas == null) {
return; // Exit if text areas extraction is not supported
}

for (PageTextArea a : areas) {
String text = a.getText();
int leftPosition = a.getRectangle().getLeft();
int topPosition = a.getRectangle().getTop();
int width = a.getRectangle().getSize().getWidth();
int height = a.getRectangle().getSize().getHeight();

// Process the extracted data as needed
}
} catch (java.lang.Exception ex) {
// Handle any exceptions that occur during processing
}
```

#### ما يفعله هذا الكود
- **Creates** مثيل `Parser` يشير إلى مجلد المستندات الخاص بك.
- **Enables** OCR عبر `PageTextAreaOptions(true)`.
- **Iterates** عبر كل `PageTextArea`، لتزويدك بالنص المعترف به **و** مستطيله الدقيق (الموقع والحجم).
- **Allows** لك تخزين أو معالجة البيانات، مثل إدراجها في قاعدة بيانات أو وضعها فوق واجهة المستخدم.

### 3. معالجة النتائج
يمكنك الآن استخدام النص المستخرج والإحداثيات لمختلف السيناريوهات:

- **Document Digitization** – تحويل العقود الممسوحة إلى ملفات PDF قابلة للبحث.
- **Data Entry Automation** – استخراج حقول مثل أرقام الفواتير مباشرةً من صور الإيصالات.
- **Content Management** – فهرسة مواضع النص لتسليط الضوء المتقدم في البحث.

## المشكلات الشائعة والحلول

| Symptom | Likely Cause | Fix |
|---------|--------------|-----|
| لم يتم إرجاع أي مناطق نص | لم يتم تكوين موصل OCR أو مسار الصورة غير صحيح | تحقق من أن مثيل `AsposeOcrOnPremise` مرخص بشكل صحيح وأن مسار الملف قابل للوصول. |
| حروف مشوهة | جودة الصورة منخفضة أو اللغة غير مدعومة | استخدم مسحات بدقة أعلى وقم بتكوين حزمة لغة OCR. |
| أخطاء نفاد الذاكرة في ملفات PDF الكبيرة | معالجة العديد من الصفحات عالية الدقة دفعة واحدة | قم بمعالجة الصفحات على دفعات أو فعّل وضع البث (`ParserSettings.setEnableStreaming(true)`). |

## الأسئلة المتكررة

**س: كيف أقوم بتثبيت GroupDocs.Parser للغة Java؟**
ج: أضفه كاعتماد Maven (انظر مقتطف XML أعلاه) أو حمّله مباشرةً من صفحة الإصدارات الرسمية.

**س: ما هو Aspose OCR، ولماذا نستخدمه مع GroupDocs.Parser؟**
ج: Aspose OCR هو محرك التعرف على النص بدقة عالية. عند اقترانه بـ GroupDocs.Parser، يوسّع قدرات المحلل للتعامل مع الملفات التي تحتوي على صور فقط وتوفير مواضع نص دقيقة.

**س: هل يمكنني معالجة صيغ صور متعددة؟**
ج: نعم. يدعم GroupDocs.Parser صيغ JPEG، PNG، BMP، TIFF، وغيرها—فقط تأكد من أن موصل OCR يستطيع قراءة الصيغة.

**س: ماذا أفعل إذا لم يتم استخراج أي مناطق نص؟**
ج: تحقق من مسار الملف، وتأكد من أن موصل OCR مرخص، وتأكد من أن نوع المستند مدعوم من قبل Aspose OCR.

**س: أين يمكنني العثور على موارد إضافية حول GroupDocs.Parser؟**
ج: زر [GroupDocs Documentation](https://docs.groupdocs.com/parser/java/) للحصول على أدلة مفصلة ومراجع API.

## الموارد
- [التوثيق](https://docs.groupdocs.com/parser/java/)
- [مرجع API](https://reference.groupdocs.com/parser/java)
- [تحميل أحدث نسخة](https://releases.groupdocs.com/parser/java/)
- [مستودع GitHub](https://github.com/groupdocs-parser/GroupDocs.Parser-for-Java)
- [منتدى الدعم المجاني](https://forum.groupdocs.com/c/parser)
- [ترخيص مؤقت](https://purchase.groupdocs.com/temporary-license/)

استكشف هذه الموارد لتعميق فهمك وتوسيع قدرات GroupDocs.Parser في مشاريعك.

---

**آخر تحديث:** 2026-02-09
**تم الاختبار مع:** GroupDocs.Parser 25.5 للغة Java
**المؤلف:** GroupDocs
Loading