diff --git a/content/arabic/java/searching/groupdocs-search-java-regex-tutorial/_index.md b/content/arabic/java/searching/groupdocs-search-java-regex-tutorial/_index.md new file mode 100644 index 00000000..74bcd409 --- /dev/null +++ b/content/arabic/java/searching/groupdocs-search-java-regex-tutorial/_index.md @@ -0,0 +1,155 @@ +--- +date: '2026-02-01' +description: تعلم كيفية البحث باستخدام تعبيرات regex في Java وكيفية إنشاء فهرس باستخدام + GroupDocs.Search. يغطي هذا الدرس الإعداد، الفهرسة، وأمثلة بحث regex في Java. +keywords: +- regex searches +- GroupDocs.Search for Java +- Java text document analysis +title: 'كيفية البحث باستخدام تعبيرات regex في جافا: إتقان GroupDocs.Search لتحليل + المستندات النصية' +type: docs +url: /ar/java/searching/groupdocs-search-java-regex-tutorial/ +weight: 1 +--- + +# كيفية البحث باستخدام Regex في Java: إتقان GroupDocsات النص بكفاءة تحديًا. **كيفية البحث باستخدام regex** في Java يصبح بسيطًا مع GroupDocs.Search، وهي مكتبة توفر قدرات قوية لمليل ستتعلم كيفية إعداد البيئة، إنشاء فهرس، إضافة مستندات، وتنفيذ استعلامات regex سواءً النصية أو الكائنية. في النهاية ستحصل على **دروس بحث regex في Java** يمكنك تطبيق- **ما هي المكتبة الأساسية؟** GroupDocs.Search للـ Java +- **كيف أبدأ؟** أضف تبعية Maven وابدأ كائن؟** نعم – استخدم استعلامات regex سيناريوهات regex +- **قت للاستخدام في الإنتاج +- **ما نسخة JDK المدعومة؟** Java 8 أو أعلى + +## ما هو البحث باستخدام Regex؟ +يتيح لك البحث بالتعبيرات النمطية (regex) تحديد أنماط، أو الأحرف المتكررة—عبر العديد من المستندات في عملية واحدة. تقوم GroupDocs.Search بتحويل هذه الأنماط إلى استعلامات فعّالة تعمل بسرعة حتى على مجموعات بياناتبحث باستخدام Regex؟ +- **السرعة:** البحث القائم على الفهرس يتجنب مسح الملفات الخام في كل مرة. +- **المرونة:** يدعم كلًا من استعلامات النص البسيطة والاستعلامات الكائنية المعقدة. +- **دعم صيغ واسعة:** يعمل مع PDFs، Word، Excel، النص العادي، وأكثر. + +## المتطلبات المسبقة +- مجموعة تطوير جافا (JDK) 8 أو أعلى +- Maven لإدارة التبعيات +- معرفة أساسية بجافا والتعبيرات النمطية + +### المكتبات والتبعيات المطلوبة +أدرج GroupDocs.Search عبر Maven: + +```xml + + + repository.groupdocs.com + GroupDocs Repository + https://releases.groupdocs.com/search/java/ + + + + + + com.groupdocs + groupdocs-search + 25.4 + + +``` + +بدلاً من ذلك، حمّل أحدث ملف JAR من [إصدارات GroupDocs.Search للـ Java](https://releases.groupdocs.com/search/java/). + +### الحصول على الترخيص +احصل على ترخيص تجريبي مجاني أو مؤقت من [GroupDocs.License](https://purchase.groupdocs.com/temporary-license.Search للـ Java + +### معلومات التثبيت +ف المستودع والتبعية الموضحة أعلاه إلى ملف `pom.xml`. +2. **تحميل مباشر:** ضع ملفات JARّل ملف الترخيص عند بدء تشغيل التطبيق. + +```java +import com.groupdocs.search.*; + +public class SearchSetup { + public static void main(String[] args) { + // Initialize the index by specifying a directory. + String indexFolder = "YOUR_DOCUMENT_DIRECTORY\\output\\AdvancedUsage\\Searching\\RegularExpressionSearch"; + Index index = new Index(indexFolder); + + System.out.println("Index created successfully at: " + indexFolder); + } +} +``` + +## كيفية إنشاء فهرس +إنشاء فهرس هو الخطوة الأولى نحو عمليات بحث سريعةنداتك. + +```java +String indexFolder = "YOUR_DOCUMENT_DIRECTORY\\output\\AdvancedUsage\\Searching\\RegularExpressionSearch"; +Index index = new Index(indexFolder); +``` + +## كيفية إضافة مستندات +بعد وجود مجلد الفهرس، قم بملئه بالملفات التي تريد البحث فيها. + +```java +index.add("YOUR_DOCUMENT_DIRECTORY"); +system.out.println("Documents added to the index."); +``` + +## البحث بالتعبير النمطي في شكل نصي +استعلامات regex النصية سريعة الكتابة ومثالية للبحث الأحادي. + +```java +String query1 = "^((.)\\2{1,})"; +``` + +```java +SearchResult result1 = index.search(query1); +system.out.println("Number of occurrences found: " + result1.getDocumentCount()); +``` + +## البحث بالتعبير النمطي في شكل كائن +الاستعلامات الكائنية توفر تعريفات بحث قابلة لإعادة الاستخدام وآمنة من حيث النوع. + +```java +SearchQuery query2 = SearchQuery.createRegexQuery("^(.)\\1{1,}"); +``` + +```java +SearchResult result2 = index.search(query2); +system.out.println("Occurrences found using object form: " + result2.getDocumentCount()); +``` + +## حالات استخدام تصفية المحتوى باستخدام Regex +يمكنك استخدام regex لحظر أو وضع علامة على المحتوى الذي يطابق أنماطًا معينة، مثل: + +- اكتشاف الأحرف المتكررة لتصفية الرسائل المزعجة +- العثور على سلاسل تشبه أرقام بطاقات الائتمان لفحص خصوصية البيانات +- استخراج التواريخ أو المعرفات للمعالجة اللاحقة + +## تطبيقات عملية +1. **أنظمة إدارة المستندات:** تمكين المستخدمين من العثور على العقود، الفواتير، أو السياسات عبر الأنماط. +2. **تصفية المحتوى:** تطبيق قواعد تصفية المحتوى باستخدام regex لت moderate النصوص التي يولدها المستخدمون. +3. **تحليل البيانات:** استخراج البيانات المهيكلة (مثل أرقام الطلبات) من الملفات غير المهيكلة. + +## اعتبارات الأداء +- **تحديث الفهرس:** أعد تشغيل `index.add` كلما تغيرت الملفات المصدرية. +- **إدارة الذاكرة:** للمجموعات الضخمة، راقب استهلاك الـ heap وفكّر في الفهرسة التدريجية. +- **تصميم Regex:** حافظ على اختصار الأنماط؛ فالتعبيرات الواسعة جدًا قد تُبطئ الأداء. + +## الخلاصة +أنت الآن تعرف **كيفية البحث باستخدام regex** في Java باستخدام GroupDocs.Search، من إعداد المكتبة وإنشاء الفهرس إلى تنفيذ استعلامات نصية وكائنية. ستساعدك هذه التقنيات على بناء ميزات بحث سريعة وواعية للأنماط في أي تطبيق Java. + +## قسم الأسئلة المتكررة + +**س1: ما الفرق بين استعلامات regex النصية وتلك الكائنية في GroupDocs.Search؟** +ج1: الاستعلامات النصية أبسط لكنها أقل مرونة، بينما الاستعلامات الكائنية توفر إدارة أفضل وإمكانية إعادة الاستخدام. + +**س2: هل يمكنني استخدام GroupDocs.Search لفهرسة المستندات غير النصية؟** +ج2 PDFs، ملفات Word، أوراق Excel، والحديث فهرس البحث الموجود؟** +ج3: استخدم طريقة `index.add` معس. + +**س4: ما هي بعض المشكلات الشائعة عند استخدام GroupDocs.Search؟** +ج4: تشمل المشكلات الشائعة أنماط regex غير صحيحة لا تُعيد نتائج، وتدهور الأداء في الفهارس الكبيرة جدًا. تحقق من الأنماط وحافظ على تحسين الفهرس. + +**س5: أين يمكنني العثور على دروس متقدمة حول GroupDocs.Search؟** +ج5: زر [توثيق GroupDocs](https://docs.groupdocs.com/search/java/) للحصول على أدلة مفصلة وأمثلة. + +--- + +**آخر تحديث:** 2026-02-01 +**تم الاختبار مع:** GroupDocs.Search 25.4 +**المؤلف:** GroupDocs \ No newline at end of file diff --git a/content/chinese/java/searching/implement-groupdocs-search-java-document-search/_index.md b/content/chinese/java/searching/implement-groupdocs-search-java-document-search/_index.md new file mode 100644 index 00000000..586d72e4 --- /dev/null +++ b/content/chinese/java/searching/implement-groupdocs-search-java-document-search/_index.md @@ -0,0 +1,188 @@ +--- +date: '2026-02-01' +description: 学习如何使用 GroupDocs.Search 在 Java 中搜索文档并高效突出显示搜索词,从而提升文档管理。 +keywords: +- GroupDocs.Search Java +- document search with GroupDocs +- highlighting search results in documents +title: 如何使用 GroupDocs.Search 在 Java 中搜索文档:提取并高亮显示结果 +type: docs +url: /zh/java/searching/implement-groupdocs-search-java-document-search/ +weight: 1 +--- + +# 如何使用 GroupDocs.Search 搜索文档(Java) + +在数字化 documents java** 快速检索对于企业和开发者至关重要。无论是搜索法律合同还是学术论文,都需要一个强大的解决方案来快速找到相关信息。本教程将指导您使用 GroupDocs.Search Java大库。 + +## 快速答案 +- **什么库可以帮助搜索文档 Java?** GroupDocs.Search for Java。 +- **我可以在结果中突出显示搜索词 java 吗?** 是的,库可以生成带有高亮词的 HTML。 +- **我需要许可证吗?** 提供免费试用;生产环境需要** 任意 Java IDE,例如 IntelliJ IDEA、Eclipse 或 VS Code。 +- **是否支持 Maven?** 当然——将仓库和依赖添加到你的 `pom.xml`。 + +## 什么是 GroupDocs.Search for Java? +GroupDocs.Search 是一款 Java SDK,能够对多种文档类型(PDF、DOCX、XLSX 等)进行索引和文本搜索。它提供模糊构建可搜索文档库的理想选择。 + +## 为什么使用 GroupDocs.Search 来搜索文档 Java? +- **速度:** 索引搜索在毫秒内返回结果,即使是大型集合。 +- **灵活性:** 支持模糊搜索、布尔运算直接在生成的 HTML 预览中 **highlight search terms java**。 +- **可扩展性:** 可在本地、云端或混合存储解决方案中使用。 + +## 前置条件 +1. 已安装 **Java Development Kit (JDK) 8 或更高版本**。 +2. **Maven**(或手动依赖管理)。 +3. IDE,例如 **IntelliJ +4. 对 Java 和 Maven 项目结构有基本了解。 + +## 设置 GroupDocs.Search for Java + +### 通过 Maven 安装 +将 GroupDocs 仓库和依赖添加到你的 `pom.xml`: + +```xml + + + repository.groupdocs.com + GroupDocs Repository + https://releases.groupdocs.com/search/java/ + + + + + + com.groupdocs + groupdocs-search + 25.4 + + +``` + +### 直接下载 +如果你不想使用 Maven,可从官方发布页面下载最新的 JAR: [GroupDocs.Search for Java 发布](https://releases.groupdocs.com/search/java/)。 + +#### 获取许可证的步骤 +- **免费试用:** 开始免费试用以探索功能。 +- **临时许可证:** 通过 [GroupDocs 官方网站](https://purchase.groupdocs.com/temporary-license) 获取。 +- **购买:** 若需无限制的生产使用,请购买完整许可证。 + +### 基本初始化和设置 +创建索引文件夹并实例化 `Index` 对象: + +```java +String indexFolder = "YOUR_DOCUMENT_DIRECTORY/ObtainSearchResultInformation"; +Index index = new Index(indexFolder); +``` + +## 如何搜索文档 Java –词项、短语、出现次数)有助于构建分析仪表盘或生成关于文档集合内容的报告。 + +### 步骤实现 + +#### 步骤 1:创建索引 +```java +String indexFolder = YOUR_DOCUMENT_DIRECTORY + "/ObtainSearchResultInformation"; +Index index = new Index(indexFolder); +index.add(documentFolder); +``` + +#### 步骤 2:配置搜索选项(启用模糊搜索) +```java +SearchOptions options = new SearchOptions(); +options.getFuzzySearch().setEnabled(true); +options.getFuzzySearch().setFuzzyAlgorithm(new TableDiscreteFunction(3)); +``` + +#### 步骤 3:执行搜索 +```java +String query = "favourable OR \"ipsum dolor\""; +SearchResult result = index.search(query, options); +``` + +#### 步骤 4:提取出现次数 +```java +for (int i = 0; i < result.getDocumentCount(); i++) { + FoundDocument document = result.getFoundDocument(i); + for (FoundDocumentField field : document.getFoundFields()) { + if (field.getTerms() != null) { + for (String term : field.getTerms()) { + int occurrences = field.getTermsOccurrences()[field.getTerms().indexOf(term)]; + System.out.println("Term: " + term + ", Occurrences: " + occurrences); + } + } + if (field.getTermSequences() != null) { + for (String[] terms : field.getTermSequences()) { + int occurrences = field.getTermSequencesOccurrences()[ArrayUtils.indexOf(field.getTermSequences(), terms)]; + StringBuilder sequence = new StringBuilder(); + for (String term : terms) { + sequence.append(term).append(" "); + } + System.out.println("Phrase: " + sequence.toString() + ", Occurrences: " + occurrences); + } + } + } +} +``` + +## 功能 2:在文档中高亮显示搜索词 Java + +### 概述 +生成包含 **highlight search terms java** 的 HTML 文件,可让终端用户立即看到匹配位置,提高审阅速度和协作效率。 + +### 步骤实现 + +#### 步骤 1:使用高压缩设置索引 +```java +String indexFolder = YOUR_DOCUMENT_DIRECTORY + "/HighlightSearchResults"; +IndexSettings settings = new IndexSettings(); +settings.setTextStorageSettings(new TextStorageSettings(Compression.High)); +Index index = new Index(indexFolder, settings); +index.add(documentFolder); +``` + +#### 步骤 2:执行搜索并高亮结果 +```java +SearchResult result = index.search("solicitude"); +if (result.getDocumentCount() > 0) { + FoundDocument document = result.getFoundDocument(0); + String path = YOUR_OUTPUT_DIRECTORY + "/Highlighted.html"; + OutputAdapter outputAdapter = new FileOutputAdapter(OutputFormat.Html, path); + Highlighter highlighter = new DocumentHighlighter(outputAdapter); + index.highlight(document, highlighter); +} +``` + +## 实际应用 +1. **法律文档审查** – 快速定位数百份合同中的条款。 +2. **学术研究** – 从研究论文中提取关键短语用于文献综述。 +3. **客户支持** – 在电子邮件存档中识别重复问题。 +4. **内容管理** – 在文章和博客中高亮关键词,以进行 SEO 审计。 + +## 性能考虑 +- **压缩:** 高压缩可减少存储空间,但可能增加 CPU 使用率;请针对你的工作负载进行测试。 +- **内存管理:** 分批索引文档以保持低内存占用。 +- **索引刷新:** 定期重新索引已更改的文件,以保持搜索结果的准确性。 + +## 结论 +在本指南中,我们演示了如何使用 GroupDocs.Search **search documents java**,提取详细的结果信息,并在 HTML 预览中 **highlight search terms java**。这些能力使您能够为任何文档库构建快速、用户友好的搜索体验。 + +### 接下来的步骤 +- 将高亮的 HTMLSearchOptionsWildcardSearch`。 +- 探索 GroupDocs.Search API 参考,以了解自定义评分等高级场景。 + +## 常见问题 + + Java SDK,能够对多种文档格式进行索引和文本搜索,提供模糊搜索和结果高亮等功能。 + +**Q: 模糊搜索是如何工作的?** +A: 它通过容忍可配置数量的字符差异来实现近似匹配,适用于处理拼写错误的情况。 + +**Q: 我可以在没有许可证的情况下使用 GroupDocs.Search 吗?** +A: 可以,提供免费试用,但生产部署需要完整许可证。 + +**Q: 支持 +A: PDF、DOCX、XLSX档获取完整列表。 + +**Q: 如何** +A: 直接提供生成的 HTML 文件(例如 `Highlighted.html`),或使用 `