git clone <repository-url>
cd 1c-help-parserЕсли у вас есть исходный файл shcntx_ru.hbk, конвертируйте его в rebuilt.shcntx_ru.zip:
# Используя WinRAR (установите WinRAR с https://www.win-rar.com/)
"C:\Program Files\WinRAR\Rar.exe" r data/shcntx_ru.hbkЭто создаст восстановленный архив rebuilt.shcntx_ru.zip для парсинга.
pip install -r requirements.txtpython run.py --checkpython run.py# Автоматическая обработка (без интерактивного ввода)
python run.py --auto
# Обработка конкретного файла
python run.py --file data/rebuilt.shcntx_ru.zip
# Демо оптимизированного контекста (рекомендуется)
python run.py --demo data/1c_context_optimized.jsondata/
├── 1c_context_optimized.json # Оптимизированный контекст (основной продукт)
├── hbk_analysis.json # Анализ структуры .hbk
└── extracted/ # Извлеченные HTML файлы
from src.demos.optimized_demo import OptimizedContextDemo
demo = OptimizedContextDemo("data/1c_context_optimized.json")
demo.load_context()
results = demo.search_by_keyword("форма")
demo.search_by_availability("сервер")
demo.search_by_category("objects")python run.py --file data/rebuilt.shcntx_ru.zip # Обработка конкретного файла
python run.py --demo data/1c_context_optimized.json # Демонстрация
python run.py --check # Проверка зависимостей
python run.py --auto # Автоматический режимВ src/parsers/bsl_syntax_extractor.py:
extract_all_syntax(max_files=1000) # Увеличить лимитИли через командную строку:
python run.py --file data/rebuilt.shcntx_ru.zip --max-files 1000В src/converters/optimized_context_converter.py добавьте новые экспортеры.
pip install beautifulsoup4Проверьте, что ZIP файлы находятся в папке data/.
Установите lxml для ускорения:
pip install lxml- 📋 Полная документация
- 📁 Структура проекта
- 🔧 Инструкции по использованию
- 📊 Отчеты
- 📈 Информация о проекте
Теперь вы можете:
- ✅ Парсить документацию 1С
- ✅ Создавать контекст для LLM
- ✅ Искать по синтаксису
- ✅ Использовать в своих проектах
Удачи в разработке! 🚀