Skip to content

Latest commit

 

History

History
90 lines (61 loc) · 2.27 KB

File metadata and controls

90 lines (61 loc) · 2.27 KB

🚀 Быстрый старт: Индексация документов

📁 Куда загружать файлы

/home/temrjan/project/biotact-production/data/documents/

Поддерживаемые форматы: .md, .txt


⚡ Как запустить индексацию

cd /home/temrjan/project/biotact-production
venv/bin/python scripts/incremental_index.py

🎯 Что происходит

✅ Автоматически индексируются только новые и измененные файлы ✅ Экономия времени и денег на OpenAI API ✅ Старые файлы не переиндексируются ✅ Удаленные файлы автоматически убираются из базы


📊 Текущее состояние

Директория документов:

  • BIOTACT_KNOWLEDGE_BASE_V3.md
  • biotact_healthy_lifestyle.md
  • biotact_media_ecosystem.md
  • uzbekistan_market_context.md

Векторов в базе: 31 Статус: GREEN ✅


💡 Примеры использования

Добавить новый документ:

# 1. Скопируй файл
cp новый_документ.md data/documents/

# 2. Запусти индексацию
venv/bin/python scripts/incremental_index.py

Обновить существующий:

# 1. Отредактируй файл
nano data/documents/существующий.md

# 2. Запусти индексацию
venv/bin/python scripts/incremental_index.py

Удалить документ:

# 1. Удали файл
rm data/documents/старый.md

# 2. Запусти индексацию
venv/bin/python scripts/incremental_index.py

📖 Полная документация

См. подробное руководство: docs/INDEXING_GUIDE.md


⚠️ Важно

  • ❌ Не редактируй data/.index_state.json вручную
  • ✅ Всегда запускай индексацию после изменения файлов
  • ✅ Проверяй что Qdrant запущен: docker ps | grep qdrant

Дата создания: 2024-11-20 Версия: 1.0