Borealis — аудио LLM для русского языка. Есть в двух вариантах - 0.6B и 1.7B.
-
Установка uv
curl -LsSf https://astral.sh/uv/install.sh | sh -
Установка зависимостей
uv sync
-
Проброска ключей
wandb login hf auth login
-
Запуск обучения
accelerate config accelerate launch train.py
Сначала нужно задать конфиг под конкретную спецификацию сервера. Если обучение будет на одной видеокарте, то будет достаточно команды
python train.py
-
Инференс
Для быстрой проверки используйте ноутбук test_model.ipynb. Он загружает сохранённую модель и вычисляет метрики$WER$ и$CER$
- borealis/
__init__.py— экспорт основных компонентовaugmentations.py— расписание аугментаций, миксинга шумов, реверберации и голосовых эффекторных слоёвdataset.py— класс датасетаmodeling.py— кастомныйBorealisForConditionalGenerationи обвязка поверхQwen3ForCausalLMutils.py— коллатор, нормализация текстов (clean_dataset), загрузка аудио
- train.py — главный файл для обучения
- configs/ — шаблоны конфигов Hydra (добавятся позже)