Skip to content

chernxvv/lyrics_video_generator

Lyrics Video Generator

Lyrics Video Generator — это desktop GUI-приложение на PySide6 для сборки lyric-video из аудиотрека, обложки и текста. Проект ориентирован на быстрый практический результат: можно работать полностью вручную или использовать auto-sync как стартовую точку с последующей ручной доводкой. Поддерживаются вертикальные и горизонтальные форматы, а также два визуальных режима фона.

Статус проекта

Public beta.

Базовый workflow уже пригоден для реальной работы: доступны ручная синхронизация, рендер, вертикальный и горизонтальный форматы, а также режимы фона.

Auto-sync и BPM-reactive background работают, но в зависимости от трека, сложности микса и локального окружения могут требовать ручной доводки.

Быстрый запуск

Linux/macOS

./run.sh

Windows

run.bat

Скрипт автоматически создаёт .venv, устанавливает зависимости и запускает GUI. Можно выбрать базовый режим (base) или установку с авто-синхронизацией (base + autosync).

В системе должны быть установлены ffmpeg и ffprobe.

Примеры результата

Vertical (9:16) · Мягкий градиент · Preview

lyrics_video_preview_vertical_gradient.mp4

Vertical (9:16) · Динамический BPM-фон · Preview

lyrics_video_preview_vertical_bpm.mp4

Horizontal (16:9) · Мягкий градиент · Preview

lyrics_video_preview_horizontal_gradient.mp4

Horizontal (16:9) · Динамический BPM-фон · Preview

lyrics_video_preview_horizontal_bpm.mp4

Как использовать

GUI screenshot

  1. Выберите аудиофайл и изображение обложки.
  2. Заполните метаданные трека.
  3. Выберите режим синхронизации:
    • Manual: заполните таблицу мм:сс + строка.
    • Auto-sync: вставьте полный текст, запустите автоанализ, затем при необходимости поправьте тайминги вручную.
  4. Выберите ориентацию, режим фона и render mode (Preview/Final).
  5. Нажмите «Сгенерировать видео».

Основные возможности

  • Desktop GUI workflow: загрузка аудио/обложки, ввод метаданных, настройка синхронизации и экспорт видео.
  • Две ориентации: 9:16 (vertical) и 16:9 (horizontal).
  • Два режима синхронизации: manual и auto-sync.
  • Два режима фона: soft gradient и dynamic BPM background.
  • Два режима рендера: Preview (быстрая проверка) и Final (финальный экспорт).
  • Запуск для обычного пользователя через run.sh (Linux/macOS) или run.bat (Windows).

Минимальные системные ожидания

  • Python 3.11+.
  • В системе должны быть установлены ffmpeg и ffprobe, доступные через PATH.
  • Основные целевые среды — Windows и Linux.
  • NVIDIA GPU не обязателен: он используется только для ускорения кодирования через NVENC, если доступен.
  • Для auto-sync нужны дополнительные опциональные зависимости (autosync extras).

Ограничения и ожидания в отношении качества

  • Auto-sync — это usable baseline, а не идеальный alignment для всех треков.
  • На сложных/плотных миксах и нетипичном вокале возможны ошибки тайминга.
  • После авто-синхронизации обычно нужна ручная доводка.
  • Для полного auto-sync pipeline требуются дополнительные зависимости (autosync extras).

Полная техническая документация

Полная техническая спецификация (архитектура, fallback-логика, производительность, GPU/NVENC, debug-export, benchmark и инженерные ограничения):

Project policies and contribution

About

Desktop GUI app for generating lyric videos from audio, cover art, and lyrics.

Topics

Resources

License

Code of conduct

Contributing

Security policy

Stars

Watchers

Forks

Releases

No releases published

Contributors

Languages