Skip to content

mikhail2013ru/textSplitterShort

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

17 Commits
 
 
 
 
 
 
 
 

Repository files navigation

textSplitterShort — Smart Text Splitter for TTS & NLP


🧩 textSplitterShort

Умная разбивка текста на фрагменты для TTS, NLP и редактирования

💬 Просто. Быстро. Без зависимостей. Работает прямо в браузере.

Этот инструмент автоматически превращает длинный неструктурированный текст в логически завершённые отрывки, идеально подходящие для:

  • 🗣️ Синтеза речи (TTS) — избегает обрывов посреди слов или смысловых конструкций
  • 🤖 Обработки естественного языка (NLP) — готовит данные к анализу
  • ✍️ Редактуры и форматирования — делает текст читаемым и управляемым

Всё это — без установки, без сервера, без регистраций. Просто откройте HTML-файл и начните работать.


✨ Ключевые возможности

Функция Описание
🔍 Умная разбивка Сохраняет короткие предложения целиком, длинные — делит так, чтобы ни одна часть не была короче 50 символов
📏 Гибкий контроль длины Задайте максимальное число символов в блоке (например, 250)
📋 Однокликовое копирование Кликните на любой фрагмент — он скопируется и подсветится красным до повторного клика
🎨 Интуитивный интерфейс Счётчик символов, кнопки «Развернуть/Скрыть», мягкие тени, адаптивный дизайн
Автоматическая пунктуация Добавляет точку в конец, если её нет
🌐 Работает оффлайн Никаких внешних библиотек — только ваш браузер

▶️ Как начать

1. Скачайте проект

git clone https://github.com/mikhail2013ru/textSplitterShort.git
cd textSplitterShort

Или просто скачайте ZIP-архив

2. Откройте в браузере

Дважды кликните по файлу index.html — всё заработает мгновенно!

3. Используйте

  1. Вставьте текст в верхнее поле
  2. (Опционально) укажите желаемую длину блока в символах
  3. Получите два результата:
    • «Обработанный текст без разделения по блокам» — промежуточный результат
    • «Обработанные предложения, с разделением по блокам» — финальные фрагменты
  4. Кликните на любой блок — он скопируется в буфер обмена ✅

🧠 Как это работает?

Алгоритм следует простым, но эффективным правилам:

  1. Разделение на предложения по ., !, ?
  2. Обработка каждого предложения:
    • Если < 150 символов → оставляем как есть
    • Если ≥ 150 символов:
      • Пытаемся найти точку разреза, где обе части ≥ 50 символов
      • Если не получается — делим предложение ровно пополам
  3. Нормализация: добавляем точку в конец, если её нет
  4. Формирование блоков: объединяем фрагменты до указанного лимита символов

Результат — текст, который звучит естественно и легко обрабатывается.


📦 Технологии

  • HTML5 + CSS3 — современный, отзывчивый дизайн
  • Vanilla JavaScript (ES6+) — ноль зависимостей
  • Web Clipboard API — безопасное копирование
  • CSS Flexbox & Transitions — плавные анимации и адаптивность

📜 Лицензия

Проект распространяется под лицензией MIT — используйте свободно в личных и коммерческих целях.


🙌 Автор

Создано с ❤️ для сообщества NLP и TTS.
Автор: @mikhail2013ru


💡 Нравится проект?
⭐ Поставьте звезду на GitHub!
💬 Нашли баг или хотите улучшение? — Откройте Issue


About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Packages

 
 
 

Contributors

Languages