Skip to content

annachurasheva/blogger-to-zen

Repository files navigation

Blogger to Zen - Сбор постов с Blogger

🌱 Описание проекта

Проект для автоматического сбора постов с Blogger-платформы Google и подготовки их для публикации в Zen.

🚀 Основная функциональность

  • ✅ Сбор постов по RSS-ленте Blogger
  • ✅ Фильтрация по меткам (тегам)
  • ✅ Обработка контента (замена YouTube на Rutube)
  • ✅ Генерация тегов для Zen
  • ✅ Создание плана публикаций
  • ✅ Экспорт в Telegram

📁 Структура проекта

blogger-to-zen/
├── main.py              # Основной скрипт
├── config.py            # Конфигурация
├── requirements.txt     # Зависимости
├── shorts_list.txt     # Шорты для публикаций
├── README.md           # Документация
├── .gitignore          # Игнорируемые файлы
├── .vscode/            # Настройки VS Code
├── src/                # Модули обработки
│   ├── __init__.py
│   ├── content_processor.py
│   ├── rss_fetcher.py
│   ├── youtube_replacer.py
│   └── zen_tagger.py
├── data/               # Папка для данных
│   ├── schedule.json
│   ├── archive/
│   └── cache/
├── logs/               # Логи
│   └── .gitkeep
├── output_samples/     # Примеры вывода
└── shorts/             # Шорты
    └── shorts_list.txt

🔧 Требования

  • Python 3.11+
  • Все зависимости из requirements.txt

📦 Установка

pip install -r requirements.txt

🚀 Запуск

python main.py

📄 Конфигурация

Основные параметры в config.py:

  • BLOGGER_RSS_BASE - URL RSS-ленты
  • BLOGS - список блогов и меток
  • TELEGRAM_BOT_TOKEN - токен Telegram бота
  • TELEGRAM_CHANNEL - канал для публикаций

📈 План публикаций

Создается автоматически в data/publication_plan.json:

  • 2 публикации в день
  • Минимальный интервал 6 часов
  • Чередование постов и шортов

🐛 Логирование

Все действия логируются в logs/pipeline.log с уровнем INFO.

🔗 Метки для сбора

По умолчанию используются метки:

  • Centifolia - посты о лечебных розах
  • шиповник - рецепты и полезные свойства
  • рецепт - кулинарные рецепты
  • масло - косметические рецепты

🔗 Telegram экспорт

Для публикации в Telegram:

  1. Настроить бота в @BotFather
  2. Указать токен в config.py
  3. Указать канал для публикаций

📊 Выходные данные

  • output_samples/ - примеры HTML/JSON
  • data/publication_plan.json - план публикаций
  • data/schedule.json - график публикаций

🔄 Синхронизация

Проект использует Git для контроля версий. Все изменения должны быть закоммичены и отправлены на удаленный репозиторий.

📋 Отчеты о разработке

После каждой рабочей сессии необходимо создавать отчет в папке development_stages/:

  • Используйте формат даты: YYYY-MM-DD_отчет.md
  • Опишите выполненные работы
  • Укажите внесенные изменения
  • Отметьте проблемы и их решения
  • Зафиксируйте статус проекта

Пример: development_stages/2026-03-25_testing_report.md

Это помогает отслеживать прогресс и поддерживать историю разработки.

🔐 Безопасность

  • Токены Telegram хранятся в config.py
  • Логи не содержат чувствительных данных
  • Архивные данные хранятся в data/archive/

About

забрать файлы из блоггер

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors