Skip to content

Latest commit

 

History

History
9 lines (5 loc) · 759 Bytes

File metadata and controls

9 lines (5 loc) · 759 Bytes

Программа для парсинга новостных страниц.

Программа использует файл config.ini для данных о кодировке, путях к тексту и заголовкам для разных газет.

Парсинг страницы осуществляется с использованием библиотеки lxml, элементы выделяются с помощью xpath.

Название текстового файла формируется из url.

Метод writeline печатает в текстовый файл согласно требованиям о ширине строки 80 символов и разделении абзацев пустой строкой.