Skip to content

OptimusFaber/Paragraph_numerization

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

150 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Программа по поиску пропущенных параграфов и проблем нумерации

Виды параграфов:

1. 1) 1.1 (1) числа

a. a) (a) буквы

I. I) римские цифры

(Ещё табуляцию не забываем и пробелы \t\r)

Данные, которые идут на вход: Текст формата .txt Данные, которые идут на выход: Текст с ремарками, где пользователь забыл параграф с подписью Missing

Как это работает?

Я беру, что лишь параграфы вида 1 ... 9 (числа) и 1.1 ... 2.2 (числа с одной точкой) могут быть основными. Римские цифры и особенно буквы это подпараграфы. Особое вниманин уделяем главной последовательности, если оно кончилась (плсле 8.9 идет 1.1 и нет 8.10) то делаем новое дерево.

Parser_part.py вытаскивает все что похоже на параграфы:

alt text

Tree.py уже работает с полученной последовательностью - связывает нужное и выкидывает ненужное

alt text

Вот в этом месте программа сделала новое дерево тк дальше нет 7.13.2 или 7.14

alt text

Feedback.py отрабатывает полученные словари и возвращает пропущенные параграфы с пометкой Missing

alt text

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages