Skip to content

Парсер открытых данных по рассекреченным документам с сайта https://unsecret.rusarchives.ru

License

Notifications You must be signed in to change notification settings

ratred/unsecret

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 

Repository files navigation

unsecret

Скрипт для скачивания описей документов и дел с сайта http://unsecret.rusarchives.ru и сохранения в формате CSV.

При запуске сначала скачивается страничка номер 1 и оттуда берётся номер самой последней страницы.

После скачивания номер страницы записывается в файл getarchlog. Если работа скрипта прерывыается, в следующий раз он начинает с этой страницы.

Использование:

	unsecret [option]

Опции:

	--verbose         - Вывод большего количества информации на STDIN
	
	--fromfile <file> - Загрузка странички из файла (полезно для отладки регэкспов)
	
	--cases		  - Загружать "дела"
	
	--docs            - Загружать "документы" (по умолчанию)
	
	--printpage 	  - Вывести скачанную страницу целиком
	
	--outfile <file>  - Название файла, в который выводится csv (по умолчанию - docs.csv и cases.csv)

Для обычного использования достаточно запуска:

$./unsecret --docs

Или

$./unsecret --cases

Данные будут сохраняться в файлик docs.csv или cases.csv

About

Парсер открытых данных по рассекреченным документам с сайта https://unsecret.rusarchives.ru

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages