GitHub - sensei89v/log_analyzer

Как установить

Установим virtualenv sudo apt-get install python3-venv
Создаем виртуальное окружене python3 -m venv .env
Переключаемся на созданную среду source .env/bin/activate
Ставим зависимости pip install -r requirements.txt

Как использовать

Переключаемся на заранее созданную среду source .env/bin/activate
Запуск python3 main.py <PARAMS>. Например: python3 main.py --filename data.json

Список доступных параметров:

--filename FILENAME - путь к файлу откуда будут читаться данные. (Формат файла см ниже). Обязательный параметр.
--target_domain DOMAIN - Домен, переходы с которого мы хотим учитывать как "наши". Значение по умолчнию: "ours.com"
--shop_domain DOMAIN - Домен магазина. Значение по умолчнию "shop.com"
--finish_url URL - URL, куда переходит пользователь совершивший покупку. Значение по умолчнию "https://shop.com/checkout"
--ignore-errors - Флаг. Если выставлен, то при загрузке данных мы будем игнорировать некорректные записи. Значение по умолчанию: false
--another_domains DOMAIN [DOMAIN...] - Рекламные домены конкурентов. Значение по умолчанию: "theirs1.com", "theirs2.com"
-h, --help - Показ справочной информации.

Важно! Все переходы с доменов не входящих в --another_domains, --target_domain, --shop_domain - считаются внешними переходами

Формат данных во входных файлах:

[
    {
        "client_id": "...",
        "User-Agent": "...",
        "document.location": "...",
        "document.referer": "...",
        "date": "..."
    },
    ...
]

Как работает

Програма условно можно быть разделена на 2 куска:

Загрузка данных в оперативную память. Цель его: получение отсортированной по возрастанию последовательности переходов
Обработка загруженных данных. Цель его: анализ данных и получение ответа.

Программа возвращает последовательность переходов с нашего домена, которые привели к покупкам, а также количество покупок, которые произошли после переходов. Программа игнорирует user-agent.

Запуск тестов

Переключаемся на заранее созданную среду source .env/bin/activate
Запуск тестов python -m pytest tests/ -v

Перед коммитом желательно запускать скрипт bash precommit.sh. Данный скрипт запускает не только тесты, но и линтеры flake8 и mypy

Объяснения некоторых нюансов

"А почему не используется Docker файл?" - т.к. входными данными являются файлы, их не очень удобно прокидывать в Docker файл. Можно конечно использовать механизм volume при запуске образа, но кажется это усложняет использование и требует наличие установленного docker на целевой системе.
"Зачем требование к возрастание логов к функции build_statistics"? Парсинг из файла это хорошо, однако, если мы подключаем БД или какие-нибудь инструменты большх вычислений, то мы можем запросить эти инструменты отсортировать нам данные и передать в эту функцию уже генератор и сможем не "взорваться" по памяти.

Технические аспекты

Разработка проведена на ОС Ubuntu 18.04

Что можно улучшить

Добавить тест загрузки файлов
Фильтр
Добавить неразличимость для ссылок по нашему домену от схемы url и последовательности параметров. Например: https://ours.com/data?a=1&b=2 была эквивалентно http://ours.com/data?b=2&a=1
Разнести отдельно requirements.txt для запуска и для разработки и тестов

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
src		src
tests		tests
.gitignore		.gitignore
README.md		README.md
data.json		data.json
main.py		main.py
precommit.sh		precommit.sh
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Как установить

Как использовать

Как работает

Запуск тестов

Объяснения некоторых нюансов

Технические аспекты

Что можно улучшить

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Как установить

Как использовать

Как работает

Запуск тестов

Объяснения некоторых нюансов

Технические аспекты

Что можно улучшить

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages