Привет! Меня зовут Антон Шалин, я аналитик данных и data scientist.
В этом репозитории вы можете найти некоторые из моих практических проектов по аналитике данных.
Работы по Data Science (нейросетям) смотрим в соседней ветке
- Инструменты анализа данных:
SQL,Python,Excel: - Системы управления базами данных:
PostgreSQL
Что нужно было сделать:
- Задача №1. Провести анализ поведения клиентской базы в предложенной бизнес-модели кинотеатра. Как есть.
- Задача №2. Определить наиболее влияющие факторы на снижение эффективности бизнес модели, а также предложить наиболее эффективные корректировки.
- Задача №3. Сформировать юнит-калькулятор с заполненными значениями изменений ключевых метрик для достижения целевой маржинальности.
Сделал (в наглядном виде представлены):
- Динамика количества абонентов. Определен момент прекращения работы используемой бизнес-модели.
- Динамика просмотров (общая активность абонентов). Определен момент начала сокращения просмотров, выдвинута гипотеза причин сокращения и варант решения проблемы.
- Проанализирована динамика первых просмотров. Отмечен эффект отсутствия реального пользования сервисом после подключения к нему.
- Проанализирована контент на предмет его потребления по абонентам и географии. Определены пути его оптимизации.
- На основе анализа возвращаемости клиентов к сервису выдвинуты гипотезы по качеству контента и тарифной политики сервиса. Предложены корректировки по ним.
- Собран юнит-калькулятор с указанием ключевых метрик, требующих корректировки и значения по величине этих коррекций. Их исполнение приведет к исправлению маржинальности сервиса с текущих -93% до прибыльных +25%.
Что нужно было сделать:
- Задача №1. Собрать балансы каждого ученика на каждый прожитый им день с оплатами, уроками и текущим балансом.
- Задача №2. Собрать суммарные балансы каждого ученика за все время с оплатами, уроками и остатком баланса. Составить сводную таблицу с агрегацией по ученику.
- Задача №3. Собрать суммарные балансы всех учеников на каждый день с оплатами, уроками и остатком баланса. Составить сводную таблицу с агрегацией по дате.
Сделал:
- Составлены 4 CTE подзапроса, которые использовались далее в 3 основных SQL запросах, решающих Задачи №1-3.
- На выходе одна общая таблица и две вспомогательные в качестве сводных, на основе общей. Выгружены в excel и построены графики.
- Для владельца составлен перечень вопросов по исходным данным и по результатам выгрузок.
SQL проект Полные балансы Балансы учеников Балансы по датам Вопросы по данным
Что нужно было сделать: Провести исследование альтернативного метода воздействия на клиентские покупки с помощью пуш-уведомлений.
- Задача №1. Очистить исходные данные с учетом условий дизайна эксперимента. Построить таблицу, которая будет в удобной форме хранить результаты АБ Теста.
- Задача №2. Вычислить статистические критерии тестирования с учетом запрошенных таргет-метрик. Провести необходимые сегментации. Разложить выходные данные по трем исходам теста: положительный, отрицательный, нейтральный. Выгрузить в Excel
- Задача №3. На основании созданного Excel файла построить калькулятор для обработки каждого из исходов в виде подсчета потенциальных дополнительных выгоды/убытков от введения новой системы уведомлений, а также вычисление необходимого числа наблюдений для тех объектов, где итоговых данных было недостаточно для обоснованного отнесения их результата в ту или иную сторону.
Сделал:
- Написан скрипт на Phyton для решения задач №1 и №2, сделана визуализация распределения разницы от изменения вида уведомления по средним платежам с сегментацией по городам
- На выходе одна общая таблица и две вспомогательные в качестве сводных, на основе общей. Выгружены в excel и построены графики.
- Во всех трех таблицах на каждом листе размещен свой калькулятор, согласно требуемого от каждого из них функционала.
Phyton проект
- Email: anton.shalin@gmail.com
- Tel: +79025666002
- Telegram: https://t.me/anton_shalin