Содержание
| № | Название проекта | Описание задачи | Навыки и инструменты | Сущность проекта |
|---|---|---|---|---|
| 01 | Музыка больших городов | Сравнение выбора пользователей Яндекс.Музыки из Москвы и Санкт-Петербурга в зависимости от времени (утро и вечер) и дня недели (понедельник, среда, пятница) | Python, Pandas | * основы программирования на Python (арифметические операции, строки, списки, for/while, функции, pandas) |
| 02 | Исследование надёжности заёмщиков | По представленным статистическим данным о платежеспособности клиентов банка провести исследование- влияет ли семейное положение и количество детей клиента на факт погашения кредита в срок. | Python, Pandas, предобработка данных | * предобработка данных, дубли, пропуски, преобразование типов данных, категоризация данных) |
| 03 | Исследование объявлений о продаже квартир | По данным сервиса Яндекс.Недвижимость — архиву объявлений о продаже квартир в Санкт-Петербурге и соседних населённых пунктах выяснить какие факторы больше всего влияют на стоимость квартиры. | Python, Pandas, Matplotlib, исследовательский анализ, визуализация данных, предобработка данных | * исследовательский анализ данных (графики hist(), boxplot(), plot() и др., join() , merge()) |
| 04 | Исследование тарифных планов оператора сотовой связи | Клиентам сотовой связи предлагается два тарифных плана: «Смарт» и «Ультра». По представленным данным провести предварительный анализ тарифов на небольшой выборке клиентов и выяснить, какой тариф приносит больше денег | Python, Pandas, Matplotlib, NumPy, SciPy, описательная статистика, проверка статистических гипотез, исследовательский анализ, визуализация данных, предобработка данных | * статистический анализ данных (выбор оптимальных метрик для описания данных, основы теории вероятностей, тип распределения расчет нормального и биномиального распределений, построение и проверка гипотез) |
| 05 | Исследование продаж компьютерных игр | Выявить определяющие успешность игры закономерности и спрогнозировать рынок продаж на ближайшую перспективу. | Python, Pandas, Matplotlib, NumPy, SciPy, предобработка данных, исследовательский анализ, описательная статистика, проверка статистических гипотез | * сборный проект по пройденым темам |
| 06 | Исследование данных об инвестициях венчурных фондов в компании-стартапы | Проанализировать данные о фондах и инвестициях, произвести выгрузки данных и ответить на поставленные вопросы с помощью SQL. | PostgreSQL | * базовый SQL: срезы данных (типы данных, SELECT, WHERE , IN/LIKE/BETWEEN, CASE, GROUP BY и тд., подзапросы, джоины) |
| 07 | Исследование причины плохой окупаемости развлекательного приложения Procrastinate Pro+ | По данным лога сервера с данными о посещениях приложения новыми пользователями выявить причины убытков вложений бизнеса | Python, Pandas, Matplotlib, Seaborn, NumPy, SciPy, datetime, math, requests, предобработка данных, исследовательский анализ, когортный анализ, юнит-экономика, продуктовые метрики | * анализ бизнес-показателей в python (CTR, CR, Когортный анализ, расчет удержания, отток, динамики удержания и оттока, расчет LTV (ARPU/ARPPU) , SAS, ROI ), MAU, WAU, DAU) |
| 08 | Исследование базы данных вопросов и ответов StackOverflow | SQL-запросы согласно поставленным задачам. | PostgreSQL | * продвинутый SQL (расчет LTV (ARPU/ARPPU) , SAS, ROI, расчет удержания, отток, динамики удержания и оттока, оконные функции, рамки в окнах) |
| 09 | Проверка гипотез для увеличения выручки интернет-магазина | Приоритизация гипотез, анализ результатов А/В теста | Python, Pandas, Matplotlib, Datetime, NumPy, SciPy, А/В-тестирование, проверка статистических гипотез | * принятие решений в бизнесе (приоритизация гипотез, А/В тесты) |
| 10 | Исследование рынка общественного питания в Москве | Исследование текущего положения дел на рынке общественного питания и определение тенденций для успешного вложения в открытие кафе. Создание презентации. | Python, Pandas, Matplotlib, Seaborn, Plotly, Datetime, Requests, BytesIO, визуализация данных, создание презентации | * сборный проект по пройденым темам |
| 11 | Исследование поведения пользователей мобильного приложения | Стартап, который продаёт продукты питания, планирует разобраться в поведении пользователей мобильного приложения. Анализ данных по логам пользователей, оценка результатов А/А и А/В тестов, воронка событий | Python, Pandas, Matplotlib, Seaborn, Plotly, Datetime, Math, NumPy, событийная аналитика, продуктовые метрики, проверка статистических гипотез, визуализация данных | * как рассказать историю с помощью данных (углубление в seaborn, plotly, визуализация в геоаналитике - библиотека folium) |
| 12 | Анализ пользовательского взаимодействия с карточками статей в Яндекс.Дзен | Анализ взаимодействия пользователей с карточками Яндекс.Дзен и построение дашборда на основании полученного технического задания: Импорт данных из SQL посредством Python и выгрузка в csv-формат для работы в Tableau | Python, Pandas, SQLAlchemy, PostrgeSQL, Tableau, продуктовые метрики, построение дашбордов, создание презентации | * Tableau (визуализация данных) |
| 13 | Поиск определяющих критериев эффективности опраторов контакных центрах. 1 часть выпускного проекта | На основании данных о операторах контакных центров необходимо выделить критерии, по которым можно определить эффективного оператора | Python, Pandas, requests, numpy, scipy, seaborn, matplotlib, plotly, cufflinks, визуализация данных, проверка статистических гипотез, построение дашбордов, создание презентации | * Выпускной проект |
| 14 | Оценка результатов A/B-теста. 2 часть выпускного проекта | Проверка корректности проведения А/Б теста и его оценка на основании датасета с действиями пользователей, технического задания вспомогательных датасетов | Python, Pandas, Datetime, Matplotlib, Seaborn, Plotly, SciPy, NumPy, Math, визуализация данных, проверка статистических гипотез, воронка событий | * Выпускной проект |
| 15 | SQL-запросы к базе данных сервиса по продаже книг. 3 часть выпускного проекта | Анализ данных для формирования ценностного предложения для нового продукта: запросы к базе данных SQL с помощью Python | Python, Pandas, SQLAlchemy, PostgreSQL | * Выпускной проект |