Skip to content

Проекты расположены по степени освоения новых навыков (1 - проект начало обучения, последний проект оконачание обучения).

Notifications You must be signed in to change notification settings

VeniaminSh/Practicum_Projects

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation


Проекты курса Яндекс.Практикум "Аналитик данных"


Содержание

Название проекта Описание задачи Навыки и инструменты Сущность проекта
01 Музыка больших городов Сравнение выбора пользователей Яндекс.Музыки из Москвы и Санкт-Петербурга в зависимости от времени (утро и вечер) и дня недели (понедельник, среда, пятница) Python, Pandas * основы программирования на Python (арифметические операции, строки, списки, for/while, функции, pandas)
02 Исследование надёжности заёмщиков По представленным статистическим данным о платежеспособности клиентов банка провести исследование- влияет ли семейное положение и количество детей клиента на факт погашения кредита в срок. Python, Pandas, предобработка данных * предобработка данных, дубли, пропуски, преобразование типов данных, категоризация данных)
03 Исследование объявлений о продаже квартир По данным сервиса Яндекс.Недвижимость — архиву объявлений о продаже квартир в Санкт-Петербурге и соседних населённых пунктах выяснить какие факторы больше всего влияют на стоимость квартиры. Python, Pandas, Matplotlib, исследовательский анализ, визуализация данных, предобработка данных * исследовательский анализ данных (графики hist(), boxplot(), plot() и др., join() , merge())
04 Исследование тарифных планов оператора сотовой связи Клиентам сотовой связи предлагается два тарифных плана: «Смарт» и «Ультра». По представленным данным провести предварительный анализ тарифов на небольшой выборке клиентов и выяснить, какой тариф приносит больше денег Python, Pandas, Matplotlib, NumPy, SciPy, описательная статистика, проверка статистических гипотез, исследовательский анализ, визуализация данных, предобработка данных * статистический анализ данных (выбор оптимальных метрик для описания данных, основы теории вероятностей, тип распределения расчет нормального и биномиального распределений, построение и проверка гипотез)
05 Исследование продаж компьютерных игр Выявить определяющие успешность игры закономерности и спрогнозировать рынок продаж на ближайшую перспективу. Python, Pandas, Matplotlib, NumPy, SciPy, предобработка данных, исследовательский анализ, описательная статистика, проверка статистических гипотез * сборный проект по пройденым темам
06 Исследование данных об инвестициях венчурных фондов в компании-стартапы Проанализировать данные о фондах и инвестициях, произвести выгрузки данных и ответить на поставленные вопросы с помощью SQL. PostgreSQL * базовый SQL: срезы данных (типы данных, SELECT, WHERE , IN/LIKE/BETWEEN, CASE, GROUP BY и тд., подзапросы, джоины)
07 Исследование причины плохой окупаемости развлекательного приложения Procrastinate Pro+ По данным лога сервера с данными о посещениях приложения новыми пользователями выявить причины убытков вложений бизнеса Python, Pandas, Matplotlib, Seaborn, NumPy, SciPy, datetime, math, requests, предобработка данных, исследовательский анализ, когортный анализ, юнит-экономика, продуктовые метрики * анализ бизнес-показателей в python (CTR, CR, Когортный анализ, расчет удержания, отток, динамики удержания и оттока, расчет LTV (ARPU/ARPPU) , SAS, ROI ), MAU, WAU, DAU)
08 Исследование базы данных вопросов и ответов StackOverflow SQL-запросы согласно поставленным задачам. PostgreSQL * продвинутый SQL (расчет LTV (ARPU/ARPPU) , SAS, ROI, расчет удержания, отток, динамики удержания и оттока, оконные функции, рамки в окнах)
09 Проверка гипотез для увеличения выручки интернет-магазина Приоритизация гипотез, анализ результатов А/В теста Python, Pandas, Matplotlib, Datetime, NumPy, SciPy, А/В-тестирование, проверка статистических гипотез * принятие решений в бизнесе (приоритизация гипотез, А/В тесты)
10 Исследование рынка общественного питания в Москве Исследование текущего положения дел на рынке общественного питания и определение тенденций для успешного вложения в открытие кафе. Создание презентации. Python, Pandas, Matplotlib, Seaborn, Plotly, Datetime, Requests, BytesIO, визуализация данных, создание презентации * сборный проект по пройденым темам
11 Исследование поведения пользователей мобильного приложения Стартап, который продаёт продукты питания, планирует разобраться в поведении пользователей мобильного приложения. Анализ данных по логам пользователей, оценка результатов А/А и А/В тестов, воронка событий Python, Pandas, Matplotlib, Seaborn, Plotly, Datetime, Math, NumPy, событийная аналитика, продуктовые метрики, проверка статистических гипотез, визуализация данных * как рассказать историю с помощью данных (углубление в seaborn, plotly, визуализация в геоаналитике - библиотека folium)
12 Анализ пользовательского взаимодействия с карточками статей в Яндекс.Дзен Анализ взаимодействия пользователей с карточками Яндекс.Дзен и построение дашборда на основании полученного технического задания: Импорт данных из SQL посредством Python и выгрузка в csv-формат для работы в Tableau Python, Pandas, SQLAlchemy, PostrgeSQL, Tableau, продуктовые метрики, построение дашбордов, создание презентации * Tableau (визуализация данных)
13 Поиск определяющих критериев эффективности опраторов контакных центрах. 1 часть выпускного проекта На основании данных о операторах контакных центров необходимо выделить критерии, по которым можно определить эффективного оператора Python, Pandas, requests, numpy, scipy, seaborn, matplotlib, plotly, cufflinks, визуализация данных, проверка статистических гипотез, построение дашбордов, создание презентации * Выпускной проект
14 Оценка результатов A/B-теста. 2 часть выпускного проекта Проверка корректности проведения А/Б теста и его оценка на основании датасета с действиями пользователей, технического задания вспомогательных датасетов Python, Pandas, Datetime, Matplotlib, Seaborn, Plotly, SciPy, NumPy, Math, визуализация данных, проверка статистических гипотез, воронка событий * Выпускной проект
15 SQL-запросы к базе данных сервиса по продаже книг. 3 часть выпускного проекта Анализ данных для формирования ценностного предложения для нового продукта: запросы к базе данных SQL с помощью Python Python, Pandas, SQLAlchemy, PostgreSQL * Выпускной проект

About

Проекты расположены по степени освоения новых навыков (1 - проект начало обучения, последний проект оконачание обучения).

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published