Данные проекты были выполнены в ходе обучения в Яндекс.Практикуме, профессии "Специалист по Data Science".
| Название проекта | Описание | Используемые библиотеки | Статус |
|---|---|---|---|
| Исследование данных сервиса “Яндекс.Музыка” — сравнение пользователей двух городов | С помощью библиотеки Pandas и её возможностей проверить данные и сравнить поведение и предпочтения пользователей двух столиц — Москвы и Санкт-Петербурга | Pandas | Завершён |
| Исследование надёжности заёмщиков — анализ банковских данных | На основе статистики о платёжеспособности клиентов исследовать влияет ли семейное положение и количество детей клиента на факт возврата кредита в срок | Pandas | Завершён |
| Продажа квартир в Санкт-Петербурге — анализ рынка недвижимости | Используя данные сервиса Яндекс.Недвижимость, определить рыночную стоимость объектов недвижимости и типичные параметры квартир | Pandas, Matplotlib, Seaborn | Завершён |
| Анализ сервиса аренды самокатов | Сервис аренды самокатов GoFast | Pandas, Matplotlib, NumPy, SciPy, Seaborn | Завершён |
| Выявление закономерностей, определяющих успешность игры | Анализ открытых данных, и поиск потенциально популярного продукта, что позволит компании заказчику спланировать рекламные кампании | Pandas, Matplotlib, NumPy, SciPy, Seaborn | Завершён |
| Прогнозные модели | Модель машинного обучения, которая поможет ему управлять рисками и принимать объективное решение о покупке | Pandas, Matplotlib, Scikit-learn | Завершён |
| Персонализация предложений | Персонализация предложений постоянным клиентам, чтобы увеличить их покупательскую активность | Pandas, Matplotlib, Scikit-learn | Завершён |
| Определение прибыльного региона для нефтедобывающей компании | Поиск прибыльного нефтедобывающего региона с помощью моделирования машинного обучения | Pandas, Numpy, Seaborn, Scikit-learn, Bootstrap | Завершён |
| Определение стоимости автомобиля | Разработка системы рекомендации стоимости автомобиля на основе его описания. Построить модель машинного обучения, используя модели Градиентного Бустинга для быстрого определения стоимости автомобиля | Pandas, Numpy, Scikit-learn, XGBoost, CatBoost, LightGBM, Matplotlib, Seaborn, Scipy | Завершён |
| Прогноз заказов такси на следующий час | Построение системы прогноза количества заказов такси на следующий час | Pandas, Numpy, Scikit-learn, XGBoost, CatBoost, LightGBM, Seaborn, Statsmodels | Завершён |
| Определение токсичных комментариев | Поиск токсичных комментариев и отправка их на модернизацию. Классификация комментариев на позитивные и негативные. | Pandas, Numpy, Seaborn, tf-idf, nltk, pipeline, LinearRegression, CatBoost, LightGBM | Завершён |
| Прогнозирование оттока клиентов телеком | Построить модель, которая предсказывает, уйдёт ли пользователь. | pandas, matplotlib, seaborn, datetime, random, ProfileReport, phik, sklearn.metrics, lightgbm, catboost, RandomForestClassifier, LogisticRegression, Scikit-learn, Pipeline | Завершён |