Этот проект демонстрирует мои навыки работы с данными на примере анализа поездок на велосипедах в Лондоне.
Цели проекта:
- Извлечение данных из открытого набора данных Kaggle — London Bike Sharing Dataset.
- Преобразование: очистка, переименование столбцов, декодирование погодных и сезонных значений с помощью Python/Pandas.
- Визуализация: создание интерактивного дашборда в Tableau.
Стек: Python, Pandas, openpyxl, Tableau, UV (управление зависимостями)
Tableau:
- 5 визуализаций
- Скользящее среднее
- Тепловая карта
- Разделение поездок по погоде и времени суток
- Set actions
- Пользовательские параметры
- Фильтр по временной шкале
Data Engineering:
- Интерактивный дашборд
- Переименование столбцов для лучшей читаемости
- Маппинг числовых значений на текстовые (погода, сезон и др.)
- Использование UV для управления зависимостями
-
Клонируйте репозиторий:
git clone https://github.com/your-username/London-Bike-Sharing-Tableau.git cd London-Bike-Sharing-Tableau -
Установите uv:
pip install uv
-
Установите зависимости:
uv sync
-
Скачайте датасет с Kaggle (или используйте уже скачанный в репозитории):
- London Bike Sharing Dataset
- Поместите файл в папку
data/
-
Запустите обработку данных (опционально):
uv run python script/main.py
На выходе вы получите london_bikes_final.xlsx файл, обработанный Pandas и готовый к загрузке в Tableau.
- Мой итоговый дашборд в Tableau:
- Онлайн-версия которуя я опубликовал на Tableau Public: Публичный дашборд Tableau Public
LondonBikeRides/
├── data/
│ ├── london_bikes_final.xlsx
│ └── london_merged.csv
└── london-bike-sharing-dataset.zip
├── docs/
│ └── Dashboard.png
└── Heatmap.png
└── MovingAverage.png
└── Weather.png
├── script/
│ └── main.py
├── pyproject.toml
├── uv.lock
└── .gitignore



