Este projeto realiza análise e agrupamento de dados utilizando o algoritmo K-Means, focado no reconhecimento de padrões em dados de sensores.
Dataset: Human Activity Recognition Using Smartphones
Grupo: 21
- Pandas: Manipulação de dados e leitura de arquivos.
- NumPy: Operações matemáticas e manipulação de arrays.
- Scikit-learn: Implementação do K-Means, redução de dimensionalidade (PCA) e avaliação com Silhouette Score.
- Matplotlib e Seaborn: Visualização de gráficos 2D e 3D.
- Análise Exploratória: Exploração das distribuições e padrões nos dados.
- Pré-processamento: Normalização com
StandardScalere redução de dimensionalidade com PCA. - Agrupamento: Implementação do K-Means com inicialização K-means++.
- Otimização: Determinação do número ideal de clusters com Elbow Method e Silhouette Score.
- Visualização: Representação dos clusters em gráficos 2D e 3D para análise.
Clusters foram gerados com base nos dados dos sensores, permitindo a interpretação de diferentes padrões de atividades, suportados por métricas de avaliação.
- Exploração de algoritmos alternativos de agrupamento.
- Integração com modelos supervisionados para validação dos clusters.