Skip to content

Neste notebook, realizamos uma análise completa de um dataset de produtos agrícolas com o objetivo de entender as condições ideais para o cultivo de diferentes safras e desenvolver modelos preditivos para classificar a cultura com base nessas condições.

License

Notifications You must be signed in to change notification settings

henriquesilvadev/ml-irrigation

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

FIAP - Faculdade de Informática e Administração Paulista

FIAP - Faculdade de Informática e Admnistração Paulista


ML - Análise e Modelagem Preditiva de Produtos Agrícolas

Descrição Geral do Projeto

Neste notebook, realizamos uma análise completa de um dataset de produtos agrícolas com o objetivo de entender as condições ideais para o cultivo de diferentes safras e desenvolver modelos preditivos para classificar a cultura com base nessas condições. As principais etapas realizadas foram:

Carga e Inspeção dos Dados: Iniciamos carregando o dataset produtos_agricolas.csv e realizando uma inspeção inicial para entender a estrutura dos dados, tipos de variáveis e identificar a presença de valores faltantes.

Limpeza dos Dados: Para lidar com os valores faltantes identificados, optamos por preencher os dados ausentes em cada coluna numérica com a média da respectiva coluna.

Análise Exploratória de Dados (EDA): Realizamos uma análise exploratória aprofundada com a criação de diversos gráficos, incluindo:

Histogramas para visualizar a distribuição de cada feature numérica. Um gráfico de contagem para verificar a distribuição das diferentes culturas ('label'). Um pairplot para explorar as relações entre todas as features numéricas, diferenciando por cultura. Gráficos de violino para visualizar a distribuição das features numéricas para cada cultura. Boxplots para identificar outliers e a distribuição das features numéricas por cultura. Uma matriz de correlação para entender a relação entre as features numéricas. Identificação das Condições Ideais para as Culturas: Agrupamos os dados por cultura ('label') e calculamos estatísticas descritivas (média, mediana, desvio padrão, etc.) para as features numéricas. Isso nos permitiu ter uma ideia do "perfil ideal" de solo e clima associado a cada cultura presente no dataset.

Preparação dos Dados para Modelagem: Preparamos os dados para o treinamento dos modelos preditivos. Esta etapa incluiu:

Separar as features (variáveis independentes) da variável alvo ('label'). Codificar a variável alvo categórica ('label') em valores numéricos usando LabelEncoder. Dividir o dataset em conjuntos de treinamento e teste para avaliar o desempenho dos modelos em dados não vistos. Normalizar as features numéricas usando MinMaxScaler para garantir que todas as features tenham a mesma escala, o que é importante para o desempenho de alguns algoritmos. Desenvolvimento e Avaliação de Modelos Preditivos: Treinamos 5 modelos de classificação diferentes para prever a cultura com base nas features de solo e clima:

K-Nearest Neighbors Regressão Logística Support Vector Machine Decision Tree Random Forest Para cada modelo, calculamos a acurácia e geramos um relatório de classificação para avaliar métricas como precisão, recall e F1-score.

Avaliação Comparativa dos Modelos: Comparamos o desempenho dos 5 modelos treinados. Apresentamos as acurácias de cada modelo e visualizamos essa comparação em um gráfico de barras. Além disso, geramos as Curvas ROC (Macro-Average) para uma comparação visual mais aprofundada da capacidade de discriminação de cada modelo.

Com base na acurácia e nas Curvas ROC, o modelo Random Forest demonstrou ser o mais eficaz para a tarefa de classificação neste dataset.

Time

@agodoi @SabrinaOtoni @henriquehsilva @manoellaweiser-gif @JoaoMDPaiva @Luiz-Frederico @younmariana-create


📹 Demonstração em Vídeo

Link para o vídeo de demonstração: Ver VIDEO_LINK.txt

Licença

Este projeto está licenciado sob a Licença Creative Commons Atribuição 4.0 Internacional. Para mais detalhes, consulte o arquivo LICENSE.

About

Neste notebook, realizamos uma análise completa de um dataset de produtos agrícolas com o objetivo de entender as condições ideais para o cultivo de diferentes safras e desenvolver modelos preditivos para classificar a cultura com base nessas condições.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published