Este repositório contém dois notebooks que realizam uma análise de regressão linear sobre a produção de laranjas em toneladas por área colhida (hectares) em 2014, utilizando dados obtidos diretamente de um bucket do Google Cloud Console.
-
main.ipynb– Notebook com implementação profissional da regressão linear usando bibliotecas como:pandasnumpy(polyfit)matplotlib
-
raw_main.ipynb– Notebook com abordagem educacional/manual:- Sem uso de
numpy - Apenas
pandase lógica de regressão linear codificada "na unha"
- Sem uso de
Demonstrar:
- Como extrair e manipular dados de uma fonte externa (Google Cloud Bucket)
- Como aplicar regressão linear para entender a relação entre área colhida e quantidade produzida
- Diferenças entre uma abordagem matemática manual e outra com uso de bibliotecas científicas
- Clone este repositório:
git clone https://github.com/seu-usuario/seu-repositorio.git
cd seu-repositorio- Crie e ative um ambiente virtual (opcional, mas recomendado):
python -m venv venv
source venv/bin/activate # ou venv\Scripts\activate no Windows- Instale as dependências:
pip install -r requirements.txt- Execute os notebooks em um ambiente Jupyter:
jupyter notebookpandas
numpy
matplotlibObs: A conexão com o bucket do Google Cloud exigie permissões e autenticação.
- Victor Antunes
- GitHub: @wdvictor
Sinta-se à vontade para contribuir, comentar ou sugerir melhorias!
