EPICODE Capstone

Il progetto ha lo scopo di esplorare e confrontare diverse soluzioni di machine learning applicate alla classificazione di dati tabulari. In particolare, l'analisi si concentra sulla capacità dei modelli di distinguere tre classi di oggetti astronomici: Galassie, Quasar e Stelle, utilizzando i dati del catalogo SDSS (Sloan Digital Sky Survey).

Obiettivi

Addestrare e valutare le prestazioni predittive dei modelli.
Stimare i costi per l’addestramento dei modelli sul servizio cloud computing Azure Machine Learning.

L'addestramento iniziale viene eseguito su un computer personale con specifiche hardware riportate alla fine.

Tecnologie

SQL per l'estrazione dei dati del database SDSS.
Python JupyterLab, strumento principale utilizzato per la manipolazione, esplorazione dei dati e per l'addestramento e la valutazione dei modelli.
Power BI per la visualizzazione interattiva dei risultati e la previsione costi di Azure ML.

Modelli Scelti

Per svolgere questo task sono stati scelti due modelli di machine learning, Random Forest e XGBoost, e due modelli di deep learning, Multilayer Perceptron e Tabular Transformer. Ognuno di essi è stato valutato in base al numero di oggetti correttamente identificati per ciascuna classe e alle metriche di classificazione F1 Score e Balanced Accuracy.

Hardware utilizzato

CPU: Intel Core i7-12700K
GPU: NVIDIA RTX 3060 12GB GDDR6
RAM: 32GB DDR5

Anteprima del Report in Power BI

Fonte Dati

Questo progetto utilizza dati provenienti dallo Sloan Digital Sky Survey (SDSS), release DR17.
Per maggiori informazioni sulle politiche di utilizzo dei dati, visitare il sito ufficiale: https://www.sdss.org/collaboration/citing-sdss/

Abdurro'uf et al. (2022), The 17th Data Release of the Sloan Digital Sky Surveys: Complete Release of MaNGA, MaStar, and APOGEE-2 Data, The Astrophysical Journal Supplement Series, 259(2), 35.
DOI: 10.3847/1538-4365/ac4414

Link al dataset ~ 700MB

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
Modelli Pytorch		Modelli Pytorch
Tabelle		Tabelle
Analisi Modelli ML.pbix		Analisi Modelli ML.pbix
LICENSE		LICENSE
README.md		README.md
SDSS Classifier.ipynb		SDSS Classifier.ipynb
openhwmonitor.py		openhwmonitor.py
sciservercom.py		sciservercom.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

EPICODE Capstone

Obiettivi

Tecnologie

Modelli Scelti

Hardware utilizzato

Anteprima del Report in Power BI

Fonte Dati

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

EPICODE Capstone

Obiettivi

Tecnologie

Modelli Scelti

Hardware utilizzato

Anteprima del Report in Power BI

Fonte Dati

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages