ProjectBzarre

End-to-end space weather ML pipeline for data ingestion, preprocessing, label generation, model training, and probability calibration.

Repository layout

data_sources/: data download and collection scripts
database_builder/: raw data warehouse and table construction
preprocessing_pipeline/: feature engineering, aggregation, splits, normalization, labels, and final merge
modeling_pipeline/: training and evaluation scripts (multi-horizon)
modeling_pipeline_daily/: legacy daily modeling utilities and plots
probability_calibration/: calibration DB builder, regime-aware isotonic calibration, and plots
tests/: test suite

Typical workflow

Build or refresh raw data sources.
Run preprocessing pipelines per data source.
Merge final datasets into a unified SQLite DB.
Train models for horizons 1–8.
Build calibration DB and fit regime-aware calibrators.
Plot diagnostics as needed.

Key artifacts

preprocessing_pipeline/check_multicolinearity/all_preprocessed_sources.db: merged feature/label dataset
modeling_pipeline/output_h{X}/: per-horizon models and diagnostics
probability_calibration/validation_calibration.db: calibration dataset
probability_calibration/calibration_h{X}/: per-horizon isotonic calibrators + metadata

Running

Most scripts are executable as standalone Python files. Example:

/bin/python3 preprocessing_pipeline/check_multicolinearity/merge_features.py
/bin/python3 modeling_pipeline/train_model.py
/bin/python3 probability_calibration/build_calibration_db.py
/bin/python3 probability_calibration/regime_aware_calibration.py

Notes

Databases are SQLite and live under their respective pipeline directories.
Many stages rely on environment variables for split windows and aggregation cadence.
Horizon selection for training and calibration is handled by constants in the scripts.

Name		Name	Last commit message	Last commit date
Latest commit History 98 Commits
.github		.github
classification_pipeline		classification_pipeline
common		common
data_sources		data_sources
database_builder		database_builder
inference		inference
preprocessing_pipeline		preprocessing_pipeline
regression_pipeline		regression_pipeline
tests		tests
.gitignore		.gitignore
README.md		README.md
combined_predicted_dst_and_prob.png		combined_predicted_dst_and_prob.png
environment.yml		environment.yml
requirements.txt		requirements.txt
space_weather_api.py		space_weather_api.py
space_weather_warehouse.py		space_weather_warehouse.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ProjectBzarre

Repository layout

Typical workflow

Key artifacts

Running

Notes

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

harry353/ProjectBzarre

Folders and files

Latest commit

History

Repository files navigation

ProjectBzarre

Repository layout

Typical workflow

Key artifacts

Running

Notes

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages