LUCIE-DS - Downscaling Project

A PyTorch-based research project for climate data super-resolution using diffusion models and Fourier Neural Operators (FNOs). LUCIE-DS implements DDPM for climate data downscaling and super-resolution, working with ERA5 climate datasets.

Overview

LUCIE-DS combines two powerful approaches for climate modeling:

Fourier Neural Operators (FNO): For initial super-resolution of climate variables
Denoising Diffusion Probabilistic Models (DDPM): For refinement

The project focuses on downscaling low-resolution climate data to high-resolution predictions for multiple atmospheric variables including temperature, precipitation, and wind components.

Features

Multi-variable climate modeling (temperature, precipitation, u-wind, v-wind)
Two-stage pipeline: FNO + Diffusion models
Distributed training on HPC systems with SLURM
Comprehensive diagnostic and visualization tools
YAML-based configuration system
Support for model retraining and ensemble generation

Repository Structure

LUCIE-DS/
├── src/
│   ├── models/          # Model architectures (FNO, U-Net, VAE, etc.)
│   ├── dataset/         # Dataset loaders for ERA5 and LUCIE-DS data
│   ├── tools/           # Training and sampling scripts
│   ├── config/          # YAML configuration files
│   ├── utils/           # Utility functions and helpers
│   ├── scheduler/       # Learning rate schedulers
│   ├── data_processing/ # Data concatenation and preprocessing
│   ├── diagnostics/     # Diagnostic and verification scripts
│   ├── computation/     # Statistics and climatology computation
│   ├── visualization/   # Visualization and comparison tools
│   └── tests/           # Test scripts
├── jobs/               # SLURM job scripts
│   ├── training/       # Training job scripts
│   ├── testing/        # Testing and sampling jobs
│   ├── concat/         # Data concatenation jobs
│   ├── retrain/        # Retraining jobs
│   ├── climatology/    # Climatology computation jobs
│   ├── diagnostics/    # Diagnostic jobs
│   └── fno/            # FNO-specific jobs
├── scripts/            # Shell scripts for job submission
├── docs/               # Documentation
└── outputs/            # Job output logs

Installation

Prerequisites

Python 3.8+
PyTorch 1.12+
CUDA 11.3+ (for GPU support)
Access to NCAR's Derecho HPC system (for full workflow)

Environment Setup

# Clone the repository
git clone https://github.com/moeindarman77/lucie.git
cd lucie

# Create conda environment
conda create -n lucie python=3.9
conda activate lucie

# Install dependencies
pip install -r src/requirements.txt

# Set Python path
export PYTHONPATH="${PYTHONPATH}:/path/to/lucie/src"

On NCAR Derecho

# Load required modules
module load conda
conda activate jax

# Set Python path
export PYTHONPATH="/glade/derecho/scratch/mdarman/lucie/src"

Quick Start

1. Training Models

Train Fourier Neural Operator (FNO)

cd src
python tools/train_fno_final.py --config config/ERA5_config_fno.yaml

Train Diffusion Model

python tools/train_ddpm_final_v2.py --config config/ERA5_config_final_v2.yaml

Using SLURM

# Submit training job
qsub jobs/training/job.slurm

# Submit array job for multiple experiments
qsub jobs/training/job_array.slurm

2. Sampling/Inference

# Sample from trained model
python tools/sample_ddpm_final_v2.py --config config/ERA5_config_final_v2.yaml

# Sample for 10-year LUCIE-DS evaluation
python tools/sample_ddpm_LUCIE-DS_10yr.py --config config/ERA5_config_LUCIE-DS_10yr.yaml

3. Data Processing

# Concatenate output files
./scripts/submit_all_concat_jobs.sh

# Compute climatology
qsub jobs/climatology/job_compute_climatology.slurm

Configuration

All experiments are configured via YAML files in src/config/. Key configuration files:

ERA5_config_final_v2.yaml - Main diffusion model configuration
ERA5_config_fno.yaml - FNO model configuration
ERA5_config_LUCIE-DS_10yr.yaml - 10-year sampling configuration
ERA5_config_normalized_fno.yaml - Normalized FNO setup

Key Configuration Parameters

dataset_params:
  data_path: "/path/to/data"
  normalization_stats: "/path/to/stats.npz"

fno_params:
  modes: 12
  width: 64

train_params:
  learning_rate: 0.0001
  batch_size: 8
  epochs: 100

diffusion_params:
  timesteps: 1000
  beta_schedule: "linear"

Model Pipeline

Two-Stage Training

Stage 1: FNO Training
- Train FNO for initial super-resolution
- Generates coarse high-resolution predictions
Stage 2: Diffusion Model Training
- Uses FNO outputs as conditioning
- Refines predictions with latent diffusion

Data Flow

Low-Res ERA5 → FNO → Coarse HR → Diffusion → Fine HR Predictions
     ↓                                ↓
Land-Sea Mask ────────────────────────┘

Diagnostic Tools

The project includes comprehensive diagnostic utilities:

# Verify concatenated files
python src/diagnostics/verify_concatenated_files.py

# Check FNO statistics
python src/diagnostics/verify_fno_stats.py

# Diagnose wind component issues
python src/diagnostics/diagnose_vwind.py

# Check sampling progress
python src/diagnostics/check_sampling_progress.py

Visualization

# Visualize normalized FNO samples
python src/visualization/visualize_normalized_fno_samples.py

# Compare FNO vs Diffusion outputs
python src/visualization/compare_fno_vs_diffusion.py

Documentation

Detailed documentation is available in the docs/ directory:

Scripts

Convenience scripts for common workflows:

# Auto-submit training jobs
./scripts/auto_submit_training.sh

# Submit all concatenation jobs
./scripts/submit_all_concat_jobs.sh

# Check climatology computation status
./scripts/check_climatology_status.sh

# Test normalized FNO stability
./scripts/test_normalized_fno_stability.sh

Data Requirements

ERA5 climate reanalysis data in HDF5 format
Normalization statistics files (.npz)
Land-sea mask files for conditioning
Organized by year and temporal resolution

Output Structure

Results are saved in results/ directory:

results/
├── checkpoints/       # Model checkpoints
├── samples/          # Generated samples
├── logs/             # Training logs
└── config.yaml       # Copy of configuration

Citation

If you use LUCIE-DS in your research, please cite:

@software{LUCIE-DS2025,
  title={LUCIE-DS: Learning with Unified Climate Intelligence Engine},
  author={Darman, Moein},
  year={2025},
  url={https://github.com/moeindarman77/LUCIE-DS}
}

License

[Add your license here]

Contact

For questions and support, please open an issue on GitHub or contact:

Moein Darman - GitHub

Name		Name	Last commit message	Last commit date
Latest commit History 76 Commits
docs		docs
jobs		jobs
scripts		scripts
src		src
.gitignore		.gitignore
LUCIE_clear.ipynb		LUCIE_clear.ipynb
README.md		README.md
dd.ipynb		dd.ipynb
lsm.npz		lsm.npz
requirements.txt		requirements.txt
stats_2000_2003_lr.npz		stats_2000_2003_lr.npz
stats_2000_2010_hr.npz		stats_2000_2010_hr.npz

Folders and files

Latest commit

History

Repository files navigation

LUCIE-DS - Downscaling Project

Overview

Features

Repository Structure

Installation

Prerequisites

Environment Setup

On NCAR Derecho

Quick Start

1. Training Models

Train Fourier Neural Operator (FNO)

Train Diffusion Model

Using SLURM

2. Sampling/Inference

3. Data Processing

Configuration

Key Configuration Parameters

Model Pipeline

Two-Stage Training

Data Flow

Diagnostic Tools

Visualization

Documentation

Scripts

Data Requirements

Output Structure

Citation

License

Contact

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages