robertvava · robertvava · Mar 22, 2026
diff --git a/configs/config.yaml b/configs/config.yaml
@@ -0,0 +1,9 @@
+defaults:
+  - data: things_eeg2
+  - model: eeg_encoder
+  - training: contrastive
+  - evaluation: metrics
+  - wandb: default
+  - _self_
+
+seed: 42
diff --git a/configs/data/things_eeg2.yaml b/configs/data/things_eeg2.yaml
@@ -0,0 +1,45 @@
+data_dir: ${oc.env:EEGVIX_DATA_DIR,eeg_dataset}
+preprocessed_dir: ${data.data_dir}/preprocessed
+
+n_subjects: 10
+n_channels: 17
+n_timepoints: 100
+sampling_rate: 100  # Hz (downsampled from 1000)
+time_start: -0.2  # seconds relative to stimulus onset
+time_end: 0.8
+
+n_train_images: 16540
+n_test_images: 200
+n_train_reps: 4
+n_test_reps: 80
+images_per_concept: 10
+
+# Channels: occipital and parietal
+channels:
+  - O1
+  - Oz
+  - O2
+  - PO7
+  - PO3
+  - POz
+  - PO4
+  - PO8
+  - P7
+  - P5
+  - P3
+  - P1
+  - Pz
+  - P2
+  - P4
+  - P6
+  - P8
+
+# Data loading
+batch_size: 256
+num_workers: 4
+average_repetitions: true
+val_n_concepts: 150
+val_random_state: 42
+
+# Precomputed embeddings
+clip_embeddings_dir: ${data.data_dir}/clip_embeddings
diff --git a/configs/evaluation/metrics.yaml b/configs/evaluation/metrics.yaml
@@ -0,0 +1,12 @@
+retrieval:
+  top_k: [1, 5, 10, 50, 200]
+
+zero_shot:
+  n_test_images: ${data.n_test_images}
+  n_test_reps: ${data.n_test_reps}
+
+generation:
+  compute_fid: true
+  compute_ssim: true
+  compute_lpips: true
+  n_generated_per_condition: 5
diff --git a/configs/experiment/debug.yaml b/configs/experiment/debug.yaml
@@ -0,0 +1,22 @@
+# @package _global_
+
+defaults:
+  - /data: things_eeg2
+  - /model: eeg_encoder
+  - /training: contrastive
+  - /evaluation: metrics
+  - /wandb: default
+
+seed: 42
+
+data:
+  batch_size: 16
+  num_workers: 0
+  n_subjects: 1
+
+training:
+  max_epochs: 5
+  early_stopping_patience: 3
+
+wandb:
+  mode: disabled
diff --git a/configs/experiment/default.yaml b/configs/experiment/default.yaml
@@ -0,0 +1,10 @@
+# @package _global_
+
+defaults:
+  - /data: things_eeg2
+  - /model: eeg_encoder
+  - /training: contrastive
+  - /evaluation: metrics
+  - /wandb: default
+
+seed: 42
diff --git a/configs/model/eeg_encoder.yaml b/configs/model/eeg_encoder.yaml
@@ -0,0 +1,26 @@
+# Spatiotemporal Transformer EEG Encoder
+eeg_encoder:
+  n_channels: ${data.n_channels}
+  n_timepoints: ${data.n_timepoints}
+  embed_dim: 512
+  num_temporal_conv_layers: 3
+  temporal_kernel_sizes: [7, 5, 3]
+  n_spatial_heads: 4
+  n_temporal_transformer_layers: 4
+  n_temporal_heads: 8
+  dropout: 0.1
+  use_frequency_branch: true
+  output_dim: 768  # CLIP ViT-L/14 embedding dimension
+
+subject_embedding:
+  n_subjects: ${data.n_subjects}
+  embed_dim: ${model.eeg_encoder.embed_dim}
+
+projection_head:
+  input_dim: ${model.eeg_encoder.output_dim}
+  hidden_dim: 2048
+  output_dim: 768
+
+clip:
+  model_name: ViT-L-14
+  pretrained: openai
diff --git a/configs/training/contrastive.yaml b/configs/training/contrastive.yaml
@@ -0,0 +1,21 @@
+learning_rate: 3e-4
+weight_decay: 0.01
+warmup_epochs: 10
+max_epochs: 200
+early_stopping_patience: 20
+
+optimizer: adamw
+scheduler: cosine_warmup
+
+# InfoNCE loss
+init_temperature: 0.07
+learnable_temperature: true
+
+# Trainer
+precision: 16-mixed
+gradient_clip_val: 1.0
+accumulate_grad_batches: 1
+check_val_every_n_epoch: 1
+
+# Subject embedding warmup
+subject_embedding_warmup_epochs: 5
diff --git a/configs/training/diffusion_finetune.yaml b/configs/training/diffusion_finetune.yaml
@@ -0,0 +1,18 @@
+learning_rate: 1e-5
+weight_decay: 0.01
+max_epochs: 50
+
+# Stable Diffusion
+sd_model: stabilityai/stable-diffusion-2-1
+use_ip_adapter: true
+use_lora: true
+lora_rank: 16
+lora_alpha: 32
+
+# Generation
+num_inference_steps: 50
+guidance_scale: 7.5
+image_resolution: 512
+
+precision: 16-mixed
+gradient_clip_val: 1.0
diff --git a/configs/wandb/default.yaml b/configs/wandb/default.yaml
@@ -0,0 +1,4 @@
+project: eegvix-v2
+entity: null
+tags: []
+mode: online  # online, offline, disabled
diff --git a/src/config.py → legacy/config.py b/src/config.py → legacy/config.py
diff --git a/src/data/images/.gitkeep → legacy/data/images/.gitkeep b/src/data/images/.gitkeep → legacy/data/images/.gitkeep
diff --git a/src/dataloading_utils/main_load.py → legacy/dataloading_utils/main_load.py b/src/dataloading_utils/main_load.py → legacy/dataloading_utils/main_load.py
diff --git a/src/dataloading_utils/misc_load.py → legacy/dataloading_utils/misc_load.py b/src/dataloading_utils/misc_load.py → legacy/dataloading_utils/misc_load.py
diff --git a/src/main.py → legacy/main.py b/src/main.py → legacy/main.py
diff --git a/src/misc_utils.py → legacy/misc_utils.py b/src/misc_utils.py → legacy/misc_utils.py
diff --git a/src/models/VAE/vae.py → legacy/models/VAE/vae.py b/src/models/VAE/vae.py → legacy/models/VAE/vae.py
diff --git a/src/models/alignment/alignment_model.py → legacy/models/alignment/alignment_model.py b/src/models/alignment/alignment_model.py → legacy/models/alignment/alignment_model.py
diff --git a/src/models/autoencoders/eeg_ae.py → legacy/models/autoencoders/eeg_ae.py b/src/models/autoencoders/eeg_ae.py → legacy/models/autoencoders/eeg_ae.py
diff --git a/src/models/autoencoders/img_ae.py → legacy/models/autoencoders/img_ae.py b/src/models/autoencoders/img_ae.py → legacy/models/autoencoders/img_ae.py
diff --git a/src/models/commons/Decoder.py → legacy/models/commons/Decoder.py b/src/models/commons/Decoder.py → legacy/models/commons/Decoder.py
diff --git a/src/models/commons/Encoder.py → legacy/models/commons/Encoder.py b/src/models/commons/Encoder.py → legacy/models/commons/Encoder.py
diff --git a/src/models/diff/diffusion.py → legacy/models/diff/diffusion.py b/src/models/diff/diffusion.py → legacy/models/diff/diffusion.py
diff --git a/src/models/joint_model/joint_model.py → legacy/models/joint_model/joint_model.py b/src/models/joint_model/joint_model.py → legacy/models/joint_model/joint_model.py
diff --git a/src/models/no_gen/logreg.py → legacy/models/no_gen/logreg.py b/src/models/no_gen/logreg.py → legacy/models/no_gen/logreg.py
diff --git a/src/processing/eeg/pre/__init__.py → legacy/processing/eeg/pre/__init__.py b/src/processing/eeg/pre/__init__.py → legacy/processing/eeg/pre/__init__.py
diff --git a/src/processing/eeg/pre/fft.py → legacy/processing/eeg/pre/fft.py b/src/processing/eeg/pre/fft.py → legacy/processing/eeg/pre/fft.py
diff --git a/src/processing/eeg/pre/gaf.py → legacy/processing/eeg/pre/gaf.py b/src/processing/eeg/pre/gaf.py → legacy/processing/eeg/pre/gaf.py
diff --git a/src/processing/img/post/denorm.py → legacy/processing/img/post/denorm.py b/src/processing/img/post/denorm.py → legacy/processing/img/post/denorm.py
diff --git a/src/processing/img/pre/transf.py → legacy/processing/img/pre/transf.py b/src/processing/img/pre/transf.py → legacy/processing/img/pre/transf.py
diff --git a/src/run_pipeline.py → legacy/run_pipeline.py b/src/run_pipeline.py → legacy/run_pipeline.py
diff --git a/src/setup.py → legacy/setup.py b/src/setup.py → legacy/setup.py
diff --git a/...ned_models/best_aligned_eeg_encoder128.pt → ...ned_models/best_aligned_eeg_encoder128.pt b/...ned_models/best_aligned_eeg_encoder128.pt → ...ned_models/best_aligned_eeg_encoder128.pt
diff --git a/...ned_models/best_aligned_eeg_encoder256.pt → ...ned_models/best_aligned_eeg_encoder256.pt b/...ned_models/best_aligned_eeg_encoder256.pt → ...ned_models/best_aligned_eeg_encoder256.pt
diff --git a/...ined_models/best_aligned_eeg_encoder32.pt → ...ined_models/best_aligned_eeg_encoder32.pt b/...ined_models/best_aligned_eeg_encoder32.pt → ...ined_models/best_aligned_eeg_encoder32.pt
diff --git a/...ned_models/best_aligned_eeg_encoder512.pt → ...ned_models/best_aligned_eeg_encoder512.pt b/...ned_models/best_aligned_eeg_encoder512.pt → ...ned_models/best_aligned_eeg_encoder512.pt
diff --git a/...ined_models/best_aligned_eeg_encoder64.pt → ...ined_models/best_aligned_eeg_encoder64.pt b/...ined_models/best_aligned_eeg_encoder64.pt → ...ined_models/best_aligned_eeg_encoder64.pt
diff --git a/...d_models/best_aligned_image_encoder128.pt → ...d_models/best_aligned_image_encoder128.pt b/...d_models/best_aligned_image_encoder128.pt → ...d_models/best_aligned_image_encoder128.pt
diff --git a/...d_models/best_aligned_image_encoder256.pt → ...d_models/best_aligned_image_encoder256.pt b/...d_models/best_aligned_image_encoder256.pt → ...d_models/best_aligned_image_encoder256.pt
diff --git a/...ed_models/best_aligned_image_encoder32.pt → ...ed_models/best_aligned_image_encoder32.pt b/...ed_models/best_aligned_image_encoder32.pt → ...ed_models/best_aligned_image_encoder32.pt
diff --git a/...d_models/best_aligned_image_encoder512.pt → ...d_models/best_aligned_image_encoder512.pt b/...d_models/best_aligned_image_encoder512.pt → ...d_models/best_aligned_image_encoder512.pt
diff --git a/...ed_models/best_aligned_image_encoder64.pt → ...ed_models/best_aligned_image_encoder64.pt b/...ed_models/best_aligned_image_encoder64.pt → ...ed_models/best_aligned_image_encoder64.pt
diff --git a/src/trainers/alignment_trainer.py → legacy/trainers/alignment_trainer.py b/src/trainers/alignment_trainer.py → legacy/trainers/alignment_trainer.py
diff --git a/src/trainers/eeg_ae_trainer.py → legacy/trainers/eeg_ae_trainer.py b/src/trainers/eeg_ae_trainer.py → legacy/trainers/eeg_ae_trainer.py
diff --git a/src/trainers/img_ae_trainer.py → legacy/trainers/img_ae_trainer.py b/src/trainers/img_ae_trainer.py → legacy/trainers/img_ae_trainer.py
diff --git a/src/trainers/joint_trainer.py → legacy/trainers/joint_trainer.py b/src/trainers/joint_trainer.py → legacy/trainers/joint_trainer.py
diff --git a/src/trainers/reg_trainer.py → legacy/trainers/reg_trainer.py b/src/trainers/reg_trainer.py → legacy/trainers/reg_trainer.py
diff --git a/pyproject.toml b/pyproject.toml
@@ -0,0 +1,51 @@
+[build-system]
+requires = ["setuptools>=68.0", "wheel"]
+build-backend = "setuptools.build_meta"
+
+[project]
+name = "eegvix"
+version = "2.0.0"
+description = "EEG-to-Image generation via CLIP-aligned contrastive learning and diffusion models."
+requires-python = ">=3.10"
+license = {text = "MIT"}
+authors = [{name = "Robert Vava", email = "vavarobert10@gmail.com"}]
+
+dependencies = [
+    "torch>=2.1",
+    "torchvision>=0.16",
+    "lightning>=2.1",
+    "open-clip-torch>=2.24",
+    "diffusers>=0.25",
+    "transformers>=4.36",
+    "peft>=0.7",
+    "hydra-core>=1.3",
+    "omegaconf>=2.3",
+    "wandb>=0.16",
+    "numpy>=1.24",
+    "scipy>=1.11",
+    "scikit-learn>=1.3",
+    "pillow>=10.0",
+    "torchmetrics>=1.2",
+    "lpips>=0.1.4",
+    "tqdm>=4.66",
+    "einops>=0.7",
+    "matplotlib>=3.8",
+]
+
+[project.optional-dependencies]
+dev = [
+    "pytest>=7.4",
+    "pytest-cov>=4.1",
+    "ruff>=0.1",
+    "mypy>=1.7",
+]
+
+[tool.setuptools.packages.find]
+where = ["src"]
+
+[tool.ruff]
+line-length = 120
+target-version = "py310"
+
+[tool.pytest.ini_options]
+testpaths = ["tests"]
diff --git a/src/eegvix/__init__.py b/src/eegvix/__init__.py
@@ -0,0 +1,3 @@
+"""EEGVIX: EEG-to-Image generation via CLIP-aligned contrastive learning and diffusion models."""
+
+__version__ = "2.0.0"
diff --git a/src/eegvix/data/__init__.py b/src/eegvix/data/__init__.py
@@ -0,0 +1,4 @@
+from eegvix.data.dataset import ThingsEEG2Dataset
+from eegvix.data.datamodule import ThingsEEG2DataModule
+
+__all__ = ["ThingsEEG2Dataset", "ThingsEEG2DataModule"]
diff --git a/src/eegvix/data/channel_info.py b/src/eegvix/data/channel_info.py
@@ -0,0 +1,45 @@
+"""Electrode positions for the 17 occipital/parietal channels used in THINGS-EEG2.
+
+2D positions are approximate projections onto a unit circle (top-down view of scalp).
+Coordinates follow the standard 10-10 system layout used in the dataset.
+"""
+
+import torch
+
+# Channel names in the order they appear in the preprocessed data
+CHANNEL_NAMES: list[str] = [
+    "O1", "Oz", "O2",
+    "PO7", "PO3", "POz", "PO4", "PO8",
+    "P7", "P5", "P3", "P1", "Pz", "P2", "P4", "P6", "P8",
+]
+
+# Approximate 2D scalp positions (x, y) in normalized coordinates [-1, 1].
+# x: left(-) to right(+), y: posterior(-) to anterior(+)
+# These follow the standard 10-10 montage layout.
+CHANNEL_POSITIONS_2D: dict[str, tuple[float, float]] = {
+    "O1":  (-0.31, -0.95),
+    "Oz":  ( 0.00, -1.00),
+    "O2":  ( 0.31, -0.95),
+    "PO7": (-0.59, -0.81),
+    "PO3": (-0.31, -0.81),
+    "POz": ( 0.00, -0.81),
+    "PO4": ( 0.31, -0.81),
+    "PO8": ( 0.59, -0.81),
+    "P7":  (-0.81, -0.59),
+    "P5":  (-0.59, -0.59),
+    "P3":  (-0.39, -0.59),
+    "P1":  (-0.19, -0.59),
+    "Pz":  ( 0.00, -0.59),
+    "P2":  ( 0.19, -0.59),
+    "P4":  ( 0.39, -0.59),
+    "P6":  ( 0.59, -0.59),
+    "P8":  ( 0.81, -0.59),
+}
+
+N_CHANNELS = len(CHANNEL_NAMES)
+
+
+def get_channel_positions_tensor() -> torch.Tensor:
+    """Return channel positions as a (17, 2) float tensor, ordered by CHANNEL_NAMES."""
+    positions = [CHANNEL_POSITIONS_2D[ch] for ch in CHANNEL_NAMES]
+    return torch.tensor(positions, dtype=torch.float32)
Original file line number	Diff line number	Diff line change
		@@ -0,0 +1,3 @@
		"""EEGVIX: EEG-to-Image generation via CLIP-aligned contrastive learning and diffusion models."""

		__version__ = "2.0.0"