DL_PET/main.py at main · s-shahpouri/DL_PET · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
"""
START FROM HERE!

The main maduale for executing a deep learning training pipeline for ASC AI model using MONAI and PyTorch.

It performs the following steps:
1. **Configuration Loading**: Reads and processes configuration parameters from a JSON file.
2. **Data Handling**: Manages and splits medical image data into training, validation, and test sets.
3. **DataLoader Preparation**: Initializes DataLoaders for training, validation, and testing using MONAI's transforms and utilities.
4. **Model Initialization**: Loads and configures a deep learning model based on the specified architecture (e.g., DynUNet, SegResNet).
5. **Training Setup**: Prepares the optimizer, loss function, and learning rate scheduler.
6. **Training Loop**: Trains the model, logs progress, and saves the best-performing model based on validation metrics.

Author: Sama Shahpouri
Last Edit: 25-08-2024
"""


import json
from src.data_preparation import DataHandling, LoaderFactory
from src.model_training import ModelTrainer, DecayLR
import torch
from src.utils import Config
from src.model_manager import ModelLoader
from torchsummary import summary

def main():
    config_file = 'src/config.json'
    config = Config(config_file)

    # Confirm device setting
    print(f"Configured device: {config.device}")


    data_handler = DataHandling(
        config.ga_data_dir,
        train_mode=config.train_mode,
        target_mode=config.target_mode,
        external_centers=config.external_centers,
        train_percent=config.train_percent,
        val_percent=config.val_percent,
        test_percent=config.test_percent
        )


    train_files = data_handler.get_data_split('train')
    val_files = data_handler.get_data_split('val')
    test_files = data_handler.get_data_split('test')


    loader_factory = LoaderFactory(
        train_files=train_files,
        val_files=val_files,
        test_files=test_files,
        patch_size=config.patch_size,
        spacing=config.spacing,
        spatial_size=config.spatial_size,
        normalize=config.normalize
        )


    # Get the DataLoader for each dataset type
    train_loader = loader_factory.get_loader('train', batch_size=config.batch_size['train'], num_workers=config.num_workers['train'], shuffle=True)
    val_loader = loader_factory.get_loader('val', batch_size=config.batch_size['val'], num_workers=config.num_workers['val'], shuffle=False)
    test_loader = loader_factory.get_loader('test', batch_size=config.batch_size['test'], num_workers=config.num_workers['test'], shuffle=False)


    model_loader = ModelLoader(config)
    model = model_loader.call_model()
    print(model)
    print(f"Model loaded and moved to device: {config.device}")
    summary(model, input_size=(config.in_channels, *config.patch_size))


    loss_function = torch.nn.MSELoss()
    optimizer = torch.optim.Adam(model.parameters(), lr=config.learning_rate, betas=(0.5, 0.999), weight_decay=config.l2_lambda)
    best_metric = float('inf')
    best_metric_epoch = -1
    epoch_loss_values = []
    metric_values = []
    train_losses = []
    val_losses = []

    # Define scheduler
    lr_lambda = DecayLR(epochs=config.max_epochs, offset=0, decay_epochs=config.decay_epoch).step
    scheduler = torch.optim.lr_scheduler.LambdaLR(optimizer, lr_lambda=lr_lambda)

    # Train loop
    trainer = ModelTrainer(model, train_loader, val_loader, optimizer, loss_function, scheduler, config.max_epochs, config.log_dir, config.device, config)
    trainer.train()


if __name__ == "__main__":
    main()