mBLIP/src/train.py at main · gregor-ge/mBLIP · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
import sys
from typing import List, Optional

import hydra
from omegaconf import DictConfig
from lightning.pytorch import (Callback, LightningDataModule, LightningModule,
                               Trainer, seed_everything)
from lightning.pytorch.loggers import Logger
from trident.utils.hydra import config_callbacks
from trident.utils.logging import get_logger

from src.utils.runner import finish, log_hyperparameters

log = get_logger(__name__)


def train(cfg: DictConfig) -> Optional[float]:
    """Contains training pipeline.
    Instantiates all PyTorch Lightning objects from config.

    Args:
        config (DictConfig): Configuration composed by Hydra.

    Returns:
        Optional[float]: Metric score for hyperparameter optimization.
    """

    if "config_callbacks" in cfg:
        log.info(
            f"Applying configuration callbacks for <{cfg.config_callbacks.keys()}>"
        )
        config_callbacks(cfg, cfg.config_callbacks)

    if "imports" in cfg:
        if isinstance(cfg.imports, str):
            cfg.imports = [cfg.imports]
        for path in cfg.imports:
            sys.path.insert(0, path)
            log.info(f"{path} added to PYTHONPATH")

    # Set seed for random number generators in pytorch, numpy and python.random
    if "seed" in cfg:
        seed_everything(cfg.seed, workers=True)
    # Init lightning datamodule
    log.info(f"Instantiating datamodule <{cfg.datamodule._target_}>")
    datamodule: LightningDataModule = hydra.utils.instantiate(cfg.datamodule)

    # Init lightning model
    log.info(f"Instantiating model <{cfg.module._target_}>")
    module: LightningModule = hydra.utils.instantiate(cfg.module)

    # Init lightning callbacks
    callbacks: List[Callback] = []
    if "callbacks" in cfg:
        for _, cb_conf in cfg.callbacks.items():
            if "_target_" in cb_conf:
                log.info(f"Instantiating callback <{cb_conf._target_}>")
                callbacks.append(hydra.utils.instantiate(cb_conf))

    # Init lightning loggers
    logger: List[Logger] = []
    if "logger" in cfg:
        for _, lg_conf in cfg.logger.items():
            if "_target_" in lg_conf:
                log.info(f"Instantiating logger <{lg_conf._target_}>")
                logger.append(hydra.utils.instantiate(lg_conf))

    # Init lightning trainer
    log.info(f"Instantiating trainer <{cfg.trainer._target_}>")
    trainer: Trainer = hydra.utils.instantiate(
        cfg.trainer, callbacks=callbacks, logger=logger, _convert_="partial"
    )

    # Send some parameters from config to all lightning loggers
    log_hyperparameters(
        cfg=cfg,
        module=module,
        datamodule=datamodule,
        trainer=trainer,
        callbacks=callbacks,
        logger=logger,
    )

    # Train the model
    if cfg.get("train", True):
        log.info("Starting training!")
        trainer.fit(model=module, datamodule=datamodule)

    score = None
    if optimized_metric := cfg.get("optimized_metric", None):
        score = trainer.callback_metrics[optimized_metric]

    # Evaluate model on test set, using the best model achieved during training
    if cfg.get("test_after_training") and not cfg.trainer.get("fast_dev_run"):
        log.info("Starting testing!")
        # TODO(fdschmidt93): clean up hack
        try:
            trainer.test(module, datamodule=datamodule, ckpt_path="best")
        except:
            trainer.test(module, datamodule=datamodule)

    # Make sure everything closed properly
    log.info("Finalizing!")
    finish(
        cfg=cfg,
        module=module,
        datamodule=datamodule,
        trainer=trainer,
        callbacks=callbacks,
        logger=logger,
    )

    # Print path to best checkpoint
    # TODO(fdschmidt93): cleanup hack
    try:
        log.info(
            f"Best checkpoint path:\n{trainer.checkpoint_callback.best_model_path}"
        )
    except:
        pass

    # Return metric score for hyperparameter optimization
    return score