[NeurIPS 2023] Lookaround Optimizer

This repository contains a PyTorch implementation of the Lookaround optimizer for DNNs from the paper Lookaround Optimizer: $k$ steps around, 1 step average.

Overview

TLDR: We propose Lookaround, a SGD-based optimizer that enjoys a diversity-in-locality exploration strategy. To seek flat minima within the loss basins, Lookaround iteratively averages the trained networks starting from one common checkpoint with various data augmentation.

Requirements

PyTorch 1.8 or higher
Python 3.6

Datasets

3 datasets were used in the paper:

CIFAR-10
CIFAR-100
ImageNet: Downloadable from https://image-net.org/download.php

Usage

Due to the use of various data augmentation techniques in our approach, our optimizer needs to be coupled with a dataloader that supports the different data augmentations.

Here is an example using three data augmentation methods:

from lookaround import Lookaround
optimizer = Lookaround(net.parameters(), lr=0.1, momentum=0.9, weight_decay=5e-4, head_num=3, frequence=5) # k=5

train_iter1 = iter(trainloaders[0])
train_iter2 = iter(trainloaders[1])
train_iter3 = iter(trainloaders[2])
for batch_idx in range(len(trainloaders[0])):
    for batch in [train_iter1, train_iter2, train_iter3]:
        inputs, targets = next(batch)
        inputs = inputs.to(device)
        targets = targets.to(device)
        optimizer.zero_grad()
        outputs = model(inputs)
        loss = loss_function(outputs, targets)
        loss.backward()
        optimizer.step()

In our code, the invocation of different optimization methods is as follows:

python train.py --yaml_path=<YAML_PATH> \
                --train_mode=<TRAIN_MODE> \
                --cuda_id=<CUDA_ID> \
                --data_dir=<DATASET> \
                --out=<OUTPUT> \
                --optimizer=<OPTIMIZER>

Parameters:

--yaml_path : config yaml path to train
--train_mode : optimization method ('TRAIN_LOOKAROUND' / 'TRAIN_SGD' / 'TRAIN_SWA' / 'TRAIN_LOOKAHEAD' / 'TRAIN_SWAD')
--cuda_id : cuda device id
--data_dir : dataset folder
--out : output folder
--optimizer : optimizer name ('Lookaround' / 'SGD' / 'Adam')

To run SGG or other optimization method use the following command:

python train.py --yaml_path='resnet50_cifar10.yaml' --train_mode='TRAIN_SGD' --cuda_id=0 --data_dir='dataset/' --out='./out/' --optimizer='SGD'

python train.py --yaml_path='resnet50_cifar10.yaml' --train_mode='TRAIN_SWA' --cuda_id=0 --data_dir='dataset/' --out='./out/' --optimizer='SGD'

python train.py --yaml_path='resnet50_cifar10.yaml' --train_mode='TRAIN_LOOKAHEAD' --cuda_id=0 --data_dir='dataset/' --out='./out/' --optimizer='SGD'

python train.py --yaml_path='resnet50_cifar10.yaml' --train_mode='TRAIN_SWAD' --cuda_id=0 --data_dir='dataset/' --out='./out/' --optimizer='SGD'

To run Lookaround training use the following command:

python train.py --yaml_path='resnet50_cifar10.yaml' --train_mode='TRAIN_LOOKAROUND' --cuda_id=0 --data_dir='dataset/' --out='./out/' --optimizer='Lookaround'

Citation

If you find this work useful for your research, please cite our paper:

@inproceedings{zhang2023Lookaround,
  title={Lookaround Optimizer: $k$ steps around, 1 step average},
  author={Jiangtao Zhang and Shunyu Liu and Jie Song and Tongtian Zhu and Zhengqi Xu and Mingli Song},
  booktitle={Advances in Neural Information Processing Systems},
  year={2023}
}

Contact

Please feel free to contact me via email (zhjgtao@zju.edu.cn) if you are interested in my research :)

Name		Name	Last commit message	Last commit date
Latest commit History 35 Commits
config		config
configs		configs
data		data
images		images
models		models
LICENSE		LICENSE
README.md		README.md
lookahead.py		lookahead.py
lookaround.py		lookaround.py
train.py		train.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

[NeurIPS 2023] Lookaround Optimizer

Overview

Requirements

Datasets

Usage

Citation

Contact

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 2

Uh oh!

Languages

License

Ardcy/Lookaround

Folders and files

Latest commit

History

Repository files navigation

[NeurIPS 2023] Lookaround Optimizer

Overview

Requirements

Datasets

Usage

Citation

Contact

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 2

Uh oh!

Languages

Packages