Flow Matching + DiT 实现

这个项目实现了Flow Matching (FM) 技术，用于图像生成任务。项目包含了DiT (Diffusion Transformer) 模型的实现，并在MNIST数据集上进行了训练和推理。

项目结构

train.py: 训练脚本，使用MNIST数据集训练模型
dit.py: DiT (Diffusion Transformer) 模型的实现
flowmatching.py: Flow Matching 技术的实现
infer.ipynb: 推理脚本，用于生成新图像
coupling.ipynb: 耦合数据集训练示例 (MNIST到FashionMNIST)
output.png: 训练结果示例图像
traj.png: 图像生成轨迹示例

技术细节

DiT (Diffusion Transformer) 模型

项目实现了DiT模型，包含以下主要组件：

DiTBlock: DiT的基本构建块，包含注意力机制和MLP
FinalLayer: 最终输出层
PatchEmbd: 图像块嵌入层
位置编码和时间编码函数

Flow Matching

Flow Matching技术通过学习从噪声到数据的向量场来生成图像。主要功能包括：

get_train_tuple: 生成训练数据对
sample_ode: 通过ODE求解器采样生成图像

使用方法

训练模型

python train.py --epochs 30 --batch_size 16 --lr 2e-4

训练脚本将使用MNIST数据集训练DiT模型，并将检查点保存在./checkpoints/目录中。

推理生成

使用infer.ipynb Jupyter笔记本进行推理，加载训练好的模型并生成新图像。

Loss

结果展示

依赖

PyTorch
torchvision
timm
tqdm
tensorboard

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Flow Matching + DiT 实现

项目结构

技术细节

DiT (Diffusion Transformer) 模型

Flow Matching

使用方法

训练模型

推理生成

Loss

结果展示

依赖

参考

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
.gitignore		.gitignore
README.md		README.md
dit.py		dit.py
flowmatching.py		flowmatching.py
infer.ipynb		infer.ipynb
loss.png		loss.png
output.png		output.png
train.py		train.py
traj.png		traj.png

Folders and files

Latest commit

History

Repository files navigation

Flow Matching + DiT 实现

项目结构

技术细节

DiT (Diffusion Transformer) 模型

Flow Matching

使用方法

训练模型

推理生成

Loss

结果展示

依赖

参考

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages