MedFusion

高度模块化的医学多模态深度学习研究框架，支持 29 种视觉骨干网络和 5 种融合策略。

✨ 核心特性

🔧 高度模块化: 骨干网络、融合策略、聚合器完全解耦
📊 多视图支持: 多角度 CT、时间序列、多模态、多切片等 5 种场景
🎯 配置驱动: 通过 YAML 配置文件快速切换组件，无需修改代码
🌐 Web UI: 实时训练监控、模型管理、工作流编辑器
⚡ Rust 加速: 性能关键模块使用 Rust 实现

🚀 快速开始

安装

# 克隆仓库
git clone https://github.com/yourusername/medfusion.git
cd medfusion

# 安装依赖（推荐使用 uv）
uv sync

# 安装开发依赖
uv sync --extra dev

# 安装 Web UI 依赖
uv sync --extra web

# 或使用 pip
pip install -e ".[dev,web]"

基础使用

# 训练模型
uv run med-train --config configs/default.yaml

# 评估模型
uv run med-evaluate --checkpoint outputs/best_model.pth

# 数据预处理
uv run med-preprocess --data-dir data/raw

启动 Web UI

# 使用启动脚本
./start-webui.sh

# 或手动启动
uv run python -m med_core.web.cli web

# 访问 http://localhost:8000

代码示例

使用模型构建器创建多模态模型：

from med_core.models import MultiModalModelBuilder

# 构建模型
builder = MultiModalModelBuilder(num_classes=2)
builder.add_modality("ct", backbone="swin3d_tiny", input_channels=1)
builder.add_modality("pathology", backbone="resnet50", pretrained=True)
builder.set_fusion("attention", hidden_dim=256)
builder.set_head("classification")
model = builder.build()

# 训练
outputs = model({"ct": ct_tensor, "pathology": path_tensor})

从配置文件构建模型：

from med_core.models import build_model_from_config
import yaml

with open("configs/smurf_config.yaml") as f:
    config = yaml.safe_load(f)

model = build_model_from_config(config)

📖 文档

🏗️ 架构

核心组件

MedFusion 采用高度模块化的设计，核心公式为：

Model = Backbones + Fusion + Head + (Optional) MIL Aggregators

组件说明：

Backbones (med_core/backbones/): 特征提取器
- 视觉：ResNet, EfficientNet, ViT, Swin Transformer (2D/3D), DenseNet 等 29+ 种
- 表格：MLP 网络，支持批归一化和 Dropout
Fusion (med_core/fusion/): 多模态融合策略
- 8 种融合方式：Concatenate, Gated, Attention, Cross-Attention, Bilinear, Kronecker, Fused-Attention, Self-Attention
Heads (med_core/heads/): 任务特定输出层
- 分类：ClassificationHead
- 生存分析：CoxSurvivalHead, DeepSurvivalHead, DiscreteTimeSurvivalHead
MIL Aggregators (med_core/aggregators/): 多实例学习聚合器
- Mean, Max, Attention-based, Gated Attention

目录结构

medfusion/
├── med_core/                    # 核心 Python 库
│   ├── models/                  # 模型架构（Builder, SMuRF）
│   ├── backbones/               # 骨干网络（Vision, Tabular）
│   ├── fusion/                  # 融合策略
│   ├── heads/                   # 任务头（分类、生存分析）
│   ├── aggregators/             # MIL 聚合器
│   ├── attention_supervision/   # 注意力监督
│   ├── datasets/                # 数据加载器
│   ├── trainers/                # 训练器（Multimodal, MultiView）
│   ├── evaluation/              # 评估指标和可视化
│   ├── preprocessing/           # 数据预处理
│   ├── utils/                   # 工具函数
│   ├── configs/                 # 配置验证
│   ├── web/                     # Web 服务（FastAPI）
│   └── cli/                     # 命令行接口
├── configs/                     # 配置模板
├── tests/                       # 测试套件
├── examples/                    # 使用示例
└── docs/                        # 文档

🧪 测试

# 运行所有测试
uv run pytest

# 运行特定测试文件
uv run pytest tests/test_models.py

# 运行特定测试函数
uv run pytest tests/test_models.py::test_model_builder

# 运行匹配模式的测试
uv run pytest -k "fusion"

# 生成覆盖率报告
uv run pytest --cov=med_core --cov-report=html

# 查看详细输出
uv run pytest -v

🔧 开发

代码质量检查

# 代码检查
ruff check med_core/

# 自动修复问题
ruff check med_core/ --fix

# 代码格式化
ruff format med_core/

# 类型检查
mypy med_core/

项目要求

Python 3.11+
PyTorch 2.0+
使用现代类型注解（PEP 585/604）
所有函数必须有完整的类型注解
遵循 88 字符行长度限制

详细开发指南请参考 CLAUDE.md。

⚡ 性能优化

优化优先级

遇到性能问题时，按以下顺序优化：

算法层面：混合精度训练、梯度累积、模型剪枝/量化
工程层面：数据缓存、预计算特征、优化 DataLoader
基础设施：更好的 GPU、分布式训练、NVMe SSD
部署优化：TorchScript、ONNX、TensorRT
自定义��核：Triton CUDA kernel、C++ 扩展

常见瓶颈解决方案

数据加载慢：增加 num_workers、使用数据缓存、更快的存储
GPU 利用率低：增大 batch size、优化 DataLoader、检查 CPU 预处理
显存不足：梯度累积、混合精度、减小 batch size
训练时间长：分布式训练、更好的 GPU、优化模型架构

注意：不建议过早迁移到 Rust。PyTorch 核心已经是 C++/CUDA 优化的，大部分性能瓶颈在 I/O 和 GPU 利用率，而非 Python 开销。详见 CLAUDE.md 的性能优化章节。

🤝 贡献

欢迎贡献！请查看贡献指南。

📄 许可证

本项目采用 MIT 许可证 - 详见 LICENSE 文件。

📮 联系方式

问题反馈: GitHub Issues
邮件: your.email@example.com

🙏 致谢

感谢所有贡献者和开源社区的支持。

Name		Name	Last commit message	Last commit date
Latest commit History 202 Commits
.github		.github
benchmarks		benchmarks
configs		configs
docs		docs
examples		examples
med_core		med_core
med_core_rs		med_core_rs
notebooks		notebooks
scripts		scripts
tests		tests
web		web
.dockerignore		.dockerignore
.editorconfig		.editorconfig
.gitignore		.gitignore
.nvmrc		.nvmrc
.pre-commit-config.yaml		.pre-commit-config.yaml
CHANGELOG.md		CHANGELOG.md
CLAUDE.md		CLAUDE.md
CONTRIBUTING.md		CONTRIBUTING.md
Dockerfile		Dockerfile
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
docker-compose.yml		docker-compose.yml
pyproject.toml		pyproject.toml
start-webui.sh		start-webui.sh
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

MedFusion

✨ 核心特性

🚀 快速开始

安装

基础使用

启动 Web UI

代码示例

📖 文档

🏗️ 架构

核心组件

目录结构

🧪 测试

🔧 开发

代码质量检查

项目要求

⚡ 性能优化

优化优先级

常见瓶颈解决方案

🤝 贡献

📄 许可证

📮 联系方式

🙏 致谢

About

Uh oh!

Releases

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

MedFusion

✨ 核心特性

🚀 快速开始

安装

基础使用

启动 Web UI

代码示例

📖 文档

🏗️ 架构

核心组件

目录结构

🧪 测试

🔧 开发

代码质量检查

项目要求

⚡ 性能优化

优化优先级

常见瓶颈解决方案

🤝 贡献

📄 许可证

📮 联系方式

🙏 致谢

About

Topics

Resources

License

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Contributors

Uh oh!

Languages