이화여자대학교 2025-2 졸업프로젝트에서 수행한
MBP 팀의 의료 AI 벤치마크 연구 및 구현 코드입니다.
본 프로젝트는 병원 데이터를 외부로 공유하지 않고도 여러 기관이 함께 의료 AI 모델을 평가할 수 있는 연합 평가(Federated Evaluation) 기반 의료 인공지능 벤치마크 시스템을 구축하는 것을 목표로 합니다.
의료 데이터는 보안·윤리적 이유로 외부 반출이 제한되며, 국내 의료 환경에서는 데이터가 소규모·편향되어 있는 경우가 많습니다. 이로 인해 기존의 대규모 공개 데이터 기반 벤치마크는 실제 임상 환경을 충분히 반영하지 못하는 한계를 가집니다.
본 프로젝트는 이러한 문제를 해결하기 위해 인공 의료데이터(Synthetic Representation) 와
연합 평가 방식을 활용하여 현실적인 의료 AI 성능 평가 프레임워크를 제안합니다.
“데이터를 모을 수 없다면, 표현을 모은다.”
- 원본 의료 데이터는 병원 내부에 유지
- 모델 중간 레이어의 임베딩(latent feature)만 활용
- Manifold Mixup 기반 합성 표현(Synthetic Representation) 생성
- 병원별 로컬 평가 후, 성능 지표만 중앙에서 집계
이를 통해 대규모 데이터 없이도 신뢰 가능한 의료 AI 평가를 가능하게 합니다.
- 인공 의료데이터로 병원 데이터를 공유하지 않고도 함께 평가하는
의료 인공지능 평가 시스템 구축 - 한국 의료 환경에 특화된 멀티모달 AI 벤치마크 설계
- 연합 학습이 아닌 연합 평가(Federated Evaluation) 중심 구조
- 의료 데이터의 보안·IRB 제약을 고려한 현실 지향적 접근
- 한국 의료 환경에 적합한 의료 AI 벤치마크 제시
- 병원 간 일반화 성능을 공정하게 비교할 수 있는 평가 기준 마련
- 의료 AI의 실제 임상 도입 전 검증 단계 고도화
- 2025년 2학기 ~ 2026년 1학기
| 진행 단계 | 세부 일정 | 상태 |
|---|---|---|
| 주제 선정 | - | ✓ |
| 교수님 컨택 | - | ✓ |
| 교수님 면담 (1) | 2025.09.12 | ✓ |
| 교수님 면담 (2) | 2025.10.16 | ✓ |
| 교수님 면담 (3) | 2025.11.06 | ✓ |
| 교수님 면담 (4) | 2025.11.25 | ✓ |
| 교수님 면담 (5) | 2025.12.15 | ✓ |
- Federated Evaluation
- 병원 내부 폐쇄망에서 로컬 평가 수행
- 원본 데이터 외부 반출 없음
- Manifold Mixup
- 픽셀 공간이 아닌 latent space에서 feature-level mixup
- 의료 영상의 의미 및 라벨 정합성 보존
- Soft Label 기반 평가
- Mixup 비율을 연속적인 정답으로 활용
- 모델의 불확실성과 신뢰도 평가
- 김채영
- 정지현
GroundRule.md: 팀README.md: 프로젝트 개요 및 진행 현황Ideation.md: 프로젝트 문제정의, 핵심 아이디어, 설계 사상 정리docs/: 보고서 및 발표 자료src/: 실험 및 평가 코드