이 문서는 컴퓨터 지식이 많지 않은 사람도 쉽게 이해할 수 있도록, “Qwen3 + HiDream-I1 + Gemma 3 Vision” 조합으로 고품질 이미지를 만드는 과정을 아주 쉽게 풀어 설명합니다.
우리가 원하는 이미지를 말로 설명하면, 인공지능이 딱 맞는 그림을 만들어 주는 기술입니다. 그런데 그냥 한 번에 그리면 틀릴 수도 있으니, 생각, 스케치, 평가, 정식 그림의 단계를 거쳐 완벽하게 만들어주는 방식이에요.
"호수 옆에 평화로운 노을 풍경을 그리고 싶어요"
Qwen3는 똑똑한 언어 AI입니다. 이 말에서 핵심 정보를 뽑아냅니다:
- 장소: 호수
- 분위기: 평화로움
- 시간: 노을
이걸 AI가 잘 이해하도록 정리해줍니다. 마치 화가에게 "이런 느낌으로 그려주세요"라고 자세히 설명해주는 친구 같아요.
HiDream-I1 Fast는 여러 개의 그림 초안을 빠르게 그릴 수 있는 AI입니다.
- 여러 버전의 스케치를 4~8장 정도 그립니다.
- 각각 다른 구도, 색감, 분위기를 시도합니다.
그림 한 장으로 딱 맞추긴 어려우니까요. 다양하게 시도해서 좋은 걸 고르기 쉽게 합니다.
Gemma 3 Vision 4b는 그림을 잘 보는 인공지능입니다.
- 여러 개의 스케치를 보고 어떤 게 사용자 말과 가장 잘 맞는지 평가해요.
- "이 그림이 노을 느낌도 좋고, 평화로움도 있고, 호수 구도도 잘 살렸네!" 이런 식으로요.
HiDream-I1 Full 모드를 사용하면, 선택된 스케치를 바탕으로 고해상도 그림을 만듭니다.
- 더 선명하고, 디테일하고, 실제 작품처럼 보이게 만들어줍니다.
- AI가 추천한 고화질 그림을 보여줍니다.
- 함께 생성한 여러 스케치도 같이 보여줘서,
- "오히려 이 그림이 더 좋아!"라고 고를 수도 있어요.
사용자가 AI 추천 말고 다른 그림을 고르면,
- Qwen3가 이렇게 기억합니다:
"다음엔 이런 분위기일 때, 이런 스타일을 더 좋아하더라..."
그래서 다음에 또 그려달라고 할 때 더 정확한 그림을 추천할 수 있게 됩니다.
이 방식은 그냥 한 번에 그림을 뚝딱 만드는 게 아니라:
- 프롬프트를 잘 해석하고
- 여러 장을 시도해보고
- 눈으로 평가해서
- 고화질로 완성하고
- 다음에도 더 잘할 수 있도록 기억합니다.
정말 사람 디자이너처럼 생각하고, 시도하고, 평가하고, 발전하는 AI 시스템이에요!
- Code: Apache 2.0 License
- Technical documentation: Creative Commons Attribution-NonCommercial-ShareAlike 4.0
(CC BY-NC-SA 4.0)
You are free to use, adapt, and build on this project under the terms above.