Skip to content

Latest commit

Β 

History

History
59 lines (36 loc) Β· 3.14 KB

File metadata and controls

59 lines (36 loc) Β· 3.14 KB

Memozy_AI_GPT

🎨 GPT API for Image Captioning Fine-tuning

이 λ¦¬ν¬μ§€ν† λ¦¬λŠ” πŸ–ΌοΈ GPT APIλ₯Ό ν™œμš©ν•œ 이미지 캑셔닝 λͺ¨λΈμ„ νŒŒμΈνŠœλ‹ν•˜κΈ° μœ„ν•œ ν™˜κ²½μ„ μ œκ³΅ν•˜κΈ°μœ„ν•΄ λ§Œλ“€μ–΄μ‘ŒμŠ΅λ‹ˆλ‹€

πŸ“‚ 파일 ꡬ쑰 μ„€λͺ…

πŸ“data
β”œβ”€β”€ πŸ“‚ fine_tuning_img:처리된 이미지듀이 λ“€μ–΄μžˆλŠ” 디렉토리

β”œβ”€β”€ πŸ“‚ img: 원본 이미지듀이 μžˆλŠ” 디렉토리

β”œβ”€β”€ πŸ“„ completed_fine_tuning_Data.jsonl: GPT νŒŒμΈνŠœλ‹μ„ μœ„ν•œ μ™„μ„±λœ 데이터셋

β”œβ”€β”€ πŸ“„ diary_output.json: μ΅œμ’…μ μœΌλ‘œ ν…ŒμŠ€νŒ… 된 이미지 정보와 μΊ‘μ…˜ 정보λ₯Ό λ°±μ—”λ“œμ— 보낼 ν…ŒμŠ€νŒ… json파일

β”œβ”€β”€ πŸ“„ img_content.json: 이미지 μΊ‘μ…˜ 데이터

└── πŸ“„ img2base64.json: 인덱슀 처리된 이미지λ₯Ό base64둜 μΈμ½”λ”©ν•œ 데이터셋


β”œβ”€β”€ πŸ“ gpt_api_base64_test.py: base64 인코딩 데이터λ₯Ό μ΄μš©ν•œ GPT API 이미지 μΊ‘μ…˜ ν…ŒμŠ€νŠΈ μ½”λ“œ

β”œβ”€β”€ πŸ“ gpt_api_img_test.py: 이미지λ₯Ό μ‚¬μš©ν•œ GPT API 이미지 μΊ‘μ…˜ ν…ŒμŠ€νŠΈ μ½”λ“œ

β”œβ”€β”€ πŸ“ gpt_api_text_test.py: GPT API ν…μŠ€νŠΈ λŒ€ν™” ν…ŒμŠ€νŠΈ μ½”λ“œ

β”œβ”€β”€ πŸ“ gpt_flow_test.py: GPT APIλ₯Ό μ΄μš©ν•˜μ—¬ λ§₯락을 κ΅¬μ„±ν•˜μ—¬ λŒ€ν™”λ‚΄μš© 기반으둜 이미지 일기λ₯Ό μƒμ„±ν•˜λŠ” μ΅œμ’… ν…ŒμŠ€νŒ… μ½”λ“œ

β”œβ”€β”€ πŸ› οΈ image_content_generate.py: img_content.json을 μƒμ„±ν•˜λŠ” μ½”λ“œ

β”œβ”€β”€ πŸ› οΈ img_indexing.py: 이미지 인덱싱 및 μ €μž₯ μ½”λ“œ

β”œβ”€β”€ πŸ› οΈ img2base64.py: img2base64.json 생성 및 base64 인코딩 μ½”λ“œ

β”œβ”€β”€ πŸ› οΈ make_fine_tuning_data.py: μ΅œμ’… νŒŒμΈνŠœλ‹ 데이터λ₯Ό μƒμ„±ν•˜λŠ” μ½”λ“œ

└── πŸ” show_image_test.py: 인코딩 정보와 이미지 μΊ‘μ…˜ λ§€μΉ­ 확인 μ½”λ“œ

πŸš€ μ‚¬μš© 방법

  1. 이미지λ₯Ό data/img 폴더에 μ €μž₯ν•©λ‹ˆλ‹€.

  2. img_indexing.pyλ₯Ό μ‹€ν–‰ν•˜μ—¬ 이미지 인덱싱을 μˆ˜ν–‰ν•©λ‹ˆλ‹€.

  3. img2base64.pyλ₯Ό μ‹€ν–‰ν•˜μ—¬ 이미지λ₯Ό base64둜 μΈμ½”λ”©ν•˜κ³  img2base64.json에 μ €μž₯ν•©λ‹ˆλ‹€.

  4. image_content_generate.pyλ₯Ό μ‹€ν–‰ν•˜μ—¬ img_content.json을 μƒμ„±ν•œ ν›„, μ‚¬μš©μžκ°€ μΊ‘μ…˜μ„ μž‘μ„±ν•©λ‹ˆλ‹€.

  5. show_image_test.pyλ₯Ό μ‹€ν–‰ν•˜μ—¬ 인코딩 정보와 이미지 μΊ‘μ…˜μ˜ 맀칭을 ν™•μΈν•©λ‹ˆλ‹€.

  6. 이상이 μ—†μœΌλ©΄, make_fine_tuning_data.pyλ₯Ό μ‹€ν–‰ν•˜μ—¬ GPT API νŒŒμΈνŠœλ‹ 데이터 completed_fine_tuning_Data.jsonl을 μƒμ„±ν•©λ‹ˆλ‹€.
  7. 이후 μƒμ„±λœ jsonlνŒŒμΌμ„ κ°€μ§€κ³  GPT fine tuning을 μ§„ν–‰ν•˜κ³  'gpt_flow_test.py'λ₯Ό μ΄μš©ν•˜μ—¬ 이미지 일기 생성을 ν…ŒμŠ€νŠΈν•©λ‹ˆλ‹€.

μ΅œμ’… κ²°κ³Ό

<μ‚¬μš© 이미지>

<λŒ€ν™” λ‚΄μ—­>

result