AI_model_proto/torch_datamodule.py at main · GotchaAI/AI_model_proto · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
import quickdraw as qd
import torch
import config
import time

# 1. 전체 클래스 불러오는 Dataset (config에 등록된 CATEGORIES)

# 모든 클래스 넣으면 메모리 터짐
class QuickDrawAllDataSet(torch.utils.data.Dataset):
    # 객체 초기화 시 데이터 로드
    def __init__(self, max_drawings=1000, transform=None):
        self.data_index = []
        self.transform = transform if transform else transform.ToTensor()
        self.max_drawings = max_drawings


        for label_id, label_name in enumerate(config.CATEGORIES): # 각 Label마다
            data_group = qd.QuickDrawDataGroup(label_name, max_drawings=max_drawings, recognized=True) # 최대 max_drawings 만큼의 데이터 레퍼런스 저장
            self.data_index.extend([(label_id, i) for i in range(data_group.drawing_count)]) # 아직 데이터 로드 하지 않고 drawing index만 저장장


    def __len__(self):
        return len(self.data_index)

    #
    def __getitem__(self, index: int):
        """
        특정 index의 데이터 반환
        :return: (이미지 Tensor, 정수형 레이블)
        """
        label_id, img_idx = self.data_index[index]
        label_name = config.CATEGORIES[label_id]

        # LAZY LOADING
        data_group = qd.QuickDrawDataGroup(label_name, max_drawings=self.max_drawings, recognized=True)
        image = data_group.get_drawing(img_idx).image


        return self.transform(image), label_id


# 2. 하나의 클래스에 대해서만 가져오는 DataSet
class QuickDrawDataSet(torch.utils.data.Dataset):
    def __init__(self, name, max_drawings=1000, transform=None):
        self.index = config.CATEGORIES.index(name) # 해당 클래스의 idx 가져옴
        self.data = []
        self.transform = transform
        print(f" 클래스 [{self.index + 1}]: {name} 로드 중 ...")
        data_group = qd.QuickDrawDataGroup(name, max_drawings=max_drawings, recognized=True) # 최대 max_drawings 만큼의 데이터 가져옴
        for i in range(data_group.drawing_count): # get_drawing: PIL Image 변환
            self.data.append(data_group.get_drawing(i)) # 흑백 변환 X, RGB 3채널로
        print(f" 클래스 [{self.index + 1}]: {name} 로드 완료!")

    def __len__(self):
        return len(self.data)

    def __getitem__(self, index: int):
        """
        특정 index의 데이터 반환
        :return: (이미지 Tensor, 정수형 레이블)
        """
        image = self.data[index]
        return self.transform(image), self.index