NEFCLASS/main.py at main · dhecloud/NEFCLASS · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
from membership import *
from NEFCLASS import *
from data_loading import *
import argparse
import numpy as np
seed = 42

def train(args, labels, train_data, train_targets, test_data, test_targets, universe_max, universe_min, verbose=False):
    '''
    initialize model
    '''
    model = NEFCLASS(num_input_units= args.num_input_units, num_fuzzy_sets=args.num_sets, \
                    kmax=args.kmax, output_units=args.output_units, universe_max=universe_max, universe_min=universe_min,\
                    membership_type=args.mf)
    abcs = [build_membership_function(train_data[d],labels) for d in range(train_data.shape[1])]
    model.init_fuzzy_sets(abcs)

    '''
    start rule learning
    '''
    #learn rule

    if verbose: print('==== start rule learning ====')
    if args.rule_learning == 'original':
        for i, (r,t) in enumerate(zip(train_data,train_targets)):
            model.learn_rule(r, t)
    else:
        #get all possible antecedents
        antecedents=[]
        consequents=[]
        memberships = []
        for r,t in zip(train_data,train_targets):
            m, a = model.get_antecedents(r)
            if a not in antecedents:
                memberships.append(m)
                antecedents.append(a)
                consequents.append(t)
        antecedents = np.array(antecedents,dtype=object)
        consequents = np.array(consequents)
        c_j = []
        for i, (r,t) in enumerate(zip(train_data,train_targets)):
            cjc = [0 for i in range(args.output_units)]
            for m, a in zip(memberships, antecedents):
                #calculate degree of fulfilments
                cjc[t] += model.get_degree_of_fulfilment(m,a)
            c_j.append(cjc)
        all_perfs = []
        for n, a in enumerate(antecedents):
            c = np.argmax(c_j[n])
            perf_j = c_j[n][c] - sum(tmp_x for tmp_i, tmp_x in enumerate(c_j[n]) if tmp_i != c)
            all_perfs.append(perf_j)

        #best per class
        rule_per_class = min(int(np.ceil(args.kmax/args.output_units)), int(np.floor(len(antecedents)/ args.output_units)))
        assert(rule_per_class*args.output_units <= len(antecedents))
        if verbose: print(f'maximum of {rule_per_class} rule learnt per class')
        antecedent_idxs = []
        all_perfs = np.array(all_perfs)
        for i in range(args.output_units):
            c_idxs = np.nonzero(consequents==i)[0]
            perf_c = all_perfs[c_idxs]
            if len(c_idxs) < rule_per_class:
                ind = (-perf_c).argsort()[:len(c_idxs)]
                # ind = np.argpartition(perf_c, -len(c_idxs))[len(c_idxs):]
            else:
                ind = (-perf_c).argsort()[:rule_per_class]
                # ind = np.argpartition(perf_c, -rule_per_class)[rule_per_class:]
            model.add_rules(antecedents[ind], consequents[ind])


            #
    if verbose: print(f'model learnt {model.get_num_rules()} rules')

    '''check accuracy after rule learning'''
    if verbose: print(f'Accuracy on training set after rule learning: {check_accuracy(model, train_data, train_targets):.2f}%')


    '''fuzzy set learning'''
    if verbose: print('==== start fuzzy set learning ====')
    best_acc_epoch_pair = [-1,-1]
    test_accs = []
    for e in range(args.num_epoch):
        for i, (r,t) in enumerate(zip(train_data,train_targets)):
            output = model(r, t)
            delta = [1 - output[i] if i == t  else 0 - output[i] for i in range(len(output))]
            model.update_fuzzy_sets(args.sigma, delta)
        epoch_acc = check_accuracy(model, train_data, train_targets)
        test_accs.append(check_accuracy(model, test_data, test_targets))
        if epoch_acc > best_acc_epoch_pair[0]:
            best_acc_epoch_pair[0] = epoch_acc
            best_acc_epoch_pair[1] = e
        #early stopping
        if e - best_acc_epoch_pair[1] > args.num_epoch/10:
            break
        if e % 5 == 0:
            if verbose: print(f'Epoch {e}: {epoch_acc:.2f}%')

    if verbose: print(f'Best accuracy {best_acc_epoch_pair[0]:.2f}% at epoch {best_acc_epoch_pair[1]}')
    if verbose: print(f'Accuracy on test set after fuzzy set learning: {test_accs[best_acc_epoch_pair[1]]:.2f}%')
    return best_acc_epoch_pair[0], test_accs[best_acc_epoch_pair[1]]

def check_accuracy(model, data, targets):
    correct = 0
    total = 0
    for i, (r,t) in enumerate(zip(data, targets)):
        # print(i)
        output = model(r, t)
        pred_class = output.index(max(output))
        if pred_class == t:
            correct +=1
        total += 1

    return 100*correct/total

def main(args):

    '''
    load dataset
    '''
    if args.dataset == 'iris':
        terms = load_iris(args)
    elif args.dataset == 'bc':
        terms = load_breast_cancer(args)
    elif args.dataset == 'wbc':
        terms = load_breast_cancer_wisconsin(args)
    elif args.dataset == 'wine':
        terms = load_wine(args)
    else:
        print('dataset does not exist')
        assert False
    '''
    define linguistic variable
    '''
    if args.num_sets == 5:
        labels = ['lower','low','average','high','higher']
    elif args.num_sets == 3:
        labels = ['low','average','high']
    elif args.num_sets == 7:
        labels = ['lowest','lower','low','average','high','higher','highest']
    elif args.num_sets == 9:
        labels = ['extremely low','lowest','lower','low','average','high','higher','highest', 'extremely high']
    else:
        print('only 3/5/7 sets supported')
        assert False
    if args.cv:
        from sklearn.model_selection import KFold
        data, targets, universe_max, universe_min = terms
        kf = KFold(n_splits=args.kfold, shuffle=True, random_state=seed)
        kf.get_n_splits(data)
        cv_train_acc, cv_test_acc = [],[]
        for train_idxs, test_idxs in kf.split(data):
                train_data, train_targets, test_data, test_targets = data[train_idxs], targets[train_idxs], data[test_idxs], targets[test_idxs]
                train_acc, test_acc = train(args, labels, train_data, train_targets, test_data, test_targets, universe_max, universe_min, verbose=args.v)
                cv_train_acc.append(train_acc)
                cv_test_acc.append(test_acc)
        print(f'Sigma:{args.sigma}, kmax:{args.kmax}, num_sets:{args.num_sets}, Train: {np.mean(train_acc):.2f}% Test: {np.mean(test_acc):.2f}%')
    else:
        train_data, train_targets, test_data, test_targets, universe_max, universe_min = terms
        train(args, labels, train_data, train_targets, test_data, test_targets, universe_max, universe_min, verbose=args.v)


if __name__ == '__main__':
    parser = argparse.ArgumentParser(description='NEFCLASS')
    parser.add_argument('--dataset', default='iris', type=str, help='dataset to load')
    parser.add_argument('--sigma', default=0.01, type=float, help='learning rate')
    parser.add_argument('--num_epoch', default=500, type=int, help='number of epoch for fuzzy set learning')
    parser.add_argument('--num_sets', default=5, type=int, help='number of fuzzy sets')
    parser.add_argument('--kmax', default=100, type=int, help='maximum number of rules')
    parser.add_argument('--rule_learning', default='original', type=str, help='rule learning method to use. Default is the original implementation. Use any other strings as input to perform best per class.')
    parser.add_argument('--cv', default=False, action='store_true', help='do 10 fold cross validation?')
    parser.add_argument('--kfold', default=10, type=int, help='number of k fold')
    parser.add_argument('-v', default=False, action='store_true', help='verbosity')
    parser.add_argument('--mf', default='tri', type=str, help='membership function to use. Default: tri. Options: gaussian, semicircle')

    args = parser.parse_args()
    main(args)