KaggleコンペLeaf Classificationをやってみる。
99個のクラスに対して各クラス16枚の画像+3つの項目について64個ずつの特徴量
16枚は少なすぎるな、、、
画像を見たところ、画像のサイズがバラバラ。
同じサイズにresizeする場合は、白の枠を追加した方がタテヨコ比が死なないのでいいかもしれない。
CNN + ???
???に決定木を用いれば、大まかな分類をした後でCNNにかけることができる?
RandomForest -> CNN -> 出力
'Acer_*'などは、おそらく特徴が似るだろうと期待されるので階層的クラスタリングが有用かもしれない。
おそらくデータ拡張の仕方が大事。
trainとtestを分けてからデータ拡張を行うように注意。