文化情報学科:画像認識モデルを作成

ニュース

文化情報学科の「展開演習2」(担当:早瀬光浩准教授)で開催された画像認識コンペの中で、学生らがプログラムを作成しました。
 
このコンペでは、データを追加学習させる転移学習やファインチューニングなどを活用し、学生自ら考え、学修したことを組み合わせながら、認識精度の高いプログラムを作成することを目的としています。今年度のテーマ「動物を認識しよう!」に合わせ、6月に東山動植物園でデータの収集を行いました。
学生らは、31種の動物のデータを収集し、正解率を計算(結果図1)。コンペで1位となった学生の結果では、「ほとんどの動物が正しく認識できているが、カンガルーとライオン、アザラシとペンギンで50%の誤認識がある」結果となりました。これは、取得したデータで区別できる要素が少なかったためと考えられます(図2)。
 
受講した学生らは、「精度の高いモデルを作成するために、事前に授業で学んだ転移学習を用いながら、何度も挑戦した」「学習させるための時間をどれだけ捻出できるか苦労した」など、学びの内容を生かした実践的な力を身に付けました。
 
関連する記事:画像認識コンペを実施

(図1)収集した31種類の内、上位10位までの結果です。
順位   使用したモデル        手法  batch epoch 評価データに対する正解率           
1 ResNet50 転移学習 64 10 0.96875
2 DenseNet121 転移学習    32 15 0.96700
3 ResNet50 転移学習 64 20 0.95000
4 AlexNet 転移学習 32 20 0.94688
5 VGG16 転移学習 64 30 0.94337
6 ResNet18 転移学習 64 20 0.93575
7 ResNet50 転移学習 128 20 0.92950
8 VGG16 転移学習 32 10 0.92150
9 ResNet18 ファインチューニング          64 5 0.90000
10 AlexNet 転移学習 32 20 0.88575