情報デザイン学科・文化情報学科:大学生のAI挑戦!星ヶ丘テラスの看板認識コンペで84.5%の高精度を達成
ニュース
3つのポイント!
- 大学生がAIを使って星ヶ丘テラスの看板を認識するコンペを実施
- 1289枚の学習データと304枚の未知のテストデータを使用
- 最高84.5%の認識率を達成し、AIの実用性を証明
名古屋の若者に人気の星ヶ丘テラス。そこで行われた、大学生によるAI技術を活用した看板認識コンペの結果の報告です。このコンペは、文化情報学科の「展開演習2」(担当:早瀬光浩准教授)で開催されました。
この授業の履修者たちが参加したコンペでは、星ヶ丘テラスの40店舗から収集した看板データを使用しました。学生たちは学習用に1289枚を7割〜8割使用して認識率が高くなるようにモデルを学習させました。
そして驚くべきことに、事前に公開されていない304枚のデータが評価用として使われました。「え、知らないデータで試すの?」と思った人もいるでしょう。実は、これがAIの本当の実力を試す重要なポイントなのです。学習したデータだけでなく、初めて見る看板でも正確に認識できるかどうかが、AIの実用性を左右するからです。
そんな厳しい条件の中、最高は84.5%という高い認識率を達成しました。これは、100枚の未知の看板のうち、約85枚を正確に識別できたということです。街中の複雑な環境を考えると、かなりの好成績と言えるでしょう。
使用されたのは、ResNet50やResNet18といった最新の画像認識モデル。これらは、人間の脳の仕組みを模倣した「ディープラーニング」技術を使っています。
コンペの上位3名の結果(認識率)は以下の通りです。
1.84.5% - ResNet50(転移学習、バッチサイズ64、15エポック、学習データと評価データの割合=7:3)
2.83.6% - ResNet18(転移学習、バッチサイズ16、30エポック、学習データと評価データの割合=8:2)
3.81.9% - ResNet50(転移学習、バッチサイズ64、20エポック、学習データと評価データの割合=8:2)
「ん?エポックって何?」という声が聞こえてきそうですね。簡単に言うと、AIがデータを学習する回数のことです。この数字を調整することで、AIの性能が変わってきます。
下の画像は、1位の学生の認識結果の一部です。緑が正解、赤が不正解を表しています。横の数字は予測結果の確率を表しています。
この結果は、AIが実際の街中で活躍できる可能性を示しています。例えば、観光客向けのアプリで、カメラをかざすだけでお店の情報がわかるようになるかもしれません。
また、このコンペに参加した大学生たちの挑戦は、AIやプログラミングに興味のある高校生にとって、大きな励みになるはずです。最先端の技術に触れ、実際の問題解決に取り組む。そんなワクワクする体験が、大学では待っています。
AIの世界は日々進化しています。今回のような挑戦が、私たちの生活をより便利で楽しいものにしていくでしょう。未来のAI開発者たちの活躍に、今から期待が高まります。
学生のコメント
限られた試行回数の中で、試行を重ねてより精度の高いものになるモデルやエポック数などの組み合わせを考え、見つけることがとても難しかったです。
担当教員のコメント
今回の看板認識コンペでは、真正面から撮った写真以外にも斜めなどの写真があります。学生たちのプログラムでは、画像処理が左右反転程度しかなかったため,回転やアフィン変換も加えて学習させるとより高精度になったと考えられます。また、Google ColaboratoryのGPU使用上限に悩まされていました。今回のコンペでの経験を元に今後も様々なことにチャレンジしていって欲しいです。