物体識別のベンチマーク画像を用いた検証で最大7.54%の認識精度向上を実証
日立は、認識対象物の要素を分解することで、少ないデータでも高精度に学習することができる画像認識AI向けの深層学習技術を開発しました。従来では、認識対象物の特徴に加えて学習データに含まれる背景の特徴などを含めて学習していたため、背景画像が学習時と異なる場合の認識精度が低下していました。本技術では、認識対象物には直接関係しない背景などの特徴と、認識対象物の不変的な特徴を捉えることができる形状や色などの特徴の要素に分解して学習し、かつ認識対象物の不変的な特徴を選別して認識することで精度を高めます。物体識別のベンチマーク画像を用いた検証を行い、従来手法に対して認識精度が最大7.54%向上することを確認しました。今後日立は、公共エリアでの映像監視や産業分野における目視検査代替など、十分な学習データを集めにくいとされる分野への適用を進め、社会の安心・安全や生産現場の効率化に貢献していきます。
背景および取り組んだ課題
- 少子高齢化に伴う労働力の減少により、人の目視作業を代替する画像認識AI技術が注目されており、今後、映像監視や目視検査の支援など、さまざまな分野での活用が見込まれている
- 画像認識AIの生成には深層学習技術が用いられることが一般的となっているが、従来技術では、学習した内容と異なる特徴を持つ物体の認識は困難。認識精度を向上させるために、学習用データの収集および画像認識AIの再学習に時間を要した
開発した技術
- 画像特徴の要素分解学習技術
- 画像特徴量選別および識別技術
確認した効果
- 未知の画像を識別するゼロショットラーニング技術*1と組み合わせて、物体識別のベンチマーク画像データセット*2を用いて認識精度を検証し、従来手法に対して最大7.54%の精度向上を確認
発表する論文、学会、イベントなど
- 本成果の一部は、2019年6月16日から6月20日に米国カルフォルニアで開催されたComputer Vision and Pattern Recognition 2019(CVPR 2019)で発表済
開発技術の詳細
1. 画像特徴の要素分解学習技術
従来の深層学習技術は、大量の学習用データを用いて、人や車などの認識対象物体の画像特徴量をニューラルネットワークに学習させておくことで、入力画像の画像特徴量を解析しながら物体認識を行う画像認識AIを生成します。日立は、このニューラルネットワークで学習した画像特徴量群について、認識対象物体とは直接関係しない背景情報などの画像特徴量と、認識対象物体の不変的な特徴を捉えることができる画像特徴量が混在していることに着目しました。本技術は、上記画像特徴量を要素分解しながらニューラルネットワークに学習させます。
2. 画像特徴選別および識別技術
本技術は、入力画像毎に要素分解した画像特徴量の中から、認識対象物体の不変的な特徴を捉えることができる画像特徴量を自動選別して物体認識を行います。これにより、未学習の画像特徴を有する物体の認識精度が向上し、画像認識AIの汎化性能*3が向上します。事前に十分な学習データを集められないケースにおいても、本技術を適用することで、高精度な画像認識AIの生成が可能となります。
*1 ゼロショットラーニング:物体を識別するための色や形状などの細かい特徴を学習しておくことで、学習していない未知の未知の物体の種別を識別する技術
*2 ベンチマーク画像データセット:動物や物などの物体が描かれた画像ファイルと、画像ファイル一つひとつに正解ラベルが付与されたデータセットであり、本データセットを用いることで画像認識AIの認識精度の定量評価が可能
*3 汎化性能の向上:学習した内容と異なる背景や物体形状の特徴を持つ画像が入力された際でも、高い画像認識精度が得られること
照会先
株式会社日立製作所 研究開発グループ
問い合わせフォームへ