このページの本文へ移動
  1. ホーム >
  2. プレスリリース >
  3. AIが認識できる画質で映像データを高圧縮する技術を開発

PRESS RELEASE (技術)

2020年3月5日
株式会社富士通研究所

AIが認識できる画質で映像データを高圧縮する技術を開発

高精細・大容量な映像データを従来の1/10に圧縮し、クラウドで解析可能に

株式会社富士通研究所(注1)(以下、富士通研究所)は、高精細・大容量な映像データをAIが認識できる必要最小限のサイズまで高圧縮する技術を開発しました。本技術により、映像データを従来の人間による視認を目的とした圧縮技術に比べて10分の1以上圧縮することが可能です。

近年、様々なビジネスの領域において映像データをAIで解析する需要が急激に増加しています。さらに、第5世代移動通信方式(注2)の普及に伴い、高性能カメラで撮影した高精細な映像データや街頭、製造ラインなどに設置された多数のカメラ映像などが爆発的に増加すると予測されています。

今回、映像データに映っているヒト・動物・モノなどを認識する際に、判断基準となる特徴において重視する画像の領域がAIと人間では異なることに着目し、AIが重視する領域の自動解析、およびAIが認識できる必要最小限のサイズまでデータを圧縮する技術を開発しました。これにより、AIの認識精度を低下させることなく、大量な映像データの解析が可能になるとともに、運用、伝送回線コストの大幅な削減を実現します。また、クラウド上に蓄積された複数の映像データや、映像以外のセンサーデータや売り上げなどの実績データなどを組み合わせた、さらに高度な映像データの解析なども期待されます。

背景と課題

近年、AIを用いて映像を解析する技術は急速に発展し、様々な企業におけるデジタルトランスフォーメーションの原動力のひとつとして大きく期待されています。さらに、高精細な4Kや8Kなどのカメラの普及や、2020年からサービスが開始される第5世代移動通信システムにより、製造業や小売業における行動分析など大規模な映像データの利活用が進み、AI解析の需要はますます増えていくと予想されています。

映像を解析するAI手法としてはディープラーニングが多用されますが、処理が膨大なため、端末側のエッジサーバだけで大規模な映像を解析する場合、エッジサーバの増強などによる計算パワーの確保が必要となります。そのため、クラウドと連携した処理が有効ですが、映像データはサイズが大きいため、ネットワーク帯域が逼迫しないように、全ての映像データを品質を落とさずにクラウドへ送信できる高圧縮技術が求められています。

開発した技術

映像を圧縮すると圧縮率に応じて画質が劣化するため、AIが注目している領域を過度に圧縮すると認識率が低下します。今回、映像データ1コマ1コマの画像において、AIが判断材料として認識している対象物の領域を自動的に解析し、領域ごとにAIが認識できる必要最低限な画質で圧縮(注3)を行う映像圧縮技術を開発しました(図1)。本技術を適用することで、AIでの認識精度を維持したまま、従来の人間による視認を目的とした圧縮技術に比べて映像データのサイズを大幅に削減できます。

図1 人間ではなくAIが認識できる画質のイメージ
図1 人間ではなくAIが認識できる画質のイメージ

開発した技術の特長は以下のとおりです。

  • AIの認識精度に影響しない圧縮率を自動推定する技術

    圧縮特有の画質劣化が与える認識精度への影響を、画像の領域ごとに解析し、AIの認識結果も踏まえて認識精度に影響しない圧縮率を自動推定します(図2)。

    画像全体の圧縮率を変えて画質を変化させ、その圧縮率を変化させた時の認識結果への影響度を格子状に区切った画像領域ごとに集計することで、AIが認識する過程における特徴の重要度合いを全ての領域ごとに判定します。そして、その各々の領域において認識精度を急激に劣化させる直前の圧縮率を認識精度に影響しない圧縮率として推定します。

    さらに、連続する画像におけるAIの認識結果をフィードバックして必要最小限まで圧縮率を高めます。これらの技術により、AIによる認識精度を維持した状態で画像の高圧縮を実現します。

図2 AIの認識精度を元に圧縮率を推定
図2 AIの認識精度を元に圧縮率を推定
拡大イメージ

効果

工場で梱包作業を行っている複数作業員の様子を4Kの高精細カメラで撮影した映像に今回開発した技術を適用し、認識精度が劣化することなくデータサイズを10分の1に削減できることを確認しました。本技術により、厳密なリアルタイム性が必要でない用途や、さらに、クラウド上に蓄積された複数の映像データ、映像以外のセンサーデータや売り上げなどの実績データなどを組み合わせた高度な映像データの解析などにも活用が期待されます。

今後

富士通研究所では、本技術を様々なケースにおいて評価し、さらなる圧縮性能の向上のための研究開発を進め、2020年度中の実用化と、製造業を支えるサービス基盤である富士通株式会社(注4)のものづくりデジタルプレイス「FUJITSU Manufacturing Industry Solution COLMINA」をはじめとして様々な業種への展開を目指します。

商標について

記載されている製品名などの固有名詞は、各社の商標または登録商標です。

以上

注釈

注1 株式会社富士通研究所:
本社 神奈川県川崎市、代表取締役社長 原裕貴。
注2 第5世代移動通信方式:
3GPP 5th Generation方式の略称。世界の主要な移動体通信関連会社などが加盟し、全世界での移動体通信の標準規格を策定するパートナーシッププロジェクトである3GPP(3rd Generation Partnership Project)において、新たに規定される第5世代の移動体通信の標準規格。5Gの標準規格は、既存のLTE/LTE-Advanced方式に対して高速化、大容量化、低遅延かつ高信頼化などの実現が合意されており、2017年12月にその標準仕様の初版策定が完了。
注3 圧縮:
本技術では、国際標準であるH.265/HEVCや既存の映像圧縮の方法を適用。
注4 富士通株式会社:
本社 東京都港区、代表取締役社長 時田 隆仁。

本件に関するお問い合わせ

株式会社富士通研究所
ICTシステム研究所
電話 044-754-2632(直通)
メール videocompforaibasictech@ml.labs.fujitsu.com


プレスリリースに記載された製品の価格、仕様、サービス内容、お問い合わせ先などは、発表日現在のものです。その後予告なしに変更されることがあります。あらかじめご了承ください。