2023年1月5日
富士通株式会社

世界トップクラスの精度で、複数の人を同時に安定して追跡し続けるトラッキング技術を開発

映像から人の行動を認識する当社の行動認識AI「行動分析技術Actlyzer（アクトライザー）」は、イベント会場や公共施設、店舗などへの社会実装が進み、その広がりとともに、混雑したショッピングセンターでの顧客の動線解析など、より高度な利用シーンでのニーズが高まっています。そこで当社は、歩行速度に関わらず多くの人の移動を正確に捉えることができる世界トップレベルのトラッキング技術を開発しました。

本技術は、2023年1月3日より米国ハワイで開催される画像処理に関する国際会議「WACV2023（IEEE/CVF Winter Conference on Applications of Computer Vision）」にて発表します。

トラッキング技術について

人の移動を時間ごとにカメラ映像で追う既存の一般的なアルゴリズムでは、時間ごとのフレーム（映像中の1コマの静止画）における人を捉えた対象領域の重なりから同一人物として判別しています。そのため、人が高速に移動するとフレーム同士に重なり合う領域が存在しないため、同一人物であるという対応付けができなくなってしまうことが課題でした。これを解決するため、人を捉える対象領域を拡大し重なり合う領域を作り出し、独自のマッチングアルゴリズムを用いることで、同一人物であるという対応付けを可能にする技術を開発しました（図1）。

図1 開発した技術のイメージ

今回、当社の検証にて、トラッキング分野で一般的に用いられている、画像特徴量や動きに対する仮定を用いた従来技術と比較したところ、開発技術はトラッキング精度を17%向上^（注1）できることが示されました。また、本技術は、画像認識分野で世界最高峰の国際学会である「ECCV2022（European Conference on Computer Vision 2022）」で開催されたトラッキングコンペティションであるDanceTrack Challenge^（注2）で、参加19チーム中2位の精度を達成し、世界トップクラスの精度であることを確認しました。

本技術は、ショッピングモールや公共施設などでも高精度な追跡が可能で、長時間にわたる顧客の動線解析や見守りなどに活用できます（図2）。なお、本技術は、画像特徴量に依存しないため、少ない計算リソースで利用でき、かつ顔や服装などの個人を特定する情報を用いないことからプライバシーに配慮した処理が可能です。

図2 開発したトラッキング技術の結果例

今後について

今後、本技術について、工場での作業行動認識や店舗内での顧客移動特性の分析をはじめとした当社の行動認識AIソリューションや画像処理AIソリューションへの適用検討を進めていきます。

商標について

記載されている製品名などの固有名詞は、各社の商標または登録商標です。

注釈

注1

開発技術はトラッキング精度を17%向上：
公開データセットであるDanceTrackデータセットにおいて、トラッキングの性能指標値の1つ（Higher Order Tracking Accuracy：HOTA）での比較による。
注2

DanceTrack Challenge：
ダンス・新体操などの映像における複数人のトラッキング技術を対象とした公開コンペティション。複数人に対するトラッキングの観点では、人の衣服が同様で外観で判別しにくい、非定常な動きを含む多様な動きを行うといった難しさがある。

本件に関するお問い合わせ

研究本部 Gプロジェクト
E-mail：contact-gpro@cs.jp.fujitsu.com

当ページに記載された製品の価格、仕様、サービス内容などは発表日現在のものです。その後予告なしに変更されることがあります。あらかじめご了承ください。