このページの本文へ移動
  1. ホーム >
  2. プレスリリース >
  3. 大量画像から目的の画像を瞬時に検索する技術を開発

PRESS RELEASE (技術)

2016年2月2日
株式会社富士通研究所

大量画像から目的の画像を瞬時に検索する技術を開発

特定機能に性能を特化させたサーバにより、従来比50倍以上の高速検索が可能に

株式会社富士通研究所(注1)(以下、富士通研究所)は、特定機能に性能を特化させたサーバへ搭載する技術として、大量画像の中から指定した画像に部分的にでも一致する画像を高速に検索する技術を開発し、汎用サーバで検索する場合と比べて50倍以上の処理能力の向上を確認しました。

企業などの現場で蓄積されているプレゼンテーション資料や写真などの静止画の中から、探したい画像を網羅的に検索するには、処理量が大きく時間がかかることが課題となっていました。

今回、画像検索に必要な処理を行うアクセラレーターをFPGA(注2)に実装し、CPU上のソフトウェアと効率よく連携することでサーバの性能を飛躍的に向上させ、高速な画像検索機能を実現する技術を開発しました。試作サーバにおいて、1万枚以上の画像データベースから検索画像の任意の部分に一致する画像を1秒程度で検索できることを確認しました。

これにより、企業などで保有する大量の画像データから目的の画像を瞬時に発見、再利用することが可能となり、現場業務の効率化が可能となります。

本技術を搭載したサーバを、2月16日(火曜日)に米国サンタクララで開催予定のNATF 2016(Fujitsu North America Technology Forum)で展示します。また、本技術の詳細は、3月7日(月曜日)から米国レイクプラシッドで開催予定の国際会議「WACV(IEEE Winter Conference on Applications of Computer Vision 2016)」にて発表します。

開発の背景

企業などの現場では、プレゼンテーション資料などの図や写真を含む大量の文書が日々生成・蓄積されています。これらの蓄積された大量データの中から、欲しい画像を効果的に探し出して利用できれば、業務の効率向上が期待できるため、目的の画像を素早く見つけだすことができる画像検索技術が注目されています。

課題

人が画像を検索する際の手掛かりは、多くは曖昧な記憶や大まかなイメージから発生します。画像そのものを検索キーとして検索画像の一部に一致する画像を探し出す技術を部分画像検索といい、この技術を用いることで、きっかけとなる一つの画像から類似・関連する画像を網羅的に検索し、人の記憶や連想するイメージを新たな手掛かりに次の検索を行うなど、直感的に目的の画像を検索していくことができます。しかし、部分画像検索の処理には、画像間の部分的な比較を網羅的に行う必要があるため膨大な演算が必要であり、汎用のサーバを用いると1万枚程度の画像の中から目的の画像を検索するのに1分以上の時間がかかっていました。この対応策として多数のサーバを用いて並列・分散処理を行うことで、検索速度を向上させることができますが、消費電力や装置コストが膨大になるという課題がありました。

開発した技術

今回、部分画像検索において、従来CPUで行っていた処理のうち大規模に並列処理が可能な演算をFPGAに高並列演算器として実装し、さらに、高い稼働率でその演算器を動作させるために、データの移動に着目して処理スケジューリングの最適化を行うことにより、検索速度を飛躍的に向上させる技術を開発しました。

本技術は、特定のアプリケーション領域に適したハードウェア構成と処理の最適化により、サーバの性能を飛躍的に向上させる「ドメイン指向サーバ」の考え方に基づいて開発しています。

FPGAを活用して高性能を実現するためには、複雑な処理をまとめて実行する高効率な演算器をFPGA内に高密度に敷き詰めて、さらにその演算器を休ませないようにデータを供給して動作させることが鍵となります。

開発した技術の特徴は以下の通りです。

  1. 部分画像検索アルゴリズムの主要な処理をFPGAに高密度に実装

    今回、部分画像検索アルゴリズムを詳細に分析して、検索に必要なフローのうち特徴量抽出処理とマッチング処理部分を抽出し、FPGA上に実装しました。FPGAはCPU、GPUに比べ演算の特性に合わせて演算器や並列度を柔軟に構成できる特性があるため、それぞれの処理について小型で高効率な演算器を設計し、高並列・高密度に実装しました(図1)。この高性能なFPGA上の演算器とCPU上のソフトウェアを効率よく連携させることにより、高速な部分画像検索を実現しています。

    図1 FPGAへの部分画像検索処理の実装
    図1 FPGAへの部分画像検索処理の実装

  2. 状況に応じた処理順序の入れ替えにより高い稼働率を実現するスケジューリング技術

    画像の処理においては、特に大量の画像データを一時的に格納しているメモリからのデータ読み出しに時間がかかります。このため、現在の演算処理中に次に必要となるデータをあらかじめ読み込んでおくことで、読み出し時間を短縮することができます。しかし一方で、演算処理の結果から次に行う処理の対象が変わり、読み出したデータが無駄になることがあります。高い並列度で演算器を並べた場合、同時に多くのデータを使用するため、無駄なデータの読み出しによる影響が極めて大きくなります。そこで、データの先読みを行いつつも、状況に応じて処理順序の入れ替えを行い、読み出したデータが無駄にならないように制御するスケジューリング技術を開発し、これにより高い処理性能を達成しました(図2)。

    図2 処理フロー最適化の一例
    図2 処理フロー最適化の一例

効果

今回開発した技術を適用したサーバを試作し、サーバ1台で、1万枚以上の画像データベースから、検索画像の任意の部分に一致する画像の検索を約1秒で完了でき、汎用サーバに比べて50倍以上高速に実行できることを確認しました(図3(a))。今回開発したサーバと同等の検索速度を、汎用サーバを複数台使用して実現した場合と比較すると、消費電力は30分の1以下に、装置体積も50分の1以下になります。これにより、例えば、企業などが保有する画像を含む大量文書から、目的の画像を瞬時に発見し、その結果に基づき、さらに検索を対話的に繰り返すことで、これまでに蓄積された大量画像の中から目的の文書をすばやく検索でき、文書作成業務の効率化が期待できます(図3(b))。

図3 文書検索システムへの適用結果
図3 文書検索システムへの適用結果

今後

富士通研究所では、今回開発した高速画像検索技術を利用したシステムの開発を進め、2016年度中の実用化を目指します。また、画像処理だけでなくサーバの処理能力の向上が求められているアプリケーション領域に向けたドメイン指向サーバの研究開発を進めていく計画です。

商標について

記載されている製品名などの固有名詞は、各社の商標または登録商標です。

以上

注釈

注1 株式会社富士通研究所:
本社 神奈川県川崎市、代表取締役社長 佐相秀幸。
注2 FPGA:
Field Programmable Gate Arrayの略。製造後に回路構成をプログラム可能な汎用デバイス。

本件に関するお問い合わせ

株式会社富士通研究所
コンピュータシステム研究所
電話 044-754-2632(直通)
メール domain-specific-server@ml.labs.fujitsu.com


プレスリリースに記載された製品の価格、仕様、サービス内容、お問い合わせ先などは、発表日現在のものです。その後予告なしに変更されることがあります。あらかじめご了承ください。