PRESS RELEASE (技術)
2011年3月7日
株式会社富士通研究所
富士通研究開発中心有限公司
業界初!複雑な背景上で多色のテロップの認識に成功
膨大な数のテレビ番組やネット動画から見たいシーンを検索できる
本技術の詳細は、3月10日から行われる「電子情報通信学会パターン認識・メディア理解研究会」にて発表いたします。
図1 映像中のテロップとその認識
開発の背景
近年、映像コンテンツの爆発的な増加により、映像コンテンツの検索技術が不可欠になってきました。テロップは映像コンテンツの内容に連動して表示されるため、映像のどの部分に必要な情報があるかといった検索にも利用できることから、映像の検索や索引付けに幅広く活用することができます。
課題
従来技術で認識可能な映像中のテロップは、(1)テロップの背景が単一の色で、テロップ文字列がそれと違う色の場合(単色もしくは複数色)、または(2)テロップの背景が複数色(複雑)でテロップ文字色が単色に限定されている場合、の2通りに限られていました。これは、背景の映像とテロップを正しく分離することが困難であったためです。しかし、近年の情報番組やバラエティ番組などではさまざまな映像に対して複数色をもつテロップが挿入されており、これらを高精度に認識することが課題となっていました。
開発した技術
今回開発した技術により、複雑な背景上で多色のテロップを認識することが可能です。色によって複数の画像に分解し、それぞれの分解画像に対して文字認識を行い、最適な文字列を選択してから統合することで、複雑背景上での多色のテロップの認識を実現しました(図2)。
図2 複数色に対応したテロップの認識方式
効果
本技術により、従来認識ができなかった種類のテロップを含む映像に関しても、テロップを認識することが可能になりました(表1)。
今後
今後は、英語などの外国語への対応や、動きのあるテロップの認識などができるように機能拡張を進め、映像利活用ソリューションとして映像検索に本技術を活用していきます。
その他、家電の操作手順を説明する映像(映像マニュアル)や国内観光地の紹介映像などを、外国の方にも視聴してもらうために外国語化するケースが増えており、本技術と機械翻訳技術とを連携させた映像翻訳支援技術が活用できると考えています。
商標について
記載されている製品名などの固有名詞は、各社の商標または登録商標です。
以上
注釈
本件に関するお問い合わせ
株式会社富士通研究所
ソフトウェア&ソリューション研究所 言語・メディア研究部
044-754-2678(直通)
lm-pr@ml.labs.fujitsu.com
プレスリリースに記載された製品の価格、仕様、サービス内容、お問い合わせ先などは、発表日現在のものです。その後予告なしに変更されることがあります。あらかじめご了承ください。