このページの本文へ移動
  1. ホーム >
  2. プレスリリース >
  3. 業界初!複雑な背景上で多色のテロップの認識に成功

PRESS RELEASE (技術)

2011年3月7日
株式会社富士通研究所
富士通研究開発中心有限公司

業界初!複雑な背景上で多色のテロップの認識に成功

膨大な数のテレビ番組やネット動画から見たいシーンを検索できる

株式会社富士通研究所(注1)と富士通研究開発中心有限公司(注2)は、多様な色や模様を持つ複雑な背景上で多色のテロップを文字認識する技術を開発しました。従来のように、テロップの背景を単一色に限定したり、テロップ文字の色を限定することなく、テロップを文字認識することができます。

本技術により、映像コンテンツからより多くの文字情報を抽出・認識することが可能になり、映像コンテンツへの自動索引付けに利用することで見たいシーンの検索が容易になります。

本技術の詳細は、3月10日から行われる「電子情報通信学会パターン認識・メディア理解研究会」にて発表いたします。


図1 映像中のテロップとその認識

開発の背景

近年、映像コンテンツの爆発的な増加により、映像コンテンツの検索技術が不可欠になってきました。テロップは映像コンテンツの内容に連動して表示されるため、映像のどの部分に必要な情報があるかといった検索にも利用できることから、映像の検索や索引付けに幅広く活用することができます。

課題

従来技術で認識可能な映像中のテロップは、(1)テロップの背景が単一の色で、テロップ文字列がそれと違う色の場合(単色もしくは複数色)、または(2)テロップの背景が複数色(複雑)でテロップ文字色が単色に限定されている場合、の2通りに限られていました。これは、背景の映像とテロップを正しく分離することが困難であったためです。しかし、近年の情報番組やバラエティ番組などではさまざまな映像に対して複数色をもつテロップが挿入されており、これらを高精度に認識することが課題となっていました。

開発した技術

今回開発した技術により、複雑な背景上で多色のテロップを認識することが可能です。色によって複数の画像に分解し、それぞれの分解画像に対して文字認識を行い、最適な文字列を選択してから統合することで、複雑背景上での多色のテロップの認識を実現しました(図2)。


図2 複数色に対応したテロップの認識方式

効果

本技術により、従来認識ができなかった種類のテロップを含む映像に関しても、テロップを認識することが可能になりました(表1)。

表1 従来技術と今回技術の対応表

今後

今後は、英語などの外国語への対応や、動きのあるテロップの認識などができるように機能拡張を進め、映像利活用ソリューションとして映像検索に本技術を活用していきます。

その他、家電の操作手順を説明する映像(映像マニュアル)や国内観光地の紹介映像などを、外国の方にも視聴してもらうために外国語化するケースが増えており、本技術と機械翻訳技術とを連携させた映像翻訳支援技術が活用できると考えています。

商標について

記載されている製品名などの固有名詞は、各社の商標または登録商標です。

以上

注釈

注1 株式会社富士通研究所:
代表取締役社長 富田達夫、本社 神奈川県川崎市。
注2 富士通研究開発中心有限公司:
董事長 佐々木繁、本社:中国北京市。

本件に関するお問い合わせ

株式会社富士通研究所
ソフトウェア&ソリューション研究所 言語・メディア研究部
電話 044-754-2678(直通)
メール lm-pr@ml.labs.fujitsu.com


プレスリリースに記載された製品の価格、仕様、サービス内容、お問い合わせ先などは、発表日現在のものです。その後予告なしに変更されることがあります。あらかじめご了承ください。