Fujitsu The Possibilities are Infinite

 

PRESS RELEASE (サービス)

2006-0030
2006年2月21日
富士通株式会社
富士通フロンテック株式会社

世界初! HSV空間を利用した「リアルカラー認識技術」を開発

~人間の感覚に近い色識別を行い、カラー帳票上の手書き文字の高精度な認識が可能に~

富士通株式会社(以下、富士通)および富士通フロンテック株式会社(代表取締役社長 宮澤達士、本社 東京都稲城市)は、世界で初めて、人間の感覚に近い「HSV(注1)空間」による色識別を行うことで、カラー帳票に記載された手書き文字を高精度に認識する「リアルカラー認識技術」を開発しました。

本技術を適用することで、自動文字認識ができる帳票の種類が従来に比べて飛躍的に増え、データエントリーを伴う事務処理を大幅に効率化することが可能となります。また「e-文書法(注2)」に対応して文書の電子化を行う際、重要となる検索用キーワードの自動抽出にも応用可能です。

なお、本技術は国内はもとより欧米・アジア各国においても両社から特許を申請中です。

今回開発した技術は、これまで困難であった、カラー印刷帳票に記載されている手書き文字の認識を行うためのものです。

人間の感覚に近い、「HSV空間」を使った色識別を行うことで、微妙な色彩変化を捉え、手書き文字が枠線にかかっていても正確に抜き出すことができ、文字認識率を大幅に向上させるものです。

《リアルカラー帳票認識による文字抽出》

リアルカラー帳票認識による文字抽出

開発の背景

文字認識技術(OCR)は、銀行の為替・入出金伝票の入力処理など、大量のデータエントリーを行う業務の効率化に活用されていますが、現在は、主に帳票の枠線の色や文字の色・紙の背景色などに制約を設けたOCR専用帳票が対象となっています。

しかし近年では、e-文書法の施行を受け、専用帳票以外の、これまで業務で使われてきた多種多様なカラー帳票についてもOCR処理のニーズが高まっています。特に大量のカラー帳票を電子保存する際には、いかに検索キーワードを自動抽出し、その認識精度を高めていくかが、効率化のポイントとなります。

現状の課題

現在主流の以下のカラー帳票文字認識技術では、作業効率・文字認識率の両面で充分な対応が困難といえます。

  1. グレースケール(注3)方式
    原理カラーイメージをグレースケールに変換し、濃淡から枠線を自動判別。
    課題点・枠線に掛かった文字の抽出が難しく、文字認識率が低い。
    ・階調差を意識する必要があるため、帳票設計の自由度が低い。
  2. マルチドロップアウト方式
    原理ドロップアウトする色(複数)をあらかじめシステムで指定しておき、認識する文字を抽出。
    課題点・ドロップアウト色の指定が煩雑で作業効率が低い。
    ・中間色指定が困難なため、正確な文字イメージ抽出ができない場合がある。
    ・印刷色が微妙に異なる場合に対応が難しい。

開発した技術

今回、「カラー帳票判別ALR-C」と「カラー文字認識ACR-C」という、HSV空間を適用した2つの中核技術を新たに開発しました。両技術を組み合わせることにより、色の違いを人間の視覚に近い形で正確に判断し、ノイズが少ない文字の二値(注4)画像を作成します。

また、本技術では、帳票デザインを登録する帳票定義において、ドロップアウト色の指定が全く必要ないため、運用負荷低減が可能です。

  1. カラー帳票判別ALR-C(Adaptive Layout Recognition for Color forms)

    カラー帳票のフォーマットを認識し、文字認識項目の位置を特定する技術です。文字認識項目の位置を正確に特定することで認識率を向上させます。

    《ALR-Cによる帳票判別》

    カラー帳票を読み取り、罫線枠やタイトルから帳票種別を判別し、文字認識するエリアを正確に特定します。HSV空間認識により、背景色と同系統の色で印刷された罫線でも、正確に罫線枠を抜き出すことができます。

    (例) 読み取ったカラー帳票が掲載枠やタイトルから「富士通デパートカード入会申込書」を認識し、文字の認識エリアを正確に特定。
  2. カラー文字認識ACR-C(Adaptive Character Recognition for Color forms)

    カラー帳票の枠線にかかった文字を分離し、文字だけのイメージを作り出す技術です。

    《ACR-Cによる認識》

    ACR-Cによる認識

    《従来のグレースケール技術》

    従来のグレースケール技術

効果

  1. 認識率を大幅に向上

    OCR専用に設計されていない一般帳票での文字認識率を向上させます。データエントリー業務、e-文書対応ファイリングシステムなどに組み込むことにより、業務効率化・精緻化を実現します。

    《カラー帳票における帳票・手書き数字の認識率》


    リアルカラー
    帳票認識技術
    従来の認識技術
    グレースケール認識二値認識
    帳票判別率99%90%70%
    文字認識率
    (項目単位)
    ドロップアウト文字枠98%95%95%
    薄い色の文字枠98%95%50%
    濃い色の文字枠98%60%50%
    (当社従来比)
  2. 帳票設計・作成コストの削減

    現在使用している帳票をOCR専用に作成しなおすことなく、OCRシステムに移行できるため、帳票設計・新規作成に関わるコストを削減できます。

本技術を組込む富士通のパッケージソフトウェア

富士通では、本技術を以下のソフトウェアに組み込み、随時出荷開始します。

  1. 「セキュアファイリングAE」(e-文書関連業務)

    e-文書法に対応し、帳票類を電子保存する業務パッケージです。電子保存する帳票をイメージスキャナなどで読み取ると同時に、検索用キーワードを抽出し文字認識を行います。本技術を用いることによりカラー帳票から正確にキーワードを文字認識することができ、電子化作業の効率が大幅に向上します。

  2. 「ITF(Image Transaction Flow)」(銀行窓口業務)

    窓口の専用端末から伝票などをイメージで読み取り文字認識を行った上で、事務処理センターへデータ転送することにより、営業店後方業務の削減、センターでの集中処理を実現し、業務の効率化が可能となります。また紙の回付をなくし、イメージデータをワークフロー上で回付することにより、ローコストでの運用も実現します。

  3. 「AutoENTRY」(汎用OCR業務)

    企業におけるあらゆる文字認識処理の需要に応える汎用パッケージであり、銀行などの事務処理センターでの伝票入力、保険契約や物品購入などの申込書入力、住所変更などの諸届入力といった業務に活用されています。本技術を用いることで大幅に文字認識率が改善され、業務効率が向上します。

販売目標

2008年度末までに3万本。(本技術の適用製品の累計)

商標について

記載されている製品名などの固有名詞は、各社の商標または登録商標です。

以上

注釈

  注1 HSV:
「色相(Hue)」、「彩度(Saturation)」、「明度(Value)」の3つの要素。
  注2 e-文書法:
正式には、「民間事業者等が行う書面の保存等における情報通信の技術の利用に関する法律」「民間事業者等が行う書面の保存等における情報通信の技術の利用に関する法律の施行に伴う関係法律の整備等に関する法律」。民間企業の法定文書保管について電子化を推進するために、2005年4月に施行。
  注3 グレースケール:
白・黒とその中間色であるグレーによる階調表現で濃淡を表したイメージ。
  注4 二値:
白と黒のニ色で表したイメージ。

関連リンク

本件に関するお問い合わせ

ユビキタスシステム事業本部 ビジネス推進統括部 プロダクトビジネス推進部

電話: 03-6252-2676(直通)
E-mail: financial-systems@fujitsu.com


プレスリリースに記載された製品の価格、仕様、サービス内容、お問い合わせ先などは、発表日現在のものです。その後予告なしに変更されることがあります。あらかじめご了承ください。