PRESS RELEASE (技術)
2008-0240
2008年11月19日
株式会社富士通研究所
富士通研究開発中心有限公司
CSR(Corporate Social Responsibility)の積極的な推進が企業に求められる中、企業や製品の風評情報などを迅速に把握し対策を行なうことで、ブランドイメージの低下や社会的信頼性の失墜による経営危機を避けるための風評リスク管理の重要性が高まっています。特に、Web上における風評は、不特定多数の人々に即座に伝播するため、風評に対する対応の遅れなど、リスク管理に失敗した場合の経営ダメージは甚大になりかねません。このように、Web上の風評をいかに迅速に検知するかが、風評リスク管理における最重要課題の1つとなりつつあります。
CGM (Consumer Generated Media)分析サービス(注3)を利用した従来の風評検知サービスでは、以下の課題がありました。
従来技術では、収集したデータを分析するために、インデックス生成(注4)などの前処理が必要であり、風評が書き込まれてから検知するまでの間に最短でも数十分から数時間、場合によっては1日以上を要していました。
風評の検知には、風評の有無を知りたい企業名または製品名などと、風評を表現する「苦情」や「故障」といった言葉の出現パターンである風評パターンを用います。従来技術では、風評パターンの数が増えると検知時間が増大するという特性があるため、数十万を越える大量かつ多様な風評パターンを漏れなく高速に検知することが困難で、一度に検知できる風評パターン数にも制限がありました。
上記の課題を解決するために、テキストストリーム(注5)に対して複数の風評パターンを一括して検知する独自技術を開発し、リアルタイムに大量で多様な風評を検知することに成功しました。本技術の特長は以下の通りです(図1)。
今回開発した検知技術では、Web上に次々と書き込まれる記事に対して、インデックス生成などの前処理を一切行なわず、即座に検知処理を適用することにより、登録された風評パターンにマッチした記事をリアルタイムに検知します。これにより、風評が書き込まれてから検知するまでに要する時間を大幅に短縮することができます。
本技術では、性能が入力パターン数に依存せず、高速に動作するパターンマッチングアルゴリズム(注6)を用いて、大量かつ多様な風評パターンを一括して高速に検知します。また、任意文字指定(ワイルドカード)や文字間隔指定など、従来は高速な検知が困難であった複雑なパターンも、性能を落とさず高速に検知できます。これにより、企業や製品の風評記事を、漏れなく高速に検知することができます。
|
実証実験では、10万件もの大量の風評パターンに対して、Web記事1件あたり0.1ミリ秒未満のリアルタイムで検知(Intel®Xeon® 3.8ギガヘルツ機使用時)できることを確認しました。また、風評パターン数を1件から10万件に増やした場合の性能劣化は0.2%未満であり、検知時間は風評パターン数に依存せず一定であることを確認しました。
本技術により、企業が検知したい大量かつ多様な風評記事を、リアルタイムに検知することが可能となります。また、Web上のスパムブログ発見や犯罪予告検知などへの応用も期待できます。
富士通(中国)信息系統有限公司(注7)のCGM解析サービスへの適用を今年度中に行う予定です。また、風評情報のインフルエンサー(注8)を早期に発見する取り組みも開始します。
記載されている製品名などの固有名詞は、各社の商標または登録商標です。
以上
株式会社富士通研究所
ソフトウェア&ソリューション研究所 ナレッジテクノロジ研究部
電話: 044-754-2652(直通)
E-mail: rumor-detection@ml.labs.fujitsu.com
プレスリリースに記載された製品の価格、仕様、サービス内容、お問い合わせ先などは、発表日現在のものです。その後予告なしに変更されることがあります。あらかじめご了承ください。