PRESS RELEASE (技術)
2012年8月21日
株式会社富士通研究所
業界初!ビッグデータを簡単に利活用するための分析シナリオを自動的に推薦する技術を開発
専門家が創出した分析シナリオを再利用することで、簡単に分析・予測業務の実施が可能に
株式会社富士通研究所(注1)は、業界で初めて、データ分析の専門家が創出した分析シナリオ(テンプレート)の中から、分析対象データの内容や特性に合わせて、適応可能なテンプレートや、組み合わせて利用可能な追加データを自動的に推薦する技術を開発しました。
近年、ビッグデータを機械学習やマイニングなどの技術を用いて分析し、その結果を業務や経営における意思決定に活用する「ビッグデータ利活用」への期待が高まっており、データを収集・蓄積・分析するための基盤や技術、ツールの整備が急速に進んでいます。一方、ビッグデータの利活用を推進するためには、業務・業種に関するビジネス知識や統計・マイニングに関する分析知識を兼ね備えた人材が必要であり、そのための人材育成・確保が業界共通の大きな課題となっています。
今回開発した分析テンプレート自動推薦機能では、データ分析の専門家が創出した「どのようなデータを組み合わせて利用するのか」「分析結果をどのように解釈・活用するのか」といった分析シナリオを、分析テンプレートとして蓄積・再利用します。分析対象データの内容や特性に合わせて、適用可能な分析テンプレートや追加データを自動推薦することができるため、蓄積された分析テンプレートを活用することにより、高度な知識やノウハウを持っていなくても、簡単に分析・予測業務を実施することが可能となります。
本技術は、富士通株式会社よりリリース予定の分析ソリューション構築のためのミドルウェア「Interstage Business Analytics Modeling Server」に順次搭載されていく予定です。
開発の背景
近年、大量データに対して、機械学習やマイニングなどの分析技術を適用し、その結果を業務や経営における意思決定に反映するビッグデータ利活用への期待が高まっています。従来からある業務データに加えて、ソーシャルメディアやセンサーデータといった大量かつ多様な非構造データを、高頻度・リアルタイムに収集・蓄積・分析するための基盤や技術、ツールの整備が急速に進んでおり、今後は、ビッグデータをいかにビジネスに活かすかが、ビジネスの拡大と競争優位を実現するための大きな鍵になってきます。
課題
ビッグデータからビジネスに有用な知見を得るためには、データ分析のための基盤・技術・ツールに加えて、「どのようなデータを組み合わせて利用するのか」「分析用のデータをどのように加工するのか」「どのような技術・ツールを適用するのか」「分析結果をどのように解釈・活用するのか」といった分析シナリオが重要です。このような分析シナリオを創出するためには、業務・業種に関するビジネス知識と統計・マイニングに関する分析知識を兼ね備えた人員・チームが不可欠であり、ビッグデータ利活用を推進する人材の育成や確保が、業界共通の大きな課題となっています。
開発した技術
分析プロセスをテンプレートとして設計・蓄積することにより、分析の専門家が持つ高度な知識やノウハウを簡単に再利用することが可能となる分析テンプレート自動推薦機能を開発しました。分析対象データの内容や特性に合わせて、適用可能な分析テンプレートや追加データを自動推薦することができるので、蓄積された分析テンプレートを活用することにより、高度な知識やノウハウを持っていなくても簡単に分析業務を実施することが可能です(図1)。
図1 分析テンプレート自動推薦による分析シナリオの再利用
開発した技術の特徴は以下の通りです。
- データモデルに基づく分析テンプレート管理
本技術では、分析プロセス(分析の処理手順)を、データ加工や分析処理を部品化した「分析部品」を組み合せた「分析テンプレート」として設計していきます。この分析テンプレートは、「どのようなデータを組み合わせて利用するのか」「データをどのように加工するのか」「どのような技術・ツールを適用するのか」「分析結果をどのように解釈・活用するのか」といった、分析の専門家のノウハウが、分析部品の組み合わせや分析部品のパラメーターとして表現されたものになります。本技術では、分析テンプレートの作成の際に、業務・業種カテゴリーや分析目的といったメタデータや、分析対象データの内容や特性を標準的に記述する「データモデル」と対応付けることで、分析テンプレートの自動推薦を実現しています(図2)。
図2 データモデルに基づく分析テンプレート管理 - データプロファイリングに基づく分析テンプレート自動推薦
新規に分析を始める場合には、業務・業種カテゴリーや分析目的などのメタデータを用いて、分析テンプレートを推薦(絞り込み)することも可能ですが、この方法では、近年増えてきている、業際領域や複合業務に関する分析課題や、分析開始時点では分析目的が明確になっていないケースなどは対応することができません。そこで、本技術では、これまで分析の専門家が対応してきた上記のようなケースに対応するために、分析対象データの内容や特性に合わせて分析テンプレートを自動推薦する新しい仕組みを実現しています(図3)。
分析対象データを指定すると(図3[1])、データプロファイリング技術を利用して、データの内容(各データ項目の意味)や特性(データ量・分布などの性質)を抽出・判定します(図3[2])。このプロファイリングされた内容・特性を、分析テンプレートと対応付けられているデータモデルとマッチングすることで、分析対象データに適用可能な分析テンプレートの自動推薦を実現しています(図3[3])。
図3 データプロファイリングに基づく分析テンプレート自動推薦 - 組み合せて利用可能な追加データの提示
ビッグデータの利活用においては、異種・多様なデータを組み合せて複合的に分析することにより、単一のデータからでは分からない隠れた因果関係(影響)を発見・分析するということがよく行われています。このようなデータの組み合わせを見つけるためには、分析の専門家のノウハウと試行錯誤が必要となっていました。
本技術では、分析テンプレートの自動推薦の際に、指定された分析対象データのみで利用することが可能な分析テンプレートだけではなく、別のデータを追加することで適用可能になる分析テンプレートの探索を行います。この「別のデータ」を提示することで、異種・多様なデータの組み合せパターンを見つけることが可能となっています(図4)。
図4 組み合せて利用可能な追加データの提示
効果
本技術により、分析の専門家のノウハウを再利用し活性化することが可能となります。データプロファイリングによる自動推薦により、分析対象データさえあれば、業務・業種や分析に関する深い知識やノウハウがなくても、
- 分析対象データから分析テンプレートを探して適用
- 組み合せ可能なデータを追加して再適用
といった分析プロセスをスパイラルに回していくことが可能であり、分析目的や利用データを拡大しながら、新しい分析アプリケーションの構築や利用を創出していくことが可能となります(図5)。
図5 分析プロセスのスパイラル実行
今後
現在、本技術を実装した分析システムを用いて、流通・産業分野における顧客管理、マーケティング、レコメンデーション、品質管理、リスク管理などの業務に適用可能な分析部品や分析テンプレートの開発を行っており、これまでに研究所が開発した「市場不具合の予兆発見」「リスクシナリオ分析」などの独自技術をベースとした分析シナリオを実行可能となっています。今後は、業種・業務の範囲を拡大し、実問題への適用を進めながら、分析部品および分析テンプレートの整備を進めていく予定です。
本技術は、富士通株式会社よりリリース予定の分析ソリューション構築のためのミドルウェア「Interstage Business Analytics Modeling Server」に順次搭載されていく予定です。
商標について
記載されている製品名などの固有名詞は、各社の商標または登録商標です。
以上
注釈
本件に関するお問い合わせ
株式会社富士通研究所
ソフトウェアシステム研究所 ソーシャルソリューション研究部
044-754-2674(直通)
ipf-staff@ml.labs.fujitsu.com
プレスリリースに記載された製品の価格、仕様、サービス内容、お問い合わせ先などは、発表日現在のものです。その後予告なしに変更されることがあります。あらかじめご了承ください。