PRESS RELEASE (技術)
2016年10月17日
株式会社富士通研究所
会話音声からお客様の満足や不満を特定する技術を開発
顧客接点の様々な現場において応対の自動評価が可能に
株式会社富士通研究所(注1)(以下、富士通研究所)は、お客様と応対者の会話から、自動的にお客様が満足や不満を感じる箇所を特定する音声分析技術を開発しました。
コールセンターや銀行窓口などの顧客対応現場では、応対者の対応が企業イメージに直結するため、応対者への教育が重要視されています。そのため、従来、音声認識技術によりお客様との会話音声を文字に変換してお客様の満足感を把握する取り組みが行われてきましたが、同じ言葉でも話し方によって満足と不満のどちらも表現される場合があり、言葉の内容だけでは満足感を十分に把握できませんでした。今回、声の高さの平均や変化量だけでなく、話し始めや話し終わりといった複数の言葉をまたぐ音声データ中の相対的な位置における特有の変化を捉える手法によって、声の明るさを高精度に定量化することに成功し、これを応対評価と併せて機械学習を行うことで、会話中の満足や不満の箇所を人が聞いて判断した結果と比較して約70%の精度で自動的に特定する技術を開発しました。
本技術を活用した富士通株式会社(以下、富士通)および株式会社富士通エフサス(注2)(以下、エフサス)のコールセンターでの実証実験により、応対者のモニタリング評価やその結果のフィードバックなどの教育にかかる期間を約30%減と効率化できるほか、評価の客観性が高まるため評価者と被評価者双方の納得性が向上することを確認しました。
富士通研究所では今後、本技術を、富士通のAI技術「Human Centric AI Zinrai(ジンライ)」に組み込み、銀行窓口や小売店舗などコミュニケーションが重視される様々な現場での応対評価および応対者教育に活用できるよう、製品化を目指します。
開発の背景
コールセンターや遠隔教育サービスなどの遠隔コミュニケーションや、銀行窓口などの実社会でのコミュニケーションでは、応対者によるお客様への対応が企業イメージに直結することから、応対者への教育が重要視されています。これまで、お客様によるアンケート調査を集計して教育に活用することもありましたが、応対に対する総合的な評価しか得られないことが多く、応対者が会話の中でどこが悪かったかを把握するのは困難でした。また、お客様ごとの購買履歴の傾向分析やアンケート調査といったマーケティング活動のほかに、コールセンターのようなお客様の実際の声を元に、企業のサービスや製品に対する要望や改善点を、お客様のニーズとして抽出することも望まれています。そこで、顧客との直接の接点を持つ応対現場で集められたお客様との会話データから応対品質の評価や従業員教育、マーケティング戦略などに活用していくことが期待されています。
図1 音声分析を活用した応対者教育
課題
従来、音声認識技術を用いてお客様との会話音声を文字に変換して、お客様の感情を把握する取り組みなどが行われてきましたが、実際の会話は文法に従わずに話されるほか、周囲雑音の影響もあるため、誤って変換される場合があるなど、会話音声から音声認識で文字にすることに技術的な困難さがありました。加えて、人は同じ言葉を話していても、感情によって様々な話し方となるため、発言した言葉を文字に起こして分析する手法では、お客様の感情を正確に捉えることが困難でした。
開発した技術
今回、顧客応対現場の会話音声において、話し方に関する声の特徴に基づいて会話中に満足や不満と感じる箇所を自動的に特定する技術を開発しました。これにより、顧客応対者やサービス運用者は、応対内容の評価や応対方法の改善を迅速に行うことができます。開発した技術は以下のとおりです。
声の高さの変化パターンから「声の明るさ」を定量化する技術
明るい声とは一般的に、声のトーンが高く、また声のトーンや声量が大きく変化する性質があります。さらに、富士通研究所独自の研究により明るい声には話し始めや話し終わりの声の高さの変化に特有の性質があることが分かったため、声の高さの平均や変化の分析に加えて、複数の言葉をまたぐ音声データ中の相対的な位置における特有の変化を捉える手法によって、声の明るさを高精度に定量化することに成功しました。(図2)
図2 本技術による明るさ定量化
また、声の印象として知覚される「明るさ」と「満足感」には高い相関関係があるため、富士通研究所独自の調査結果に基づく変換式により、定量化した声の明るさから、会話中の満足感を定量化(図3)しました。これと応対評価の結果と合わせて、機械学習を用いて満足や不満の判定閾値を学習することで、自動的に会話中の満足・不満箇所を特定する技術を開発しました。これにより、お客様が現場の応対評価の結果を用いて、現場ごとに判定基準をカスタマイズすることも可能となります。
図3 本技術の構成
効果
本技術により、顧客応対現場の会話音声に対して、満足や不満の箇所を人が聞いて判断した結果と比較して約70%の精度で推定することができました。これにより、顧客応対者の教育において、結果を受け取った本人が会話の中でどの部分が良かったのか悪かったのかを理解しやすくなり、効率的な応対スキルの向上に繋がります。
本技術については、富士通およびエフサスのコールセンター3拠点において、本技術に加え、お客様の発話にかぶせて話す、間が長すぎるといった応対者の発声の問題箇所を特定する技術を導入した評価ツールによる実証実験を実施しました。その結果、応対者のモニタリング評価やその結果のフィードバックによる教育にかかる期間が30%減と大幅に効率化されるほか、評価の客観性が高まることで評価者・被評価者の双方の納得性が大きく向上することを確認しています。
本技術を活用することで、コールセンターを含む様々な顧客接点の現場において、応対スキル向上のための教育を効率化して、お客様の満足感の向上に繋げることが期待できます。
今後
富士通研究所は、本技術を音声対話による自動応答サービスなど、富士通のデジタルソリューションやサービスに組み込むことで、お客様が不満と感じた場合の臨機応変な対応や、お客様が提供する商品の中で満足感の高い機能の情報を抽出しマーケティング分析に活用する、といった取り組みを進めていきます。まずは、2016年度末より、富士通およびエフサスでのコールセンター関連サービスで商品化予定です。
また、富士通研究所は、本技術を富士通のAI技術「Human Centric AI Zinrai(ジンライ)」の「感性メディア処理技術」を強化する技術として利用できるようにすることで、2018年度には銀行窓口や小売り・医療現場、教育現場など、様々な現場での活用に向け、製品化を目指します。
商標について
記載されている製品名などの固有名詞は、各社の商標または登録商標です。
以上
注釈
本件に関するお問い合わせ
株式会社富士通研究所
メディア処理研究所
044-874-2489(直通)
speech-analytics-cs@ml.labs.fujitsu.com
プレスリリースに記載された製品の価格、仕様、サービス内容、お問い合わせ先などは、発表日現在のものです。その後予告なしに変更されることがあります。あらかじめご了承ください。