PRESS RELEASE
2017年11月13日
株式会社島津製作所
富士通株式会社
株式会社富士通研究所
島津製作所と富士通、富士通研究所が共同研究の成果を発表
質量分析計の測定データ処理におけるAI活用に道筋
株式会社島津製作所(以下、島津製作所)と富士通株式会社(以下、富士通)、株式会社富士通研究所(以下、富士通研究所)は共同研究(注1)を通じて、島津製作所製の質量分析計で得られる測定結果の解析過程で不可欠な大量のデータ処理にAI(人工知能)を活用する技術を開発しています。これまでの研究成果を11月13~14日開催の「第11回メタボロームシンポジウム」で発表します。
ICT(情報通信技術)企業の富士通は、デジタル革新を実現するため、AIによる新規ビジネスの創出を探求していました。分析機器メーカーである島津製作所は、お客様から「煩雑なデータ解析を高い精度で自動化してほしい」という声を受けていました。双方の求めが一致し、昨年11月にデータ解析の自動化に向けたAIの共同研究を始めました。病気の早期発見技術の確立や食品の残留農薬測定など様々な分野の研究・品質管理に用いられる質量分析計は、感度および速度の向上によって得られるデータ量が膨大になっています。そのため「ピークピッキング」(注2)と呼ばれるデータ解析が、作業工程のボトルネックになっていました。完全な自動化は難しく、手動による調整がある程度必要なため、作業者の癖や改ざんが入り込む可能性があり、また作業者によって解析の確度にも差が出ていました。近年、医療や創薬の現場では、こうした属人性を排除した高精度な自動化が求められるようになっています。
3社はこの課題をAI活用によって解決するため、脳の神経細胞を模したニューラルネットワークであるディープラーニング(深層学習)の適用を検討してきました。その過程で直面したのが、1) 教師データ(注3)が十分存在しない、2) 分析機器が出力する数値をそのままディープラーニングネットワークに入力すると学習が進まない、という2つの問題でした。今回の共同研究において、島津製作所が「教師データの不足分を補うデータを生成する技術」を、富士通・富士通研究所が「分析装置の出力の特徴を画像に変換する技術」と「熟練作業者の解析ノウハウを学習する特徴抽出技術」を開発しました。これにより、生成した3万数千件の教師データをディープラーニングネットワークに学習させることができました。
熟練作業者の手動によるピークピッキング結果に対して、AIによる自動ピークピッキング結果は、誤検知率7%、未検知率9%(注4)でした。この結果から、自動ピークピッキングは、熟練作業者に比べて遜色ないレベルで使える可能性が示されたといえます。
島津製作所は2017年4月にスタートした中期経営計画において、予防・診断・治療、創薬分野で革新的な製品・サービスの創出を目指す「アドバンスト・ヘルスケア」領域に力を入れています。今回開発したAIの最初の活用先である「メタボロミクス」研究もその一環です。メタボロミクスは、代謝産物を検出し、その挙動を通じて細胞について調べる技術です。生理・病理機構の解明や疾患のバイオマーカー探索などでの利用が期待されています。
富士通は30年以上にわたり培ってきたAI(人工知能)に関する知見や技術を2015年11月に「FUJITSU Human Centric AI Zinrai(ジンライ)」として発表し、それ以降、様々な領域のお客様に向け、商品やサービスへのAIの実装を進めています。今回、ディープラーニングの新しい活用先として「メタボロミクス」に着目し、データ分析の自動化を実現すべくAIの開発を進めてきました。
島津製作所と富士通は、今回得られたAIを2018年に質量分析計用ソフトウェアに搭載することを目指しています。
以上
注釈
- 注1 共同研究:
- 大阪大学大学院工学研究科の福﨑英一郎教授、同大学院情報科学研究科の松田史生教授から研究者ニーズのインプットをいただきました。島津製作所と大阪大学は、メタボロミクスの分析技術開発を目的とした「大阪大学・島津分析イノベーション共同研究講座」を設置しています。
- 注2 ピークピッキング:
- 質量分析計で得られたデータ(グラフ)から波形(ピーク)の幅や高さを読み取る工程。
- 注3 教師データ:
- ディープラーニングネットワークの学習に使用するデータ。ネットワークに入力するデータと、それに対して期待される出力を組にしたものになります。本技術の場合は、分析機器の出力データと、それに対応する熟練者のピークピッキング結果を合わせたものになります。
- 注4 誤検知率7%、未検知率9%:
- 熟練作業者による手動ピークピッキング結果を「正解範囲」と呼び、AIによる自動ピークピッキング結果である「予測範囲」と比較した。正解範囲と予測範囲が50%以上重なっていると「対応した」、そうでない場合は「対応せず」と判断。「対応した」でピークは正しく検出されている一方、予測範囲が正解範囲に対応していない場合を「誤検出」、正解範囲が予測範囲に対応していない場合は「未検出」と定義した。誤検出率は、誤検出数 / (検出数+誤検出数)、未検出率は、未検出数 / (検出数+未検出数)として算出した。
AI技術に関するお問い合わせ
株式会社富士通研究所 人工知能研究所
044-754-2674
chromatogram-AI-press@ml.labs.fujitsu.com
プレスリリースに記載された製品の価格、仕様、サービス内容、お問い合わせ先などは、発表日現在のものです。その後予告なしに変更されることがあります。あらかじめご了承ください。