PRESS RELEASE (技術)
2018年10月31日
株式会社富士通研究所
The Insight Centre for Data Analytics
Fujitsu Ireland Ltd.
遺伝子疾患のメカニズム解明につながる生物化学反応を予測する技術を開発
未知の化学反応を大量に予測でき、新薬開発や精密医療を推進
株式会社富士通研究所(注1)(以下、富士通研究所)、アイルランドのデータ・アナリティクス研究機関The Insight Centre for Data Analytics(注2)(以下、Insight)、Fujitsu Ireland Ltd.(注3)の3者は、従来では予測できなかった未知の化学反応に対し、従来比約2倍となる大量予測を可能とする技術を開発しました。
がんを含む重篤な疾患では、タンパク質間の化学反応であるリン酸化反応に異常があることが多く、リン酸化反応を解明することで効果的な治療が期待できます。しかし、現状では一部のリン酸化反応しか判明していないため、未知のタンパク質の組合せが起こすリン酸化反応を大量に予測することが課題でした。
今回、タンパク質の相関関係が俯瞰的に把握できるナレッジグラフ(注4)を構築することで、リン酸化反応が予測される新たなタンパク質間の関係性を確認することが可能になります。これにより、創薬の研究現場での活用や、個々に合わせた精密医療(注5)への応用が期待でき、医療の高度化に貢献します。
開発の背景
体内では、細胞内の様々なタンパク質が化学反応を通じて情報をやり取りすることで生命機能が維持されています。近年、がんなどの重篤な疾患の多くは、タンパク質間の代表的な化学反応であるリン酸化反応の異常に原因があることが分かってきました。リン酸化反応の異常を修復する医薬品が開発できれば、より効果的な治療が可能となりますが、現在明らかになっているリン酸化反応はまだ少なく、未知のリン酸化反応の発見と、それによるリン酸化反応データの充実が求められています。
課題
リン酸化反応とは、タンパク質を構成しているアミノ酸に、別のタンパク質によってリン酸基が付与される化学反応であり、その発見には、どのタンパク質の組み合わせでリン酸化反応が起こるかを生物学実験によって確認する必要があります。しかし、タンパク質の組み合わせだけでも約80万通り以上と大規模となり、かつ生物学実験には膨大なコストと時間がかかることから、あらかじめ確度が高いタンパク質の組合せを予測する必要があります。
リン酸化反応が起きるかどうかは、タンパク質を構成するアミノ酸配列の構造に依存することが知られており、既知のリン酸化反応が起こるアミノ酸配列の構造を学習することで、新たなリン酸化反応を予測するAI技術はすでに活用されています。しかし、この技術ではアミノ酸配列の構造が既知のリン酸化反応と類似するものは予測できますが、既知のリン酸化反応とはアミノ酸配列の構造が大きく異なるものは予測することができませんでした。
図1. 従来のAI技術
開発した技術
近年の医学分野の研究から、リン酸化反応を起こしたタンパク質が別のタンパク質を連鎖的にリン酸化する現象(連鎖情報)が、新たなリン酸化反応の有無を予測する手がかりになるという知見に基づき、今回、アミノ酸配列の構造情報に加えて、連鎖情報をナレッジグラフ上に表現しています。これにあたり、化学反応の複雑なパターンを、ナレッジグラフが捉えやすく高精度な予測結果をだすように最適化された属性にして表現し、ナレッジグラフの線に属性を付与する技術を開発しました(特許出願済)。これまで1回の連鎖でしか確認できなかったタンパク質間の関係を、リン酸化反応のつながり(連鎖情報)を総合的に表現することで、全体から見たそれぞれのタンパク質の位置づけを明確にし、未知の関係性を予測することができるようになります。
図2. ナレッジグラフを使ったリン酸化反応予測のイメージ
拡大イメージ
効果
本技術を評価用データ(注6)を用いて検証したところ、リン酸化反応(9,802個)を学習して新たなリン酸化反応を予測した結果、11,581,940個のリン酸化反応数が算出され、アミノ酸配列の構造をAIで学習する従来技術とくらべ、予測の精度を大きく変えずに約2倍の大量のリン酸化反応予測が可能になりました。
また、本技術を用いて予測したリン酸化反応が実際の生物内で起こりうることを検証するため、共同研究先のアイルランド生物学研究機関Systems Biology Ireland (注7)が質量分析装置と抗体を用いて実証を行いました。今回、生物学の専門家が重要と考える、がんに関するタンパク質のリン酸化反応の予測結果をいくつかピックアップして検証実験を行ったところ、これまでの技術では予測できなかった8個を含む9個のリン酸化反応を確認することができました。
本効果について、システム生物学研究の世界的権威であり、Systems Biology Irelandのコルチ(Kolch)所長は、「富士通研究所およびInsightのナレッジグラフ技術と、Systems Biology Irelandの生物学ネットワークの知識を統合し、新たな計算方法を開発することができました。これは未知のリン酸化部位を着実に発見できる技術であり、新薬開発と精密医療への大きな一歩になると期待しています。」と述べました。
今後
本技術で新たに予測したリン酸化反応データを他の生物医学データと合わせることで、疾患原因(リン酸化反応の異常)から疾患発症までの化学反応の流れが把握できるようになることが期待され、創薬における有用な情報として研究現場に提供できるようになります。一方、がんなどの薬は患者によって効果が大きく異なりますが、本技術により、将来、薬の効果の個人差を解明し患者個人に適した治療の推進に貢献できるものと考えています。
富士通研究所、Insight、Fujitsu Ireland Ltd.は、生物医学データをナレッジグラフ上で処理するための技術のさらなる高精度化を進め、富士通株式会社(以下、富士通)で取り組んでいる生物医学系のプロジェクトへの展開を2018年度に行います。さらに、富士通のAI技術「FUJITSU Human Centric AI Zinrai」などに採用していくことにより、生物医学分野ビジネスを加速していく予定です。
商標について
記載されている製品名などの固有名詞は、各社の商標または登録商標です。
以上
注釈
- 注1 株式会社富士通研究所:
- 本社 神奈川県川崎市、代表取締役社長 佐々木繁。
- 注2 The Insight Centre for Data Analytics:
- 所在地 アイルランド ゴールウェイ、CEO オリバー・ダニエル。アイルランド科学財団が運営する、ヨーロッパ最大級のデータ・アナリティクス研究機関。Insightはアイルランド国内に複数の拠点を持つが、今回の発表はアイルランド国立大学ゴールウェイ校内の拠点との共同研究に関するものである。
- 注3 Fujitsu Ireland Ltd.:
- 本社 アイルランド ダブリン、CEO トニー・オマリー。
- 注4 ナレッジグラフ:
- 意味付けされたグラフ構造の知識ベース。様々な情報源から収集した情報を意味を表す関係性でつなぎ合わせたもの。
- 注5 精密医療:
- 遺伝情報、生活環境やライフスタイルにおける個人の違いを考慮し、疾病の治療や予防を行うという新しい医療。
- 注6 評価用データ:
- リン酸化反応データベースPhosphoSitePlus(*)と、タンパク質配列データベースUniProtを活用。
(*)Hornbeck PV, Zhang B, Murray B, Kornhauser JM, Latham V, Skrzypek E PhosphoSitePlus, 2014: mutations, PTMs and recalibrations. Nucleic Acids Res. 2015 43:D512-20. - 注7 Systems Biology Ireland:
- 所在地 アイルランド ダブリン、所長 ウォルター・コルチ。がんに対する新しい治療戦略の開発に重きを置いた、細胞情報伝達の研究を専門とするシステム生物学研究機関。
関連リンク
- 富士通とInsight、システム生物学研究機関のSystems Biology Irelandと共同研究を開始(2017年3月8日 プレスリリース抄訳)
本件に関するお問い合わせ
株式会社富士通研究所
人工知能研究所 ナレッジテクノロジープロジェクト
044-754-2652(直通)
kg-query@ml.labs.fujitsu.com
プレスリリースに記載された製品の価格、仕様、サービス内容、お問い合わせ先などは、発表日現在のものです。その後予告なしに変更されることがあります。あらかじめご了承ください。