PRESS RELEASE (技術)
2014年1月15日
株式会社富士通研究所
暗号化したまま検索が可能な秘匿検索技術を開発
16,000文字の検索を1秒で実現しゲノム研究など機密データの検索に応用可能
株式会社富士通研究所(注1)は、暗号化された文字列データを暗号化したまま検索することができる秘匿検索技術を開発しました。事前の検索キーワードの登録が不要で、暗号化された文字列データから任意の文字列を検索することが可能です。
今回、機密データを秘匿しながら演算できる準同型暗号(注2)をベースに、すべての文字列データに対して、暗号化された検索キーワードが一致するかどうかを高速に一括判定する方式を、新たに開発しました。これにより、16,000文字の検索が1秒で可能となります。
本技術では、文字列データや検索キーワードだけでなく、検索がヒットしたかどうかも秘匿するため、アウトソーシングで機密データの検索を安全に行うことができます。特にDNA・生化学・医療・教育など、プライバシー性の高い情報を暗号で安全に守りながら検索可能となります。
本技術の詳細は、2014年1月22日(水曜日)に米国カリフォルニア州マウンテンビューで行われる展示会Fujitsu North America Technology Forum 2014(NATF 2014)、ならびに、2014年1月21日(火曜日)から鹿児島で開催される暗号と情報セキュリティシンポジウムSCIS2014(電子情報通信学会情報セキュリティ専門委員会主催)で発表します。
開発の背景
近年、クラウド環境やビッグデータ分析などの進展を背景に、健康管理などの個人に特化した新しい情報サービスが登場していますが、一方で個人のプライバシーデータ漏えいなどの問題も増加しています。富士通研究所では、これまでもプライバシーを保護すると同時に情報を活用するための技術開発を継続的に進めてきました。
データを秘匿しながら処理する技術として、暗号化したまま統計演算が行える準同型暗号などの暗号技術がありますが、クラウド環境上でさらに情報を利活用するためには、統計演算だけでなく暗号データのまま安全に検索処理できる技術が必要です(図1)。
図1 クラウドを利用した秘匿文字列検索
課題
従来、文字列を暗号化したまま検索する方法はいくつかありましたが、あらかじめ検索キーワードを登録しておく必要があり、自由に検索できないという問題がありました。また、検索結果が暗号化されず検索サーバに漏れてしまう、処理に時間がかかるなど、実用化に向けたいくつかの課題がありました。
開発した技術
今回、すべての文字列を暗号化した状態で検索する技術を開発しました。暗号化したまま統計処理などの演算が行える準同型暗号の技術(注3)をベースに、一回の処理で複数の暗号演算を同時に行えるように改良することで、文字列全体に含まれる検索キーワードの一致判定を一括して行うことができます。準同型暗号の性質により検索キーワードの登録が不要で、検索開始から結果出力まで秘匿され、16,000文字の秘匿検索が1秒以内で行えるようになります。今回開発した技術の特長は以下のとおりです。
- 暗号化文字列の一致判定を行う技術により、検索キーワードの事前登録が不要に
準同型暗号の秘匿演算機能を拡張し、暗号化した状態で文字列の一致判定を実現しました。暗号化されたデータと検索キーワードとの一致判定を暗号化したまま行えるため、検索キーワードを事前に登録せずに検索することができます。また、準同型暗号を利用することで検索開始時点から結果出力まで暗号化状態を保つことができます。検索キーワードがヒットしたかどうかも、結果を復号する鍵を持つ人にしかわからず、安全性が向上します。
- 一括計算による、検索処理の高速化
これまでは文字列が一致するかの判定を一文字ずつずらしながら行っていましたが、全体を一括して計算する手法を開発することにより、秘匿検索処理を飛躍的に高速化しました(図2)。文字列データ、検索キーワードが16,000文字以下の場合に1秒以内で検索可能です(図3)。
図2 複数文字列の異なる部分を同時に計算する仕組み
図3 扱う文字数と秘匿演算処理時間
効果
今回開発した技術を用いることで、暗号化されたデータと検索キーワードだけでなく、検索結果も暗号化しながら任意のキーワードで高速に検索することが可能になります。例えば、本技術をDNAに含まれる塩基配列の検索に応用することで、患者のDNA情報を暗号化で秘匿したまま、特定の配列パターンが含まれているかどうかを調べることが可能になります(図4)。また様々な病院から集めた病歴や塩基配列をすべて暗号化したまま新しい分析結果を得られ、新薬の研究開発の効率化が期待できます。特に病歴などはプライバシーに深く関わるデータであり、今回の技術を使うことで安全に検索を行うことが可能になります。これら生化学・医療分野以外にも、例えば複数の教育機関が合同で成績情報を分析するなど、プライバシー性の高いデータの検索をより安全に行うことが可能となり、これまで機密データ保護が課題となっていた様々な利用シーンに適用できます(図5)。
図4 秘匿文字列検索技術のオーダーメイド医療への応用
図5 秘匿検索技術の想定適用分野
今後
富士通研究所では本技術について、2015年の実用化を目指して実証実験などを進めていきます。また、今回開発した技術を情報化社会の安心安全を守るためのキーテクノロジーとして広く適応させ、プライバシー情報を安心して利活用できる便利な社会の構築を目指します。
商標について
記載されている製品名などの固有名詞は、各社の商標または登録商標です。
以上
注釈
- 注1 株式会社富士通研究所:
- 代表取締役社長 富田達夫、本社 神奈川県川崎市。
- 注2 準同型暗号(じゅんどうけいあんごう):
- データを暗号化したまま、加算や乗算などの演算が可能な暗号技術。演算した結果も暗号化されているため、演算結果を知るには秘密鍵が必要となる。
- 注3 暗号化したまま統計処理などの演算が行える準同型暗号の技術:
- 世界初!暗号化したまま統計計算や生体認証などを可能にする準同型暗号の高速化技術を開発 (2013年8月28日 プレスリリース)。
本件に関するお問い合わせ
株式会社富士通研究所
ソーシャルイノベーション研究所 セキュアコンピューティング研究部
044-754-2681(直通)
fcc-query@ml.labs.fujitsu.com
プレスリリースに記載された製品の価格、仕様、サービス内容、お問い合わせ先などは、発表日現在のものです。その後予告なしに変更されることがあります。あらかじめご了承ください。