PRESS RELEASE (技術)
2015年1月28日
株式会社富士通研究所
ネットワーク障害の影響を短時間で特定できる運用効率化技術を開発
非専門家でも10秒以内に影響範囲を特定可能
株式会社富士通研究所(注1)は、クラウドのネットワークに障害が発生した時に、その障害によって影響を受けた仮想システムを専門家以外でも10秒以内で特定できる技術を開発しました。
従来、ネットワーク障害の影響を受けた仮想システムを特定するためにネットワークの専門家がサーバ運用者と連携し、仮想システムと物理ネットワークの関係を調査する必要がありました。大規模なクラウド環境においては、この作業に3時間以上かかる場合があります。
今回、物理サーバ間の通信経路情報と通信が発生する仮想サーバの組み合わせ情報を自動的に生成し、各仮想サーバがいずれの物理サーバに収容されているかという関係に基づいて仮想システムと物理ネットワーク通信経路の関係を自動的に解析することで、障害の影響を受けた仮想システムを数秒で特定する技術を開発しました。これにより、ネットワークの専門知識をもたないクラウド運用者であっても、障害によって影響を受けた仮想システムを特定でき、仮想システム利用者に対して迅速に報告を行うことができます。
今後、様々な環境での評価を実施し、2015年度中の富士通製品への搭載を目指します。
開発の背景
クラウドが広く普及し、多くのシステムがクラウド上に構築されています。一方で、クラウド環境ではサーバやネットワークが仮想化され、複数のシステムが同一の物理インフラ上に構築されるため構成が複雑化し、運用負荷の増加に繋がっています。
課題
クラウドのシステム運用では、物理インフラで障害が発生すると、影響を受けた仮想システムを特定し、仮想システムの利用者に対して被害状況や復旧見込み時期などが報告されることが一般的となっており、これによる運用負荷を軽減することが大きな課題となっています。
通常、クラウド環境では、ネットワークを管理するネットワーク運用者と物理サーバを管理するサーバ運用者が存在しており、各運用者が自身で管理している機器の範囲で仮想システムと物理インフラの対応付けを管理しています。従来の運用管理技術でもネットワーク障害の影響を受けた仮想システムまでの特定は比較的短い時間で実現できていましたが、より詳細に絞り込んだ影響範囲の特定を行うためには、ネットワークに精通したネットワーク運用の専門家がサーバ運用者と連携し、通信装置の設定情報などから、仮想サーバ間のすべての通信に対して経由する物理リンクを対応付ける必要があり、大規模なクラウド環境では影響範囲の特定までに数時間を要していました(図1)。
図1 ネットワーク障害発生時の影響範囲特定の課題
拡大イメージ
開発した技術
仮想システムと物理ネットワークの通信経路情報の対応付けを自動化することにより、ネットワーク障害の影響を受けた仮想サーバ間通信を短時間で特定する技術を開発しました。
開発した技術の特長は以下のとおりです。
- 仮想システムと物理インフラの対応付けの自動化
ネットワーク障害によっていずれの仮想サーバ間の通信が影響を受けるか特定するためには、仮想サーバと物理ネットワークの通信経路の対応付けが必要ですが、各情報を管理している運用者が分かれているため、仮想システムと物理インフラを対応付けて管理することは困難でした。
今回、仮想システムと物理インフラの構成管理情報を一元管理するようにしました。従来は管理されていなかった仮想サーバ間の通信経路情報と物理サーバ間の通信経路情報を生成し、各仮想サーバがいずれの物理サーバに収容されているかという関係に基づいて解析することにより、仮想サーバ間の通信経路と物理ネットワークの通信経路の対応付けの自動化を実現しました(図2)。
図2 仮想サーバ間の通信経路と物理インフラの通信経路の対応付け
拡大イメージ - ネットワークの冗長経路を考慮した影響範囲特定
物理ネットワークの中で信頼性向上のために冗長構成を採用している場合、物理ネットワークの通信経路情報に加えて、通常使用する現用経路あるいは予備経路を示す状態情報を管理するようにしました。こうすることで、障害発生時に影響を受けた物理サーバ間の通信経路が現用経路である時に限って影響ありと判断し、実際にサーバ間通信に影響のあったものだけを特定します(図3)。
図3 ネットワーク冗長構成を考慮した影響範囲特定
拡大イメージ
効果
今回開発した技術を用いることで、ネットワーク障害が発生した時に、クラウド運用者は、従来のように数時間かけて関係性調査を行うことなく、ネットワーク障害によって影響を受けた仮想サーバ間通信を10秒以下で特定することができます。また、ネットワークの専門知識のない運用者でも、その障害によって影響を受けた仮想サーバ間通信を特定できるようになり、障害対応の効率化を図ることが可能です。
今後
富士通研究所は様々な環境での評価を実施し、2015年度中に富士通製品への搭載を目指します。
商標について
記載されている製品名などの固有名詞は、各社の商標または登録商標です。
以上
注釈
本件に関するお問い合わせ
株式会社富士通研究所
ICTシステム研究所 システムプラットフォーム研究部
044-874-2418(直通)
netfailure-analysis@ml.labs.fujitsu.com
プレスリリースに記載された製品の価格、仕様、サービス内容、お問い合わせ先などは、発表日現在のものです。その後予告なしに変更されることがあります。あらかじめご了承ください。