FUJITSU
Worldwide|サイトマップ
THE POSSIBIliTIES ARE INFINITE
Japan
元のページへ戻る本件に関するお問い合わせ先
[ PRESS RELEASE ](技術)
2004-0057
2004年3月31日
株式会社富士通研究所

XMLデータの効率的処理技術を開発

株式会社富士通研究所(注1)は、XML(注2)で記述されたデータを従来技術の10分の1のメモリで取り扱うことができるデータ処理技術を開発しました。今回開発した技術により、少ないメモリ量とCPU負荷で大きなXMLデータが取り扱えるようになり、企業内でのXMLデータ処理の高速化やモバイル機器でのXML利用など、適用範囲を広げることが可能となります。

今回開発した技術の詳細は、2004年3月5日・6日に開催された電子情報通信学会の第15回データ工学ワークショップでも紹介しました。また,2004年3月23〜25日に米国で開催されたIEEE Data Compression Conference (DCC04)においても紹介しました。

【開発の背景】

現在、XMLデータは企業間のデータ交換や企業内情報の記述・処理に利用され、将来的には電子データの多くがXMLで記述されるものと期待されています。しかし、XMLは、データの表現能力が高い反面、従来技術と比較してコンピュータのメモリを大量に消費し、CPUの負荷が増大するという傾向があり、これがXMLシステム導入時の課題の一つとなっていました。このことから、XMLデータを効率的に扱う処理技術が求められていました。

【これまでの課題】

従来、XMLデータを読み書きする場合、XMLデータ全体を一旦、コンピュータの主記憶上に展開してから利用する必要がありました。展開時のメモリサイズは、元のデータサイズの4〜6倍となり、CPU・メモリ量などからXMLデータを取り扱う機器に制約がありました。

【開発した技術】

今回開発したのは、XMLデータを効率的にメモリ上に展開し、大幅にその使用量を削減する技術です。その特長は以下のとおりです。

  1. XMLデータの部分的展開技術

    XMLデータの処理において、全データを処理の対象にすることがまれであることを利用し、必要な部分のみをメモリに展開する技術を開発しました。本技術により、メモリ使用量を従来の約4分の1に削減し、CPU負荷も大幅に軽減することが可能となりました。

  2. XMLデータの圧縮技術

    XMLデータをメモリ上に展開する際のメモリ使用量が、データに含まれる要素数にほぼ比例することを利用して、その圧縮を図る手法を開発しました。データ処理の対象とならない要素をCSV形式(注3)で1つにまとめてしまうことで、要素数・メモリ使用量を大きく削減しています。

【効果】

開発した技術を70メガバイトという大きなXMLデータ(図書目録、レコード数18,543件)に適用して効果を確認したところ、従来技術の約10分の1となる28メガバイトのメモリ使用量で従来と同様なデータ処理を行うことができました。メモリ使用量の削減に伴い、メモリ管理に必要な処理も減り、CPU負荷も軽減しました。

本技術により、「高多重で大量のXMLデータを処理するWebシステム」「大容量のXMLデータを処理するEDIシステム」「リソースが限定されるモバイル機器でのXMLデータ保持・処理」における必要リソースの低減、性能改善が期待できます。

【今後】

今後はさらに、ソフトウェアの機能強化などをおこない、製品化に向けた取り組みを進めてまいります。

以上

用語説明

(注1)株式会社富士通研究所:
社長 藤崎道雄、本社 川崎市
(注2)XML(Extensible Markup Language):
柔軟な表現能力,高い拡張性を持つ国際標準のデータ形式。
(注3)CSV形式(Comma Separated Values):
データをコンマ(,)で区切って並べる形式のこと。

関連リンク

プレスリリースに記載された製品の価格、仕様、サービス内容、お問い合わせ先などは、発表日現在のものです。その後予告なしに変更されることがあります。あらかじめご了承ください。ご不明な場合は、富士通お客様総合センターにお問い合わせください。

元のページへ戻る ページの先頭へ

All Right Reserved, Copyright (C) FUJITSU