このページの本文へ移動
  1. ホーム >
  2. プレスリリース >
  3. ポスト「京」のCPUの仕様を公表

PRESS RELEASE (技術)

2018年8月22日
富士通株式会社

ポスト「京」のCPUの仕様を公表

ピーク性能は2.7TFLOPS以上で、HPCやAI分野で高い性能を発揮

当社は、世界的なハイパフォーマンス・チップに関するシンポジウムである「Hot Chips 30」(開催場所:米国カリフォルニア州 シリコンバレー、開催期間:8月19日(日曜日)から21日(火曜日))(注1)に参加し、ポスト「京」に搭載するCPU「A64FX™」の仕様を公表しました。ポスト「京」は2011年に世界一の性能を達成した「京」の後継機として、最大で「京」の100倍のアプリケーション実行性能を目指し、当社と理化学研究所(理事長 松本紘、以下、「理研」)が開発しているスーパーコンピュータです。A64FXは、世界で初めてArmv8-A命令セットアーキテクチャをスーパーコンピュータ向けに拡張した「SVE (Scalable Vector Extension)」を採用したCPUとなります。当社が60年以上にわたって培ったマイクロアーキテクチャ(ハードウェア設計技術)を継承し、ピーク性能は2.7テラフロップス(以下、TFLOPS)以上で、HPCやAIなどの分野で高い性能を発揮します。

当社は、高性能プロセッサと関連技術に関する世界的なシンポジウムである「Hot Chips 30」に参加し、ポスト「京」に搭載するCPU「A64FX」の詳細を公表しました。

ポスト「京」は、世界のスーパーコンピュータをランク付けするTOP500リストで2011年に世界一となった「京」の後継機として、当社と理研が開発しているスーパーコンピュータで、2021年頃の共用開始を目指しています。

A64FXは、このポスト「京」に搭載する高性能CPUです。幅広いアプリケーションに対応する汎用性、Tofuインターコネクトによる超並列、超低消費電力、メインフレームクラスの高い信頼性などを実現します。

A64FXは、Arm Limited社(以下、「アーム社」)のArmv8-A命令セットアーキテクチャをスーパーコンピュータ向けに拡張する「SVE (Scalable Vector Extension)」を、世界で初めて採用したCPUとなります。当社は、アーム社との協業により、SVEの策定にリードパートナーとして貢献し、その成果をA64FXに採用しました。

A64FXのマイクロアーキテクチャ(ハードウェア設計技術)は、当社がこれまでスーパーコンピュータやメインフレーム、UNIXサーバで培った技術を発展させて開発しました。高性能積層メモリの高いメモリバンド幅性能を引き出すハードウェア技術により、CPUの高機能の演算処理部を効率よく利用できるため、高いアプリケーション実行性能を得ることができます。 CPUとCPUの間を、「京」に向けて開発された独自のTofuインターコネクトで直結し、並列性能を向上しています。倍精度(64ビット)浮動小数点演算のピーク性能は2.7TFLOPS以上で、単精度(32ビット)ではこの2倍、半精度(16ビット)では4倍の演算スループットが得られます。すなわちアプリケーションが単精度や半精度の演算を活用することで、より高速に結果を得ることが可能です。また、16ビット整数、8ビット整数の演算性能も強化しており、従来のスーパーコンピュータが得意とするコンピュータシミュレーションだけでなく、ビッグデータやAIなど、幅広い分野に適応するCPUとなっています。

Armアーキテクチャは幅広くソフトウェア開発者・ユーザに受け入れられており、当社はArmのコミュニティに参加することで、オープンソースソフトウェアなどを含めたソフトウェア資産を利用しながら、Armアーキテクチャによるエコシステム発展にも貢献していきます。

「A64FX」 パッケージ写真
「A64FX」 パッケージ写真

「A64FX」 ブロック図
「A64FX」 ブロック図

A64FXの仕様

A64FXの仕様
項目 内容
命令セットアーキテクチャ Armv8.2-A SVE (512-bit wide SIMD)
コア数 48 コンピューティング・コア、4 アシスタント・コア
メモリ 32GiB (HBM2)
プロセステクノロジー 7nm FinFET
トランジスタ数 約87億トランジスタ
ピーク性能(TOPS) 倍精度(64ビット)浮動小数点演算: 2.7 TOPS以上(DGEMM(注2)実行効率 90%以上)
単精度(32ビット)浮動小数点演算: 5.4 TOPS以上
半精度(16ビット)浮動小数点演算/16ビット整数演算: 10.8 TOPS以上
8ビット整数演算: 21.6 TOPS以上
ピークメモリバンド幅 毎秒1024GB(STREAM Triad(注3)実行効率 80%以上)

今後

当社では、本CPUを搭載したポスト「京」の開発を通じて、コンピュータシミュレーションを用いた先端的な研究、健康長寿、防災・減災、エネルギー、ものづくり分野などの社会的・科学的課題の解決や産業競争力の強化、更にはビッグデータやAI分野への適用拡大により「Society 5.0」の実現に貢献していきます。

商標について

記載されている製品名などの固有名詞は、各社の商標または登録商標です。

以上

注釈

注1 「Hot Chips 30」:
「Hot Chips」は、米IEEE(The Institute of Electrical and Electronics Engineers)が主催し、毎年開催されるシンポジウム。
注2 DGEMM:
ベンチマークに使用される計算プログラムの部品。行列の積を計算するサブルーチン。
注3 STREAM Triad:
メモリアクセス性能指標として使用されるベンチマーク。プロセッサがメモリにアクセスする際の持続的なメモリバンド幅を測定する。

関連リンク

本件に関するお問い合わせ

富士通コンタクトライン(総合窓口)
電話 0120-933-200
受付時間: 9時~17時30分(土曜日・日曜日・祝日・当社指定の休業日を除く)


プレスリリースに記載された製品の価格、仕様、サービス内容、お問い合わせ先などは、発表日現在のものです。その後予告なしに変更されることがあります。あらかじめご了承ください。