スーパーコンピュータ「富岳(Fugaku)」の全貌:アーキテクチャから応用、今後の展望まで徹底解説

概要:富岳とは何か

富岳(Fugaku)は、理化学研究所(RIKEN)計算科学研究センター(R-CCS)と富士通が共同で開発した日本のスーパーコンピュータです。兵庫県神戸市のR-CCSに設置され、既存の「京(K computer)」の後継として、新しいアーキテクチャを採用して高性能かつ省電力を目指した国家的プロジェクトです。システムは1ノード当たり1チップの構成で、合計158,976台のプロセッサ(ノード)から構成され、ノード当たり32GBのHBM2を搭載することで、全体で約4.9ペタバイト級のメモリ容量を実現しています。

富岳はTOP500(世界のスーパーコンピュータ性能ランキング)で上位を独占し、2020年6月のTOP500リストにおいてHPL(High Performance Linpack)で1位を獲得しました。理論ピーク性能(Rpeak)や実測のHPL性能(Rmax)は公表値があり、学術・産業分野での幅広い利用と社会的インパクトによって注目を集めています。

アーキテクチャの核心:A64FXとSVE

富岳の心臓部は富士通が設計したA64FXプロセッサです。A64FXはARMアーキテクチャ(ARMv8.2-A)の上に構築され、Scalable Vector Extension(SVE)という拡張命令セットを実装しています。A64FXはベクトル演算に最適化され、高帯域幅メモリであるHBM2をチップに統合することで、メモリ帯域幅が制約となるアプリケーションでも高い性能を発揮します。

SVEは可変長のベクトル命令をサポートすることで、従来のSIMD命令より柔軟に幅広いベクトル長で効率的な実装を可能にします。A64FXはこれを活用して科学計算や数値シミュレーション、機械学習の一部ワークロードで高い性能を引き出しています。

ノード構成とネットワーク:TOFUインターコネクト

各A64FXチップはノードとして単独で動作し、ノード間の結合には富士通が長年開発してきたTOFU(Torus Fusion)系のインターコネクトの改良版が用いられています。高い帯域幅と低レイテンシを両立させる設計により、大規模並列通信が頻発する大規模シミュレーションでも通信がボトルネックになりにくい構成です。TOFU系は前世代の「京」でも採用されており、富岳ではさらなる高速化・拡張性の改善が図られています。

性能とベンチマーク

富岳はHPLによる計測で世界トップクラスの性能を示しました。公表されたHPL実測性能(Rmax)は約415.5ペタフロップス(PFLOPS)で、理論ピーク(Rpeak)は約537ペタフロップス前後とされています(公表資料を参照してください)。これによりTOP500で1位を獲得し、同時に多くのベンチマークや実アプリケーションで高い性能を示しています。

HPLは浮動小数点演算に特化したベンチマークであるため、実アプリケーションの性能は問題特性によって差が出ます。富岳はベクトル性能やメモリ帯域幅に優れるため、流体力学、気象・気候モデル、分子動力学、材料科学、AI関連の一部処理などで高い実行効率を示してきました。

エネルギー効率(Green500)

スーパーコンピューティングにおいては単純な性能だけでなく、単位電力当たりの性能(エネルギー効率)も重要です。富岳は高い演算効率とHBM2の採用、ノード単位での最適化により省電力性も重視され、Green500(エネルギー効率ランキング)でも上位を獲得しています。大規模システムの運用では冷却や電力供給の最適化が不可欠であり、富岳でも運用面の工夫が行われています。

ソフトウェアスタックとプログラミング環境

富岳の利用には、ベクトル命令(SVE)やHBM2の特性を活かすための最適化が必要です。主要なコンパイラ(富士通提供の最適化コンパイラ、Arm系コンパイラやGNUコンパイラ)やMPIライブラリ、数学ライブラリ(BLASやFFTなど)、プロファイリング/チューニングツールが用意され、既存のアプリケーションを効果的に移植・最適化するための環境が整備されています。

また、富岳のような大規模システムではジョブスケジューリング、I/O最適化、データ管理も重要です。大規模並列ファイルシステムやチェックポイント/リスタートの戦略、ワークロードの並列性と通信パターンに応じた最適化が施されています。

主要な応用分野と社会的インパクト

富岳は多岐にわたる科学技術・産業分野で活用されています。具体的には以下のような分野で成果が報告されています。

  • 気象・気候シミュレーション:高解像度シミュレーションによる詳細な気候予測や極端気象解析。
  • 災害対策・社会インフラ:地震や津波の詳細モデルに基づく被害予測や対策検討。
  • 創薬・分子シミュレーション:タンパク質や薬剤候補の分子動力学シミュレーションで探索速度を向上。
  • 材料科学・ナノテクノロジー:新材料や触媒の探索、第一原理計算の大規模化。
  • 感染症対策:COVID-19など感染症に関連する解析、薬剤候補のスクリーニングやウイルス構造解析への貢献。

これらは学術研究だけでなく、産業応用や政策決定にも影響を与える実用的な成果を生んでおり、富岳は「社会課題の解決」を目指すスーパーコンピューティングの一例として位置づけられています。

導入・運用面の工夫

富岳のような大規模システムは、設置・運用において多くの物理的・管理的課題を伴います。データセンターの電力容量、冷却システム、物理的ラック配置、メンテナンスのためのアクセス設計などが挙げられます。さらに、ソフトウェア面ではユーザー支援、アプリケーションの移植・最適化支援、セキュリティ対策、学内外・産学連携のための利用ポリシー策定など、多面的な運用ノウハウが必要です。

課題と今後の展望

富岳が示したのは、汎用CPUベースでの高性能化と省電力化の可能性です。しかし今後の課題としては、以下の点が挙げられます。

  • ソフトウェアのモダナイゼーション:大規模並列環境やベクトル命令を最大限生かすためのコード改変・最適化が必要であり、既存コードの対応が負担になること。
  • 異種アーキテクチャとの共存:GPUやAIアクセラレータ、FPGA等の活用が進む中で、いかに最適な異種混合環境を設計・運用するか。
  • エクサスケールへの道:エクサスケール(ExaFLOPS)時代に向けて、性能だけでなく堅牢性、プログラミングのしやすさ、消費電力抑制が求められる。

日本国内では富岳の成果を踏まえ、次世代のエクサスケール機やAI向けインフラの検討が進んでおり、ハードウェアとソフトウェア双方の革新が求められています。

まとめ

富岳はA64FX+SVEという新しい設計思想と、大規模ノード数・高帯域幅メモリ、専用インターコネクトの組み合わせにより、HPCの領域で高い性能と省電力性を両立したシステムです。科学研究や社会課題解決に対する具体的な成果を生み出しつつ、今後のスーパーコンピューティングの方向性──特にソフトウェア最適化、異種アーキテクチャの共存、エネルギー効率の追求──に対して重要な示唆を提供しています。これらを踏まえ、研究者・エンジニアはアプリケーション側でも並列化・ベクトル化・メモリアクセスの最適化に取り組むことが求められます。

参考文献