AWS Graviton4 ベンチマークまとめ

cpu_aws CPU・SoC

はじめに

Amazon Web Services (AWS) は、クラウドワークロードに最適化された価格性能を提供することを目的として、カスタムシリコンの開発に注力してきました。その取り組みの集大成の一つが、Amazon Elastic Compute Cloud (Amazon EC2) 向けに設計された AWS Graviton プロセッサファミリーです 1。Graviton プロセッサは急速に普及し、現在では 50,000 を超える顧客が Graviton ベースのインスタンスを利用しています 5。本レポートで分析する AWS Graviton4 は、その最新世代であり、パフォーマンスとエネルギー効率の大幅な向上を約束しています 7

Graviton の登場は、データセンターにおける Arm アーキテクチャ (RISC: Reduced Instruction Set Computing) の台頭という、より大きなトレンドの一部です。従来、サーバー市場は x86 アーキテクチャ (CISC: Complex Instruction Set Computing) が主流でしたが、Arm はその電力効率の高さとカスタム最適化の可能性から、クラウドプロバイダーにとって魅力的な選択肢となっています 4。AWS Graviton は、この変化を牽引する重要な存在です 8

本レポートは、公開されている英語および日本語の Web サイトからの情報を基に、AWS Graviton4 のベンチマーク結果を深く掘り下げ、データに基づいた分析を提供することを目的としています。具体的には、前世代の Graviton プロセッサや競合する x86 プロセッサ(Intel、AMD)と比較して、様々なワークロードにおけるパフォーマンスと価格性能を評価します。レポートは、アーキテクチャ概要、ベンチマーク手法、ワークロード別分析、価格性能分析、ユースケース適合性、そして結論という構成で展開します。

AWS Graviton4 プロセッサのアーキテクチャ概要

主要スペックと技術詳細

AWS Graviton4 プロセッサは、AWS がクラウドワークロード向けに最適化した最新世代のカスタム CPU であり、そのアーキテクチャは性能と効率の向上に重点を置いて設計されています。

  • コアアーキテクチャ: Graviton4 は、Armv9.0-A 命令セットアーキテクチャ 4 に基づく Arm Neoverse V2 コアを採用しています 4。重要な特徴として、各 vCPU (仮想 CPU) が物理コアに直接対応している点が挙げられます 2。これは、Intel や AMD の x86 プロセッサで一般的な同時マルチスレッディング (SMT) とは異なり、vCPU 間のリソース共有を最小限に抑え、より予測可能で安定したパフォーマンスと、コア間の分離強化に繋がる可能性があります 2
  • コア数: Graviton4 は、1 ソケットあたり 96 個の物理コアを搭載しています 4。これは、前世代の Graviton3 が搭載していた 64 コアから 50% の増加となります 8。デュアルソケット構成を採用するインスタンス (例: r8g.48xlarge, x8g.48xlarge) では、最大 192 vCPU までスケールアップが可能です 6
  • キャッシュ階層: 各コアには 2MB の L2 キャッシュが搭載されており 8、これは Graviton3 や Graviton2 のコアあたり 1MB から倍増しています 6。これにより、コアが必要とするデータへのアクセス速度が向上し、パフォーマンス改善に寄与します。Arm の資料によれば、ソケットあたり 36MB のシステムレベルキャッシュ (SLC) も搭載されています 18
  • メモリサブシステム: Graviton4 の最も顕著な強化点の一つがメモリサブシステムです。12 チャネルの DDR5-5600 メモリを採用し 8、ピーク時で最大 536.7 GB/s のメモリ帯域幅を実現します 9。これは、Graviton3 の 8 チャネル DDR5-4800 と比較して 75% もの帯域幅向上に相当します 7。このメモリ帯域幅の大幅な向上は、Graviton4 がメモリ律速(メモリ帯域幅が性能のボトルネックとなる)のワークロード、例えば大規模データベース、インメモリキャッシュ、そして多くの HPC アプリケーション(計算流体力学や地震波イメージングなど)において顕著な性能向上を示す主要な要因となっています 8。Graviton3 が DDR4 から DDR5 へ移行して帯域幅を改善したのに対し 28、Graviton4 はチャネル数 (8→12) とチャネルあたりの速度 (4800→5600 MT/s) の両方を向上させることで、この飛躍的な帯域幅増強を達成しています 8
  • セキュリティ強化: セキュリティはクラウド環境において最重要事項であり 8、Graviton4 はハードウェアレベルでの強化が施されています。常時有効なメモリ暗号化 (DRAM、Nitro Card 接続、コア間コヒーレントリンクを含む) 7、vCPU ごとの専用キャッシュ 8、ポインタ認証 (Pointer Authentication, Armv8.3+ の機能) 29、そして分岐ターゲット識別 (Branch Target Identification, BTI) 4 といった機能を搭載しています。BTI は、制御フローを乗っ取るタイプの高度な攻撃に対する防御を強化します。これらの機能は、ハードウェアレベルのセキュリティ機能と仮想化オーバーヘッドの削減を実現する AWS Nitro System 上に構築されています 5。従来の CPU ではソフトウェアやオプションのハードウェア機能に依存することが多かったメモリ暗号化が、Graviton4 では主要なハードウェアインターフェースに統合され、常時有効化されています 8。これにより、設定の複雑さが軽減され、ソフトウェアベースの暗号化と比較してパフォーマンスへの影響が少なくなる可能性があります。この包括的なハードウェアベースのセキュリティ機能は、金融やヘルスケアなど、特にセキュリティ要件の厳しい業界にとって Graviton4 を強力な選択肢とし、コンプライアンス対応を簡素化する可能性があります 8

Graviton3 との比較

Graviton4 は、前世代の Graviton3 からアーキテクチャの多くの側面で進化を遂げています。主な違いは、コアアーキテクチャが Neoverse V1 から V2 へ、ソケットあたりの最大コア数が 64 から 96 へ、コアあたりの L2 キャッシュが 1MB から 2MB へ、メモリチャネルが 8 チャネル DDR5-4800 から 12 チャネル DDR5-5600 へと強化された点です。これらの改良により、AWS は Graviton4 が Graviton3 と比較して、汎用コンピューティング性能で最大 30%、データベースワークロードで最大 40%、大規模 Java アプリケーションで最大 45% 高速化し、メモリ帯域幅は 75% 向上したと主張しています 4。一方で、報告されているクロック周波数の向上は比較的小幅です(例: G3 の 2.6GHz に対し G4 は 2.7/2.8GHz)9

表1: Graviton4 vs. Graviton3 アーキテクチャ比較

特徴 (Feature)Graviton4Graviton3
コアタイプ (Core Type)Arm Neoverse V2Arm Neoverse V1
最大コア数/ソケット9664
L2 キャッシュ/コア2MB1MB
メモリチャネル数128
メモリタイプ (Memory Type)DDR5-5600DDR5-4800
最大メモリ帯域幅 (推定)最大 536.7 GB/s(G4比で約 57%)
主要セキュリティ機能常時メモリ暗号化, Pointer Authentication (PA), Branch Target ID (BTI)常時メモリ暗号化, Pointer Authentication (PA), BTI (一部)

出典: 4

Graviton4 搭載 EC2 インスタンスファミリー

AWS は、Graviton4 プロセッサを搭載した複数の EC2 インスタンスファミリーを提供しており、それぞれ異なるワークロード要件に対応するように最適化されています。

  • M8g/M8gd: 汎用インスタンスファミリーで、コンピューティング、メモリ、ネットワークリソースのバランスが取れています。アプリケーションサーバー、マイクロサービス、中規模データストア、クラスターコンピューティングなどの幅広い用途に適しています 3。最大 192 vCPU / 768 GiB RAM の構成が可能で 25、M7g インスタンスと比較して最大 3 倍の vCPU とメモリを提供します 25。M8gd はローカル NVMe SSD ストレージを搭載します。
  • R8g/R8gd: メモリ最適化インスタンスファミリーで、メモリと vCPU の比率が 8:1 です。高性能データベース、インメモリキャッシュ (Redis, Memcached など)、リアルタイムビッグデータ分析といったメモリ集約型ワークロードに最適です 3。最大 192 vCPU / 1536 GiB (1.5 TiB) RAM までスケール可能で 7、R7g と比較して最大 3 倍の vCPU とメモリを提供します 7。R8g は、Graviton プロセッサ搭載インスタンスとして初めてベアメタルオプション (metal-24xl, metal-48xl) を提供します 7。R8gd はローカル NVMe SSD を搭載します。
  • C8g: コンピューティング最適化インスタンスファミリーで、HPC (ハイパフォーマンスコンピューティング)、ビデオエンコーディング、ゲーム、CPU ベースの機械学習 (ML) 推論など、計算負荷の高いアプリケーション向けに設計されています 3。(提供されている資料では R8g/X8g/M8g ほど詳細なスペック情報は多くありませんが、存在は確認されています 3)。
  • X8g: 大容量メモリ最適化インスタンスファミリーで、メモリと vCPU の比率が 16:1 と非常に高くなっています。Redis や Valkey などの大規模インメモリデータベース、PostgreSQL, MySQL, MariaDB などの大規模リレーショナルデータベース、EDA (電子設計自動化) ワークロード、リアルタイム分析、メモリ制約のあるマイクロサービスなどに最適です 3。最大 192 vCPU / 3072 GiB (3 TiB) の RAM を搭載可能で 6、これは X2gd インスタンスの最大 3 倍の vCPU とメモリに相当します 6。X8g は、Graviton4 搭載インスタンスの中で GiB あたりのコストが最も低いとされています 29

表2: Graviton4 EC2 インスタンス仕様概要

インスタンスファミリー最大 vCPU最大メモリ (GiB)メモリ:vCPU 比最大ネットワーク帯域幅 (Gbps)最大 EBS 帯域幅 (Gbps)主なターゲットワークロード
M8g1927684:15040アプリケーションサーバー, マイクロサービス, 中規模データストア, クラスターコンピューティング
R8g1921,5368:15040データベース, インメモリキャッシュ, リアルタイムビッグデータ分析
C8g(未詳)(未詳)(未詳)(未詳)(未詳)HPC, ビデオエンコーディング, ゲーム, CPU ベース ML 推論
X8g1923,07216:15040大規模インメモリ/リレーショナル DB, EDA, リアルタイム分析, メモリ制約マイクロサービス

出典: 3

ベンチマーク手法と対象ワークロード

Graviton4 の性能を評価するためには、適切なベンチマーク手法を選択し、その結果を正しく解釈することが不可欠です。

クラウドワークロード向け CPU ベンチマークの種類

クラウド環境における CPU 性能評価には、主に以下の種類のベンチマークが用いられます。

  • 合成ベンチマーク (Synthetic Benchmarks): CPU やメモリサブシステムなどの特定コンポーネントに負荷をかけ、純粋な計算能力を測定します。
  • SPEC CPU 2017: 業界標準として広く利用され、整数演算 (SPECrate/speed Integer) と浮動小数点演算 (SPECrate/speed Floating Point) の性能を測定するスイートです 38。システムのプロセッサ、メモリサブシステム、コンパイラの性能を評価します。
  • Geekbench: クロスプラットフォーム対応のベンチマークで、シングルコアおよびマルチコアの性能を、ファイル圧縮、画像処理、機械学習といった実世界にインスパイアされたタスクを通じて測定します 39。結果は集約されたスコアとして表示されます 41
  • Coremark: CPU コアのパイプライン性能に焦点を当てた、比較的小規模な合成ベンチマークです 14
  • Stress-ng: システムに高負荷をかけるストレステストツールですが、負荷下での「1秒あたりの偽オペレーション数」などを測定でき、特定の条件下でのスループット指標として用いられることがあります。ただし、結果の解釈には注意が必要です 42
  • アプリケーションレベルベンチマーク (Application-Level Benchmarks): 実際のアプリケーションや、その挙動を模倣したミニアプリケーションを用いて、より現実的なシナリオでの性能を測定します。
  • Web サーバー: Nginx や Apache HTTP Server を対象とし、Apache Bench (AB) や wrk などのツールを用いて、秒間リクエスト処理数 (RPS) やレイテンシを測定します 42
  • データベース: PostgreSQL (pgbench など)、MySQL/MariaDB、ClickHouse、RocksDB などのデータベースシステムに対し、秒間トランザクション数 (TPS)、クエリ実行時間 (レイテンシ)、スループットなどを測定します 3
  • HPC (ハイパフォーマンスコンピューティング): miniFE (有限要素法ミニアプリ) 14 のようなミニアプリケーションや、OpenFOAM (計算流体力学) 14、LAMMPS (分子動力学) 15、GROMACS (分子動力学) 17、WRF (気象予測) 18、Relion (構造生物学) 18、Incompact3D (流体力学) 17 といった実際のアプリケーション、あるいは DevitoPRO 23 のようなカーネルを用いて、シミュレーション実行時間やスループット (例: GROMACS の ns/day) を測定します。
  • AI/ML 推論: llama.cpp 19、PyTorch 10、TensorFlow 31 などのフレームワークを用い、主に CPU 上で大規模言語モデル (LLM) などを実行し、1 秒あたりのトークン生成数 (Tokens/sec)、最初のトークン生成までの時間 (Time-to-first-token)、クエリレイテンシなどを測定します 19。Geekbench AI 53 のような専用ベンチマークも登場しています。
  • その他: コードコンパイル (LLVM, Gem5, Godot エンジンなど) 17、暗号処理 (OpenSSL 16, gcrypt 42, XMRig 17)、データ圧縮 (7-Zip 17, LZ4 21)、3D レンダリング (Blender 17)、Java アプリケーション (SPECjbb 38, JMH 42) など、特定の用途に合わせたベンチマークが存在します。

ベンチマーク結果解釈の留意点

ベンチマーク結果を比較・評価する際には、以下の点に注意する必要があります。

  • 構成詳細の重要性: テスト結果は、使用された具体的な構成に大きく依存します。インスタンスタイプ (vCPU 数、メモリ容量、世代、ファミリー例: r8g vs c8g)、OS (例: Ubuntu 24.04, Amazon Linux 2023)、カーネルバージョン (例: Linux 6.8)、コンパイラ (GCC のバージョン、最適化フラグ)、およびテスト対象ソフトウェアのバージョン (データベース、ベンチマークツール、アプリケーション) など、詳細な構成情報を確認することが極めて重要です 16。これらのいずれかが異なると、結果は大きく変動する可能性があります。
  • ベンチマークツールと方法論: 使用されたツール (例: Phoronix Test Suite 16, Apache Bench 42, wrk 43) によって測定対象や方法が異なります。テストパラメータ (接続数、実行時間、データセットサイズなど) を理解することも重要です。また、ネットワーク帯域幅などがボトルネックとなり、CPU 本来の性能が測定できていない可能性にも留意が必要です 20
  • 潜在的なバイアス: ベンダー自身が公開するベンチマーク結果は、自社製品に有利なワークロードが選択されている可能性があります。対照的に、Phoronix、Seeds Std、外道父の匠ブログなどの独立した第三者によるテストは、より客観的な視点を提供することが期待されます 7。比較対象が「同一条件」(例: 同じ vCPU 数、メモリ容量) で行われているか 12、あるいは「ベアメタル」インスタンス同士の比較か 21 も確認すべき点です。
  • 電力消費データの欠如: クラウドインスタンスでは、CPU やシステムの消費電力を直接測定するためのセンサー情報がユーザーに公開されていない場合がほとんどです 21。これは、Graviton4 の本来の環境における「ワットあたり性能」という、トータルの効率を評価する上で重大な制約となります。AWS は Graviton の高いエネルギー効率を主張していますが 3、独立した第三者がクラウド環境でこれを直接検証することは困難です。結果として、エネルギーコストを含む真の TCO (総所有コスト) の比較は、AWS の公称値や推測に頼らざるを得なくなります。これは、Arm アーキテクチャの主要なセールスポイントの一つであるエネルギー効率に関する評価を難しくしています。

ワークロード別ベンチマーク結果と分析

収集されたベンチマークデータに基づき、主要なワークロードカテゴリ別に Graviton4 の性能を分析します。

汎用コンピューティングと Web アプリケーション

Web サーバーやアプリケーションサーバーは、クラウドにおける最も一般的なワークロードの一つであり、Graviton プロセッサの主要なターゲットです 3

  • 性能比較 (vs. G3/x86): AWS は、Graviton4 が Graviton3 と比較して Web アプリケーションで最大 30% 高速であると主張しています 4。日本のシーズ株式会社が実施した WordPress 環境での Apache Bench テストでは、Graviton4 (r8g.2xlarge) が Graviton3 (r7g.2xlarge) より 44% 高速であり、さらに Intel Xeon 第4世代 (r7i.2xlarge) よりも 67% 高速という結果が報告されています 42。これは AWS の主張を上回る性能向上を示しています。一方で、外道父の匠ブログによるより広範なベンチマークスイートでは、Graviton4 の Graviton3 に対する平均的な CPU 性能向上は約 19% と報告されており、テスト内容によって結果が変動することを示唆しています 32。Phoronix が実施した多数のベンチマークの幾何平均では、Graviton4 (64 vCPU) は Graviton3 (64 vCPU) より約 30% 高速、Intel Xeon 8488C (r7i, 64 vCPU) より約 5% 高速でしたが、AMD EPYC 9R14 (r7a, 64 vCPU) よりは約 25% 遅いという結果でした 12
  • Web サーバーに関する洞察: Nginx は一般的なベンチマーク対象です 43。シーズ社のテストでは、WordPress スタックにおいて特に Apache と MySQL (MariaDB) のコンポーネントで Graviton4 の性能が優れていることが確認されました 42。Arm のドキュメントでも、Apache Kafka、Memcached、Elasticsearch など、Web 関連の様々なソフトウェアで Graviton が性能向上をもたらすことが示されています 45

表3: Web アプリケーションベンチマーク比較 (例: Seeds Std WordPress/Apache Bench)

インスタンスタイプメトリック (Metric)結果 (Result)R7i 比 (相対性能)R7g 比 (相対性能)コストパフォーマンス (RPS/USD)
r8g.2xlarge秒間リクエスト数 (RPS)6888.231.67x1.44x14615
r7g.2xlarge秒間リクエスト数 (RPS)4780.381.16x1.00x11159
r7i.2xlarge秒間リクエスト数 (RPS)4117.261.00x0.86x7780

出典: Seeds Std. ブログ 42 (us-east-1 オンデマンド料金に基づく計算)

この表は、特定の Web アプリケーションワークロードにおいて、Graviton4 (r8g) が前世代 (r7g) および競合の Intel (r7i) インスタンスと比較して、性能とコストパフォーマンスの両面で優位性を示したことを具体的に示しています。

データベース

データベースは、性能要件が厳しく、クラウド移行の主要な対象となるワークロードです 3

  • 性能比較 (vs. G3/x86): AWS は、Graviton4 が Graviton3 比でデータベース性能が最大 40% 向上したと主張しています 7。Phoronix による 64 vCPU でのベンチマークでは、ClickHouse、PostgreSQL、RocksDB において Graviton4 が Graviton3 から「巨大な」性能向上を示しました 16。ClickHouse では Intel Xeon 8488C を上回り、AMD EPYC 9R14 に匹敵する性能を見せ 48、PostgreSQL でも Intel Xeon および AMD EPYC と同等の競争力のある性能 (“dancing with”) を示しました 48。Tom’s Hardware のレポート (Phoronix データに基づく) でも、PostgreSQL で Graviton4 が Graviton3 より大幅に高速であることが確認されましたが、AMD/Intel よりは遅いとされました。しかし、RocksDB 9.0 では Graviton4 が AMD と Intel の両方を上回る性能を示しました 17。ClickHouse 社自身のブログでも、Graviton4 は Graviton3 に対して平均 23-30%、特定のクエリでは最大 76% の性能向上を示したと報告されています 20。シーズ社のテストでは、WordPress スタックの一部である MariaDB で Graviton4 が高い性能を示しました 42。SAP HANA Cloud では、Graviton4 は Graviton3 と比較して分析ワークロードで最大 25%、トランザクションワークロードで最大 40% の性能向上が測定されています 6
  • Amazon RDS / Aurora: Graviton4 ベースの M8g および R8g インスタンスは、Amazon RDS for PostgreSQL, MySQL, MariaDB で一般提供が開始されています 60。これらのインスタンスは、同等サイズの Graviton3 ベース RDS インスタンスと比較して、最大 40% の性能向上と最大 29% の価格性能向上を提供するとされています (オンデマンド価格ベース、エンジンやワークロードに依存) 47。Amazon Aurora でも Graviton はサポートされています 3
  • ワークロード依存性: Graviton4 のデータベース性能は、使用するデータベースエンジンや具体的なワークロードの特性に大きく依存する傾向が見られます。Graviton3 からの大幅な性能向上と x86 との競争力は明らかですが、特に ClickHouse や RocksDB のような特定のエンジンで優れた性能を発揮する一方で、PostgreSQL のような他のエンジンではテストによって評価が分かれる場合があります。これは、Graviton4 の強化されたメモリ帯域幅や Neoverse V2 コアアーキテクチャが、各データベースエンジンの内部実装 (メモリ使用、キャッシング、スレッド管理など) とどのように相互作用するかに起因すると考えられます。したがって、AWS が「データベースで 40% 高速」7 といった一般的な主張をする一方で、ユーザーは自身の特定のデータベースとワークロードでベンチマークを実施し、性能を評価することが重要です。

表4: データベースベンチマーク比較 (例: Phoronix Mix – 64 vCPU)

データベース/ベンチマークインスタンスタイプメトリック (Metric)結果 (例)R7i 比 (相対性能)R7g 比 (相対性能)
ClickHouser8g.16xlargeクエリ/秒> 1.0x>> 1.0x
ClickHouser7i.16xlargeクエリ/秒1.0x
ClickHouser7a.16xlargeクエリ/秒> 1.0x
PostgreSQL (pgbench)r8g.16xlargeTPS~ 1.0x>> 1.0x
PostgreSQL (pgbench)r7i.16xlargeTPS1.0x
PostgreSQL (pgbench)r7a.16xlargeTPS~ 1.0x
RocksDB (Read/Write)r8g.16xlargeオペレーション/秒最高> 1.0x>> 1.0x
RocksDB (Read/Write)r7i.16xlargeオペレーション/秒1.0x
RocksDB (Read/Write)r7a.16xlargeオペレーション/秒< 1.0x

出典: Phoronix 48, Tom’s Hardware 17 の結果に基づく定性的な要約。具体的な数値は元記事参照。

ハイパフォーマンスコンピューティング (HPC)

HPC は、科学技術計算やシミュレーションなど、極めて高い計算能力を要求される分野です。

  • 性能比較 (vs. G3/x86): Arm コミュニティブログによるベンチマーク (Graviton4 R8g vs Graviton3E C7gn、vCPU あたり性能比較) では、Graviton4 が HPC ワークロード全体で幾何平均 +24% の性能向上を示しました 18。個別のアプリケーションでは、OpenFOAM で約 +17%、LAMMPS で +32%、Relion で +41%、WRF で +24% の向上が見られました 18。これらの向上は、Neoverse V2 コアのマイクロアーキテクチャ改善、クロック周波数向上、そしてコアあたり +16.7% 増加したメモリ帯域幅に起因すると分析されています 18。さらに、192 コア構成のインスタンス同士 (Graviton4 r8g.48xlarge vs AMD EPYC Genoa c7a.48xlarge) の比較では、Graviton4 が幾何平均で 15.2% 優位であったと報告されています 18。Phoronix の 64 vCPU でのベンチマークでも、miniFE (有限要素法) や Incompact3D (流体力学) で Graviton4 が Graviton3 から「驚異的な」性能向上を示し、AMD EPYC 9R14 を上回る結果となりました 17。OpenFOAM では EPYC 9R14 と同等の性能でした 17。一方、GROMACS (分子動力学) では Graviton4 は Graviton3 から着実な性能向上を見せたものの、EPYC や Xeon の方が高速でした 17。DevitoPRO による地震波イメージングベンチマークでは、Graviton4 は Graviton3 に対して約 1.8 倍 (Isotropic, Self-adjoint TTI カーネル) および約 1.5 倍 (Fletcher TTI カーネル) 高速でした 23。EDA (電子設計自動化) の RTL シミュレーションでは、Graviton4 は Graviton3 比で最大 37% 高速であると報告されています 10
  • Arm の HPC における競争力: これらの結果は、Arm Neoverse V シリーズコアが、特にメモリ帯域幅に敏感な主流の HPC ワークロードにおいて、現在非常に競争力が高く、場合によってはリーダーシップを発揮できるレベルに達していることを示しています。HPC 分野における従来の x86 の優位性に挑戦し、クラウドでの科学技術計算プラットフォームとして Arm が現実的で、かつコスト効率の高い選択肢となり得ることを示唆しています。Graviton4 の Neoverse V2 コアと大幅に強化されたメモリサブシステム 8 の組み合わせは、多くの HPC コードにとって最適なバランスを提供しているようです。これは単なる漸進的な改善ではなく、クラウド HPC アーキテクチャとしての Arm の本格的な登場を意味し、AWS 上の HPC ユーザーの将来的な選択に影響を与えるでしょう。

表5: HPC ベンチマーク比較 (例: Arm Blog & Phoronix Mix)

アプリケーションインスタンスタイプ (比較対象)メトリック (Metric)主要な結果/出典
miniFEG4 R8g vs G3 R7g, EPYC R7a (64 vCPU)実行時間/スループットG4 >> G3, G4 > EPYC 17
Incompact3DG4 R8g vs G3 R7g, EPYC R7a (64 vCPU)実行時間/スループットG4 >> G3, G4 > EPYC 17
OpenFOAMG4 R8g vs G3E C7gn (per vCPU), EPYC R7a/C7a実行時間/スループットG4 > G3E (+~17%/vCPU), G4 ≈ EPYC (64 vCPU), G4 > EPYC (192 vCPU) 17
LAMMPSG4 R8g vs G3E C7gn (per vCPU), EPYC C7a実行時間/スループットG4 >> G3E (+32%/vCPU), G4 > EPYC (192 vCPU) 18
GROMACSG4 R8g vs G3 R7g, EPYC R7a, Xeon R7ins/day (スループット)G4 > G3, G4 < EPYC/Xeon 17
RelionG4 R8g vs G3E C7gn (per vCPU), EPYC C7a実行時間/スループットG4 >> G3E (+41%/vCPU), G4 > EPYC (192 vCPU) 18
DevitoPROG4 R8g vs G3 R7g, G2 R6gGPoints/sec (スループット)G4 ≈ 1.5x-1.8x G3, G4 ≈ 2.7x-3.6x G2 23

AI/ML 推論

AI/ML 推論は、学習済みモデルを使用して新しいデータに対して予測を行うプロセスであり、クラウドにおける重要なワークロードです。

  • CPU ベース推論の性能: Graviton4 は、CPU ベースの AI/ML 推論ワークロード向けにも位置づけられています 3。llama.cpp フレームワークを用いたベンチマークでは、Arm Kleidi による最適化を活用した Graviton インスタンスが、x86 代替と比較して最大 4 倍優れたトークンあたりコストパフォーマンス (tokens per dollar) を示したと報告されています 51。特に Graviton4 (C8g.16xlarge) は、量子化技術を用いることで、Llama 3 70B のような大規模言語モデル (LLM) を、人間が読める速度を超える 5-10 トークン/秒で実行可能であり、これは Graviton3 インスタンスではリソース制約から不可能だったとされています 19。Graviton3 (C7g.16xlarge) と比較した場合、Graviton4 (C8g.16xlarge) は Llama 3 8B モデルにおいて、プロンプトエンコーディングで 14-26%、トークン生成で 5-50% の性能向上を示しました 19。Zenn の記事では、Graviton4 は Graviton3 比で 15-28% の ML 性能向上があると報告されています 58。PyTorch などのフレームワークにおける Graviton 向けの最適化も性能向上に寄与しています 10。Graviton3 は、より広いベクトル演算ユニット (SVE) と bfloat16 データ型のサポートにより、Graviton2 比で最大 3 倍の ML 性能向上を実現していました 4。Graviton4 の Neoverse V2 コアも、SVE/SVE2、Bfloat16、INT8 命令をサポートしており、AI/ML ワークロードに適しています 10
  • CPU 推論の実行可能性: これらの結果は、Graviton4 が CPU ベースでの LLM 推論の適用範囲を、従来よりもはるかに大きなモデル (70B パラメータ実証) へと拡大したことを示唆しています。量子化技術や llama.cpp + Arm Kleidi のような最適化されたフレームワークと組み合わせることで、特定のレイテンシ要件を満たす範囲において、GPU に対するコスト効率の高い代替手段を提供する可能性があります。70B モデルで 5 トークン/秒を超える性能を CPU で達成した 19 ことは、対話型アプリケーションなどでの実用性を高めます。示された高い価格性能比 51 は、ML モデルのデプロイにおいてコストと性能のバランスを取る上で魅力的な選択肢となります。

表6: AI/ML 推論ベンチマーク比較 (例: Arm Blog Llama 3)

モデルインスタンスメトリック (Metric)結果 (例)G4 vs G3 向上率 (%)
Llama 3 8BG4 C8g.16xlargeプロンプトエンコーディング速度14-26%
Llama 3 8BG3 C7g.16xlargeプロンプトエンコーディング速度
Llama 3 8BG4 C8g.16xlargeトークン生成速度 (トークン/秒)5-50%
Llama 3 8BG3 C7g.16xlargeトークン生成速度 (トークン/秒)
Llama 3 70BG4 C8g.16xlargeトークン生成速度 (トークン/秒, 量子化)5-10 トークン/秒(G3では実行不可)

出典: Arm Community Blog 19

コンピレーション、暗号化、その他

上記カテゴリ以外の多様なワークロードにおける Graviton4 の性能を見ていきます。

  • コードコンパイル: Graviton4 はこの分野で非常に優れた性能を示します。Gem5 シミュレータや LLVM のコンパイル時間において、Graviton3/Graviton2 だけでなく、比較対象の AMD EPYC 9R14 や Intel Xeon 8488C よりも高速でした 17。これは、優れた価格性能と相まって、CI/CD (継続的インテグレーション/継続的デリバリー) のビルドサーバー用途に非常に魅力的であることを示唆しています 17
  • 暗号処理: 結果はまちまちです。Graviton4 は Graviton3 から大幅な性能向上を示しました 17。x86 との比較では、XMRig GhostRider テストで Xeon R7i を上回りましたが EPYC には及ばず、OpenSSL の各種アルゴリズム (ChaCha20, AES-GCM, Poly1305) では Graviton3 を大きく引き離し EPYC とは競争力がありましたが Xeon には劣る結果となりました 17。シーズ社のテストでは、OpenSSL sha256 では Graviton4 が強さを見せたものの、gcrypt のハッシュ化では R7i に劣りました 42
  • データ圧縮 (7-Zip): 驚くべきことに、Graviton4 は 7-Zip の圧縮・展開ベンチマークにおいて、Graviton3、EPYC 9R14、Xeon 8488C のすべてを上回る性能を示しました 17
  • 3D レンダリング (Blender): Graviton4 は Graviton3/Graviton2 から大幅に高速化しましたが、Blender 4.0.2 の各種レンダリングテストにおいては、一貫して EPYC や Xeon インスタンスよりも遅い結果となりました 17
  • Java: AWS は、Graviton4 が大規模 Java アプリケーションにおいて Graviton3 より 45% 高速であると主張しています 4。シーズ社の Java JMH ベンチマークでは、Graviton4 が Graviton3 を上回り、さらに R7i よりも優れた結果を示しました 42
  • コンピレーションと圧縮における強み: コードコンパイルや 7-Zip での Graviton4 の強力なパフォーマンスと優れた価格性能は、このプロセッサが開発者関連のワークロード (CI/CD) やデータ圧縮・展開を伴うタスクにおいて特に有利であることを示しています。これらの分野では、場合によっては x86 プロセッサを性能面でも上回る可能性があります。コンパイル作業は CPU とメモリを集中的に使用します。Graviton4 の多数のコア、改善された Neoverse V2 コアアーキテクチャ、そして高いメモリ帯域幅が、Gem5 や LLVM のようなテストで x86 をリードする要因となっていると考えられます 17。7-Zip での好成績は予期せぬものでしたが、特定のアルゴリズムやデータ処理における効率の高さを示唆しています 17。インスタンスコストの低さと相まって 17、ビルドファームやデータ処理パイプラインにとって説得力のある価値提案を生み出しています。

表7: コンピレーション/暗号化/その他 ベンチマーク比較 (例: Phoronix/Tom’s Hardware Mix)

ベンチマークインスタンス (比較対象)メトリック (Metric)Xeon 比 (相対性能)G3 比 (相対性能)Perf/$ ランク (推定)
Gem5 コンパイルG4, G3, Xeon, EPYC実行時間 (秒)G4 > XeonG4 >> G3G4 (1位)
LLVM コンパイルG4, G3, G2実行時間 (秒)G4 > G3 >> G2G4 (高)
7-Zip 圧縮G4, G3, Xeon, EPYCMIPSG4 > XeonG4 > G3G4 (高)
OpenSSL SHA256G4, G3, Xeon, EPYCスループットG4 < XeonG4 > G3G4 (中)
Blender BMW27 レンダリングG4, G3, Xeon, EPYC実行時間 (秒)G4 < XeonG4 > G3G4 (低)

出典: Phoronix/Tom’s Hardware 17 の結果に基づく要約。Perf/$ランクは性能とコストからの推定。

価格性能分析

性能だけでなく、コスト効率、すなわち価格性能比は、クラウドインフラを選択する上で極めて重要な要素です。

Graviton4 のコスト効率

  • 一般的な主張: AWS は一貫して、Graviton プロセッサが同等の x86 ベースインスタンスと比較して最大 40% 優れた価格性能を提供すると主張しています 1。インスタンス自体のオンデマンド価格も、同等の x86 インスタンスより最大 20% 低く設定されています 3。特に X8g インスタンスは、Graviton4 搭載インスタンスの中でメモリ GiB あたりのコストが最も低いとされています 29
  • ワークロード固有の指標: 多くの独立系ベンチマークでは、オンデマンド料金に基づいて「ドルあたりの性能」(performance per dollar) が計算され、比較されています 16
  • コンパイル (Gem5, Godot): Graviton4 が最も優れた価値を提供 (例: Gem5 で $0.186/run vs x86 で 0.288/run以上)[17]。∗∗∗HPC(Incompact3D,OpenFOAM):∗∗Graviton4は良好なコストパフォーマンスを示しました[17,27]。DevitoPROベンチマークでは、IsotropicとSelf−adjointTTIでGraviton4が最高のTP/ (Tera-points per dollar) を示しましたが、Fletcher TTI では Graviton3 が最高でした 23
  • データベース (ClickHouse, PostgreSQL): Phoronix のテストでは、Graviton4 がこれらのワークロードで最高の性能/ドルを示しました 48。RDS においても、Graviton4 は Graviton3 比で最大 29% の価格性能向上が謳われています 47
  • AI/ML 推論 (llama.cpp): x86 代替と比較して最大 4 倍優れたトークン/ドル性能が報告されています 51
  • Web (WordPress/AB): シーズ社のテストでは、R8g がドルあたりの速度で最高でした 42

競合プロセッサとの比較

  • G4 vs G3: Graviton4 インスタンス (例: R8g) は、対応する Graviton3 インスタンス (例: R7g) よりも一般的に約 10% 高価です 32。しかし、多くの場合 20-30% 以上、時にはそれ以上の性能向上が見られるため、結果的に Graviton4 の方が優れた価格性能を提供することが多いです 23
  • G4 vs Intel/AMD: Graviton4 は、特に AMD EPYC との比較において、幾何平均などの総合的な生性能では劣る場合があるものの 12、多くの場合で優れた価格性能を提供します。これは、Graviton インスタンス自体の価格が x86 インスタンスよりも低く設定されていることが大きな要因です 3。ただし、どの程度価格性能で有利になるかは、ワークロードによって大きく異なります 17
  • オンデマンド vs. スポット価格: 価格性能の計算は通常、オンデマンド料金に基づいて行われます 16。しかし、R8g インスタンスのスポット価格が、リリース直後にオンデマンド価格の 1/10 程度という異例の低価格で観測されたことが報告されています 32。スポット価格は変動しますが、タイミングによっては劇的なコスト削減の可能性があります。
  • AWS の価格戦略: AWS が Graviton に対して採用している積極的な価格戦略、特に R8g の初期の低スポット価格 32 や、x86 に対する一貫した約 20% の価格差 3 は、Arm アーキテクチャの採用を強力に推進しようとする戦略的な意図を示唆しています。これは単なる技術的な優位性だけでなく、AWS 自身の垂直統合 (自社でのチップ設計) 4 を活用して競合他社よりも低い価格を設定し、顧客を自社エコシステムに引き込むための市場形成戦術と見ることができます。価格は、既存の慣性や潜在的なソフトウェア互換性の懸念 11 を克服するための強力なインセンティブとなります 3。自社でシリコンを設計することで 4、Intel や AMD に支払うマージンを回避し、この価格競争力を生み出しています。

表8: 価格性能サマリー

ワークロードカテゴリ最も価格性能が良いプロセッサ (推定)次点のプロセッサ (推定)主要な結果/出典
Web アプリケーションGraviton4Graviton342
データベース (混合)Graviton4EPYC / Graviton317 (ワークロード依存)
HPC (メモリ律速)Graviton4EPYC / Graviton317 (ワークロード依存、一部 G3 優位)
AI/ML 推論 (CPU, llama.cpp)Graviton4(x86比で大幅優位)51
コードコンパイルGraviton4EPYC17

エネルギー効率と持続可能性

  • AWS は、Graviton インスタンスが同等の EC2 インスタンスと比較して、同じ性能を最大 60% 少ないエネルギーで実現すると主張しています 3。これは、Arm アーキテクチャ固有の高い電力効率に起因するとされています 4
  • このエネルギー効率は、運用コストの削減に貢献するだけでなく、顧客が持続可能性の目標を達成し、二酸化炭素排出量を削減するのに役立ちます 3。これは、AWS 自身の持続可能性目標とも一致しています 8
  • AWS 上で直接的な電力測定は困難ですが 21、主張されているエネルギー効率が正確であれば、特に大規模なデプロイメントにおいて、インスタンス価格だけではない大幅な TCO 削減に繋がります。また、環境意識の高い組織にとっては、説得力のある採用理由となります。エネルギーコストはデータセンター TCO の主要な構成要素であり、Graviton の価値提案の重要な一部となっています 3

ユースケース適合性と推奨事項

Graviton4 は多くのワークロードで優れた性能とコスト効率を発揮しますが、すべてのシナリオで最適とは限りません。

Graviton4 が特に有利なユースケース

ベンチマーク結果とアーキテクチャ特性から、Graviton4 は以下のユースケースで特に強みを発揮すると考えられます。

  • スケールアウト型ワークロード: Web サーバー、マイクロサービス、コンテナ化されたアプリケーション (EKS, ECS Fargate 3 を含む)、アプリケーションサーバーなど、水平スケーリングが一般的なワークロード 3。コアあたりの良好な性能と優れた価格性能が活きます。
  • メモリ集約型アプリケーション: 大規模データベース (リレーショナル DB、RocksDB や ClickHouse のような NoSQL/分析 DB)、インメモリキャッシュ (Redis, Memcached, Valkey)、リアルタイムビッグデータ分析 3。R8g および X8g インスタンスの高いメモリ帯域幅と容量が性能向上に貢献します。
  • HPC ワークロード (特にメモリ律速): 計算流体力学 (CFD, OpenFOAM)、有限要素解析 (FEA, miniFE)、地震波イメージング、特定の分子動力学 (LAMMPS, Relion)、EDA 3。高いメモリ帯域幅と Neoverse V2 コアの性能が有利に働きます。
  • Java アプリケーション: ベンチマークで顕著な性能向上が示されています 4
  • CPU ベース AI/ML 推論: 特に量子化や最適化されたフレームワークを使用する場合、大規模モデルに対してもコスト効率の良い選択肢となります 3
  • 開発者ワークロード: コードコンパイル (CI/CD ビルドサーバー) 17。優れた性能と価格性能を提供します。
  • 圧縮/展開タスク: 7-Zip での強力なパフォーマンスが報告されています 17

Graviton4 導入検討時の注意点

Graviton4 への移行を検討する際には、以下の点に留意する必要があります。

  • 性能が劣る可能性のあるワークロード:
  • 特定の暗号アルゴリズムで、x86 の専用ハードウェアアクセラレーションや命令セットが優位な場合 (例: 一部の OpenSSL テストでの Xeon 17、gcrypt ハッシュでの Xeon 42)。
  • AVX-512 のような x86 固有の命令セットに高度に最適化されたワークロード (Graviton は SVE/SVE2 を搭載) 13
  • 特定の HPC コードで x86 が依然としてリードしている場合 (例: 一部テストでの GROMACS 17)。
  • コアあたりの性能は全体的に高いものの、特定のシナリオでは高クロック x86 コアのピークシングルスレッド性能に劣る可能性があります 13
  • 3D レンダリング (Blender) では x86 に遅れをとる結果が示されています 17
  • ソフトウェア互換性と移行の労力: アプリケーションやライブラリが Arm64 (AArch64) アーキテクチャ向けにコンパイルされている必要があります。エコシステムは広範に成長していますが 3、特定の OS、コンテナイメージ、ISV ソフトウェア、依存関係についてサポートを確認し、検証することが不可欠です。一般的な言語やフレームワーク (Java, Python, Node.js, Go, Ruby,.NET Core, PHP) では移行の労力は最小限であると報告されることが多いですが 7、カスタムソフトウェアや古いソフトウェアではより多くの作業が必要になる可能性があります。CI/CD パイプラインをマルチアーキテクチャビルドに対応させる必要も考慮すべきです 61。AWS は Porting Advisor for Graviton のようなツールを提供しています 3
  • 互換性の壁: Arm ソフトウェアエコシステムは大幅に成熟しましたが 20、ニッチなソフトウェア、レガシーシステム、あるいは特定のプロプライエタリなサードパーティ製ソフトウェアとの互換性の問題は、一部の組織にとって Graviton 採用の最大の現実的な障壁となり得ます。Graviton の価格性能メリットに関わらず、重要なソフトウェアコンポーネント (特定の ISV アプリケーション、カスタムビルドのバイナリ、古いライブラリなど) が Arm64 版を提供していない、あるいは再コンパイル後に性能が出ない場合、移行が頓挫する可能性があります。そのため、移行前の徹底的なテストと依存関係の分析は譲れないステップとなります。

導入推奨シナリオ

上記の点を踏まえ、Graviton4 の導入が特に推奨されるシナリオは以下の通りです。

  • 新規アプリケーション開発: Graviton4 の強みが活きるワークロードでは、最初から Graviton4 をデフォルトとして採用し、最高の価格性能を活用する。
  • 既存ワークロードのコスト最適化: 古い x86 インスタンス (例: M5, R5, C5) で稼働している Web サーバー、データベース、キャッシュ、データ処理パイプラインなど、コンピューティングコストが高いワークロードを Graviton4 に移行し、大幅なコスト削減と多くの場合性能向上を目指す 36。移行はリスクの低いワークロードから開始し、検証を進めるのが賢明です 66
  • 持続可能性目標を持つ組織: Graviton4 のエネルギー効率を活用し、二酸化炭素排出量を削減する 3
  • マネージドサービスの利用: RDS, Aurora, ElastiCache, OpenSearch, EKS/ECS Fargate など、Graviton ベースのオプションが利用可能なマネージドサービスを利用している場合、容易に価格性能の向上を実現するために移行を検討する 3

結論

AWS Graviton4 は、前世代の Graviton3 から著しい進化を遂げ、AWS が主張する通り、多くの主要なクラウドワークロード (Web、データベース、Java、HPC、AI 推論、コンピレーションなど) において 30% 以上の性能向上を実現しています。この性能向上は、Arm Neoverse V2 アーキテクチャの採用と、大幅に強化されたメモリサブシステムによって支えられています。

クラウドコンピューティング市場において、Graviton4 は AWS の Arm ベースコンピューティングにおけるリーダーシップを確固たるものにし、Intel Sapphire/Emerald Rapids や AMD Genoa といった同時代の x86 プロセッサに対する極めて競争力のある代替選択肢としての地位を確立しました。一部の特定のワークロードやピーク性能では最高性能の x86 チップに譲る場面もありますが、Graviton4 は多くのワークロードでそれらに匹敵するか上回る性能を示し、一貫して優れた価格性能とエネルギー効率を提供します。これは、データセンターにおける長年の x86 複占に対する信頼できる脅威となっています 8

Graviton プロセッサの急速なリリースサイクル (約 5 年で 4 世代) 18 は、AWS が今後も Arm ベースの性能向上を積極的に推進していくことを示唆しています。AMD (Turin) や Intel (Granite Rapids) が次世代 x86 チップをリリースし 12、Ampere Computing のような他の Arm ベンダーも進化を続ける中で 14、競争はさらに激化するでしょう。Arm 向けソフトウェアエコシステムの継続的な最適化も、今後の成功にとって不可欠な要素となります。Graviton4 の登場は、Arm がもはやニッチな存在ではなく、要求の厳しい多様なクラウドワークロードに対応可能な、主流の高性能オプションであることを明確に示しています。

引用文献

  1. AWS EC2 Graviton Getting Started Step-by-Step Guide – Amazon.com, 5月 1, 2025にアクセス、 https://aws.amazon.com/ec2/graviton/getting-started/
  2. What is AWS Graviton? – AWS Graviton Performance Testing: Tips for Independent Software Vendors – AWS Documentation, 5月 1, 2025にアクセス、 https://docs.aws.amazon.com/whitepapers/latest/aws-graviton-performance-testing/what-is-aws-graviton.html
  3. AWS Graviton Processor – Amazon EC2, 5月 1, 2025にアクセス、 https://aws.amazon.com/ec2/graviton/
  4. What Is AWS Graviton? Here’s When To Use It – CloudZero, 5月 1, 2025にアクセス、 https://www.cloudzero.com/blog/aws-graviton/
  5. AWS Graviton: Best Price Performance, 5月 1, 2025にアクセス、 https://aws.amazon.com/awstv/watch/acde308f81f/
  6. Now available: Graviton4-powered memory-optimized Amazon EC2 …, 5月 1, 2025にアクセス、 https://aws.amazon.com/blogs/aws/now-available-graviton4-powered-memory-optimized-amazon-ec2-x8g-instances/
  7. AWS Graviton4-based Amazon EC2 R8g instances: best price performance in Amazon EC2, 5月 1, 2025にアクセス、 https://aws.amazon.com/blogs/aws/aws-graviton4-based-amazon-ec2-r8g-instances-best-price-performance-in-amazon-ec2/
  8. AWS Graviton4 in 2025: Arm Chips Boost Cloud Efficiency – DEV Community, 5月 1, 2025にアクセス、 https://dev.to/justin_downes/aws-graviton4-in-2025-arm-chips-boost-cloud-efficiency-3d56
  9. Amazon Unveils Graviton4: A 96-Core ARM CPU with 536.7 GBps Memory Bandwidth, 5月 1, 2025にアクセス、 https://www.anandtech.com/show/21172/amazon-unveils-graviton4-a-96core-cpu-with-5367-gbs-memory-bandwidth
  10. Accelerating Cloud Innovation with AWS Graviton4 Processors, Powered by Arm Neoverse, 5月 1, 2025にアクセス、 https://newsroom.arm.com/blog/arm-aws-reinvent-2024
  11. Intel vs AMD vs Graviton: Amazon EC2 Processor Differences and …, 5月 1, 2025にアクセス、 https://www.vantage.sh/blog/aws-ec2-processors-intel-vs-amd-vs-graviton-adoption
  12. Intel and AMD won’t like that: Detailed benchmarking of Amazon …, 5月 1, 2025にアクセス、 https://www.techradar.com/pro/intel-and-amd-wont-like-that-detailed-benchmarking-of-amazon-graviton4-shows-fantastic-performanceprice-this-is-the-biggest-server-cpu-threat-yet-to-x86-duopoly-and-it-wont-go-away
  13. AMD vs Intel vs Graviton: Comparison between Modern Processors – CloudOptimo, 5月 1, 2025にアクセス、 https://www.cloudoptimo.com/blog/amd-vs-intel-vs-graviton-comparison-between-modern-processors/
  14. Tests Show Arm Server Chips Rival x86 Processors – XPU.pub, 5月 1, 2025にアクセス、 https://xpu.pub/2024/08/19/graviton-vs-x86/
  15. NVIDIA Grace Superchip Early Evaluation for HPC Applications – UPCommons, 5月 1, 2025にアクセス、 https://upcommons.upc.edu/bitstream/handle/2117/414438/grace-early-access.pdf;jsessionid=E6F0AFC8C69B316A0971688960B145F7?sequence=1
  16. AWS Graviton4 Benchmarks Prove To Deliver The Best ARM Cloud Server Performance, 5月 1, 2025にアクセス、 https://www.phoronix.com/review/aws-graviton4-benchmarks
  17. AWS Graviton4 CPU benchmarked against AMD and Intel processors — faster than predecessors and more cost-effective | Tom’s Hardware, 5月 1, 2025にアクセス、 https://www.tomshardware.com/pc-components/cpus/aws-graviton4-cpu-benchmarked-against-amd-and-intel-processors-faster-than-predecessors-and-more-cost-effective-than-incumbents
  18. Graviton4 Leads HPC Performance – Servers and Cloud Computing blog – Arm Community, 5月 1, 2025にアクセス、 https://community.arm.com/arm-community-blogs/b/servers-and-cloud-computing-blog/posts/leading-hpc-performance-with-graviton4
  19. Run Llama 3 70B on AWS Graviton4 – Servers and Cloud Computing blog – Arm Community, 5月 1, 2025にアクセス、 https://community.arm.com/arm-community-blogs/b/servers-and-cloud-computing-blog/posts/running-llama-3-70b-on-aws-graviton4
  20. How ClickHouse Cloud uses AWS Graviton to boost performance and efficiency, 5月 1, 2025にアクセス、 https://clickhouse.com/blog/graviton-boosts-clickhouse-cloud-performance
  21. Amazon’s Graviton Has Evolved Into A Formidable CPU Contender …, 5月 1, 2025にアクセス、 https://www.phoronix.com/review/aws-graviton-graviton4
  22. AWS Graviton4 96-Core Performance vs. AMD EPYC & Intel Xeon …, 5月 1, 2025にアクセス、 https://www.phoronix.com/review/graviton4-96-core
  23. Performance gains with AWS Graviton4 – a DevitoPRO case study | AWS HPC Blog, 5月 1, 2025にアクセス、 https://aws.amazon.com/blogs/hpc/performance-gains-with-aws-graviton4-a-devitopro-case-study/
  24. re:Invent 2024: AWSのGravitonチップ進化と性能向上、Robinhoodの活用事例 – Zenn, 5月 1, 2025にアクセス、 https://zenn.dev/kiiwami/articles/31185b3ecef00627
  25. Amazon EC2 Instance Types – Compute – AWS, 5月 1, 2025にアクセス、 https://aws.amazon.com/ec2/instance-types/
  26. AWS Graviton4 ベースの Amazon EC2 R8g インスタンス: Amazon EC2 史上最高のコストパフォーマンス | Amazon Web Services, 5月 1, 2025にアクセス、 https://aws.amazon.com/jp/blogs/news/aws-graviton4-based-amazon-ec2-r8g-instances-best-price-performance-in-amazon-ec2/
  27. AWS Graviton4 Benchmarks Prove To Deliver The Best ARM Cloud Server Performance – Phoronix, 5月 1, 2025にアクセス、 https://www.phoronix.com/review/aws-graviton4-benchmarks/2
  28. AWS Graviton3 – CelerData, 5月 1, 2025にアクセス、 https://celerdata.com/glossary/aws-graviton3
  29. Amazon EC2 X8g instances – AWS, 5月 1, 2025にアクセス、 https://aws.amazon.com/ec2/instance-types/x8g/
  30. Amazon EC2 R8g instances – AWS, 5月 1, 2025にアクセス、 https://aws.amazon.com/ec2/instance-types/r8g/
  31. AWS Graviton The best price performance for your AWS workloads – Using this event template, 5月 1, 2025にアクセス、 https://d1.awsstatic.com/events/Summits/reinvent2023/CMP313_AWS-Graviton-The-best-price-performance-for-your-AWS-workloads.pdf
  32. AWS 新CPU Graviton4 の性能検証 | 外道父の匠, 5月 1, 2025にアクセス、 https://blog.father.gedow.net/2024/07/16/aws-graviton4-benchmark/
  33. Amazon EC2 I8g インスタンス – AWS, 5月 1, 2025にアクセス、 https://aws.amazon.com/jp/ec2/instance-types/i8g/
  34. Graviton4リリース!EC2インスタンスのコスト削減でよく出るワード「Graviton」とは? – Qiita, 5月 1, 2025にアクセス、 https://qiita.com/yoshimi0227/items/496044762e34449c6a81
  35. 2025-04-23 – Daily AWS, 5月 1, 2025にアクセス、 https://www.daily-aws.com/ja/headlines/20250423/
  36. A Deep Dive into AWS Graviton Instances – CloudOptimo, 5月 1, 2025にアクセス、 https://www.cloudoptimo.com/blog/a-deep-dive-into-aws-graviton-instances/
  37. Performance evaluation of the new X8g instance family : r/aws – Reddit, 5月 1, 2025にアクセス、 https://www.reddit.com/r/aws/comments/1fkxvf9/performance_evaluation_of_the_new_x8g_instance/
  38. Benchmarks – SPEC.org, 5月 1, 2025にアクセス、 https://www.spec.org/products/
  39. Geekbench 6 – Cross-Platform Benchmark, 5月 1, 2025にアクセス、 https://www.geekbench.com/
  40. Geekbench 6 CPU Workloads, 5月 1, 2025にアクセス、 https://www.geekbench.com/doc/geekbench6-cpu-workloads.pdf
  41. Processor Benchmarks – Geekbench Browser, 5月 1, 2025にアクセス、 https://browser.geekbench.com/processor-benchmarks
  42. ついにGA!AWS Graviton4 r8gの詳細。そして恒例のベンチマーク, 5月 1, 2025にアクセス、 https://www.seeds-std.co.jp/blog/creators/2024-07-ga-graviton4-benchmark/
  43. NGINX Benchmark Benchmark – OpenBenchmarking.org, 5月 1, 2025にアクセス、 https://openbenchmarking.org/test/pts/nginx
  44. Apache vs. Nginx performance benchmark – YouTube, 5月 1, 2025にアクセス、 https://www.youtube.com/watch?v=Fx8afVZJLd4
  45. AWS Graviton and Arm Neoverse Enable the Best Price-performance in Amazon EC2, 5月 1, 2025にアクセス、 https://www.arm.com/partners/aws
  46. AWS Graviton4 96-Core Performance vs. AMD EPYC & Intel Xeon CPU Benchmarks, 5月 1, 2025にアクセス、 https://www.phoronix.com/review/graviton4-96-core/5
  47. Are you missing out on AWS Graviton Cost Savings? – nOps, 5月 1, 2025にアクセス、 https://www.nops.io/blog/are-you-missing-out-on-aws-graviton-cost-savings/
  48. AWS Graviton4 Benchmarks Prove To Deliver The Best ARM Cloud Server Performance – Phoronix, 5月 1, 2025にアクセス、 https://www.phoronix.com/review/aws-graviton4-benchmarks/6
  49. Google Axion C4A Vs. AWS Graviton4 Benchmarks Performance – OpenBenchmarking.org, 5月 1, 2025にアクセス、 https://openbenchmarking.org/result/2411071-NE-AXIONC4AG01&sgm=1&sor&grs
  50. GROMACS | AWS HPC Blog, 5月 1, 2025にアクセス、 https://aws.amazon.com/blogs/hpc/tag/gromacs/
  51. Benchmarking llama.cpp on Arm Neoverse-based AWS Graviton instances with ClearML, 5月 1, 2025にアクセス、 https://clear.ml/blog/benchmarking-llama-cpp-on-arm-neoverse-based-aws-graviton-instances-with-clearml
  52. Improve RAG performance with torch.compile on AWS Graviton Processors | PyTorch, 5月 1, 2025にアクセス、 https://pytorch.org/blog/improve-rag-performance/
  53. Geekbench AI – Cross-Platform AI Benchmark, 5月 1, 2025にアクセス、 https://www.geekbench.com/ai/
  54. AWS Graviton4 vs. AmpereOne 192-Core Benchmarks For Leading AArch64 Server Performance – Phoronix, 5月 1, 2025にアクセス、 https://www.phoronix.com/review/ampereone-aws-graviton4/8
  55. Graviton4 Vs. Graviton3 Vs. Graviton2 + AMD EPYC, Intel Xeon AWS Benchmarks, 5月 1, 2025にアクセス、 https://openbenchmarking.org/result/2407111-NE-AWS4GRAVI72&sgm=1&ppd_RVBZQyA5UjE0IHI3YS4xNnhsYXJnZQ=4.869&ppd_R3Jhdml0b24yIHI2Zy4xNnhsYXJnZQ=3.226&ppd_R3Jhdml0b24zIHI3Zy4xNnhsYXJnZQ=3.427&ppd_R3Jhdml0b240IHI4Zy4xNnhsYXJnZQ=3.770&ppd_WGVvbiA4NDg4QyByN2kuMTZ4bGFyZ2U=4.234&ppt=DPH&sor
  56. Google Axion CPU With GCE C4A vs. AWS Graviton4 Performance Review – Phoronix, 5月 1, 2025にアクセス、 https://www.phoronix.com/review/google-axion-graviton4
  57. AWS Graviton4 Benchmarks Prove To Deliver The Best ARM Cloud Server Performance – Phoronix, 5月 1, 2025にアクセス、 https://www.phoronix.com/review/aws-graviton4-benchmarks/7
  58. re:Invent 2024: AWSがGraviton4でAI/ML性能を30%向上 – EC2セッション – Zenn, 5月 1, 2025にアクセス、 https://zenn.dev/kiiwami/articles/6b49fe6ecc373015
  59. Arm NeoverseベースのAWS Graviton4プロセッサーがクラウドのイノベーションを加速, 5月 1, 2025にアクセス、 https://www.arm.com/ja/company/news/2024/12/arm-aws-reinvent-2024
  60. Amazon RDS for PostgreSQL, MySQL, and MariaDB now supports M8g and R8g database instances – AWS, 5月 1, 2025にアクセス、 https://aws.amazon.com/about-aws/whats-new/2024/11/amazon-rds-postgresql-mysql-mariadb-m8g-r8g-instances/
  61. AWS Graviton Customer & Partners Testimonials – Amazon Web Services, 5月 1, 2025にアクセス、 https://aws.amazon.com/ec2/graviton/customers/
  62. High Performance SQL: AWS Graviton2 Benchmarks with Presto and Treasure Data CDP, 5月 1, 2025にアクセス、 https://www.treasuredata.com/blog/high-performance-sql-aws-graviton2-benchmarks-with-presto-and-arm-treasure-data-cdp
  63. AWS Graviton4 96-Core Performance vs. AMD EPYC & Intel Xeon CPU Benchmarks, 5月 1, 2025にアクセス、 https://www.reddit.com/r/hardware/comments/1e6nf13/aws_graviton4_96core_performance_vs_amd_epyc/
  64. AWS Graviton4 Metal vs. Intel Xeon vs. Ampere Altra vs. AMD EPYC Benchmarks, 5月 1, 2025にアクセス、 https://openbenchmarking.org/result/2407128-PTS-GRAVITON53&sor&sgm
  65. AWS Graviton4 Benchmarks Prove To Deliver The Best ARM Cloud Server Performance, 5月 1, 2025にアクセス、 https://www.reddit.com/r/hardware/comments/1e299pn/aws_graviton4_benchmarks_prove_to_deliver_the/
  66. The Rise of Graviton at AWS and How You Can Save by Switching – Vantage, 5月 1, 2025にアクセス、 https://www.vantage.sh/blog/aws-graviton-vs-intel
  67. AWS Graviton4 vs. AmpereOne 192-Core Benchmarks For Leading …, 5月 1, 2025にアクセス、 https://www.phoronix.com/review/ampereone-aws-graviton4
タイトルとURLをコピーしました