- 1. AWS Graviton3プロセッサ概要
- 2. クラウドインスタンスのベンチマーク手法
- 3. ワークロード別ベンチマーク比較分析
- 4. 価格性能比の考察
- 5. 結論
1. AWS Graviton3プロセッサ概要
1.1. 導入と背景
Amazon Web Services (AWS) は、クラウドコンピューティング市場におけるリーダーシップを維持・強化するため、ハードウェア、特にプロセッサの自社設計・開発に注力してきました。このカスタムシリコン戦略は、初代AWS Gravitonプロセッサの登場から始まり、クラウドワークロード特有の要求に応える形で進化を続けています 1。AWSは、汎用的なx86プロセッサ(Intel XeonやAMD EPYC)への依存を減らし、自社のクラウド環境に最適化されたチップを開発することで、コスト削減とパフォーマンス向上を両立させることを目指しています 1。
2019年に発表された第2世代のGraviton2プロセッサは、Arm Neoverse N1コアを採用し、当時のx86ベースのインスタンス(M5, C5, R5など)と比較して最大40%優れた価格性能比を実現したと報告されました 2。この成功を受け、AWSはさらに性能と効率を高めた第3世代プロセッサの開発を進めました。
AWS Graviton3プロセッサは、2021年のAWS re:Inventイベントでプレビューとして発表され 2、大きな注目を集めました。その後、2022年5月には、Graviton3を搭載した最初のコンピューティング最適化インスタンスファミリーであるC7gが一般提供開始となり 7、続いて汎用(M7g)やメモリ最適化(R7g)などのファミリーも展開されました 10。
1.2. アーキテクチャと設計目標
AWS Graviton3は、前世代のGraviton2が採用したArm Neoverse N1コアから、より高性能なArm Neoverse V1コアへと移行しました 9。Neoverse V1は、N1と比較してシングルスレッド性能やベクトル演算性能が強化されており、より計算集約的なワークロードへの対応を目指した選択と考えられます。
物理的な構造としては、Graviton3は7つのチップレットで構成されると報告されています。中央に演算コアを集積したモノリシックな大型ダイがあり、その周囲にDDR5メモリコントローラやPCIe Gen5コントローラなどのチップレットが配置される設計です 13。この設計により、チップレット間の通信が必要となる場合でも、一貫性のあるメモリアクセスレイテンシを提供することを目指していると推測されます 13。
特筆すべき点として、Graviton3はクラウド向けCPUとして初めてDDR5メモリを採用しました。これにより、従来のDDR4メモリと比較してメモリ帯域幅が50%向上し 6、データベースやインメモリキャッシュなど、メモリ性能がボトルネックとなりやすいワークロードでの大幅な性能向上が期待されます。
AWSは、Graviton3の性能目標として、Graviton2プロセッサと比較して以下の点を挙げています。
- 最大25%高い演算性能 3。
- 最大2倍高い浮動小数点性能 3。これは科学技術計算、機械学習、メディアエンコーディングなどに有効です。
- 最大2倍高速な暗号化ワークロード性能 3。HTTPS通信などのセキュリティ関連処理の高速化に寄与します。
- 最大3倍高い機械学習(ML)性能 3。bfloat16およびfp16データ型のサポートが含まれており、推論処理の高速化が期待されます。
これらの性能向上に加え、Graviton3はエネルギー効率も重視して設計されています。AWSによると、同等の性能を持つ他のEC2インスタンスと比較して、最大60%少ないエネルギー消費で動作するとされています 3。これは、データセンター全体の消費電力削減に貢献するだけでなく、運用コストの低減や企業の持続可能性目標達成にも寄与する可能性があります 12。
セキュリティ面では、Graviton3プロセッサは常時メモリ暗号化、各vCPU専用のキャッシュ、ポインタ認証といった機能をハードウェアレベルでサポートしています 7。これらは、AWS Nitro System 8 と呼ばれるAWS独自のハードウェアとハイパーバイザーの基盤上に構築されており、マルチテナント環境におけるセキュリティと分離性を高めています。
Graviton3の設計目標を俯瞰すると、単に汎用的な演算性能(最大25%向上)を引き上げるだけでなく、DDR5採用によるメモリ帯域幅の大幅な改善、浮動小数点演算、暗号処理、機械学習といった特定分野のアクセラレーション、そしてエネルギー効率の向上という、多面的なアプローチが見て取れます。これは、AWSが特定のクラウドネイティブなワークロードにおける性能と総所有コスト(TCO)の最適化を強く意識していることの表れと言えるでしょう。特にDDR5メモリの採用は、データベースやキャッシュサーバーなど、クラウドで多用されるメモリ集約型アプリケーションの性能を直接的に向上させる重要なアーキテクチャ上の選択です。
1.3. ターゲットワークロードとインスタンスファミリー
Graviton3プロセッサは、その特性を活かして様々なワークロード向けに最適化されたEC2インスタンスファミリーに搭載されています。
- C7g/C7gd/C7gn (コンピューティング最適化): 高性能コンピューティング(HPC)、バッチ処理、動画エンコーディング、ゲームサーバー、科学技術計算モデリング、分散分析、CPUベースの機械学習推論、広告配信といった、CPU性能を要求するワークロードに適しています 7。Graviton2ベースのC6gインスタンスと比較して最大25%の性能向上が謳われています 8。C7gdはローカルNVMe SSDストレージを搭載し、高速・低遅延なストレージアクセスが必要な場合に適しています 16。C7gnは、Graviton3の派生版であるGraviton3Eプロセッサと第5世代Nitroカードを搭載し、最大200Gbpsのネットワーク帯域幅と高いパケット処理性能を提供します 16。
- M7g/M7gd (汎用): アプリケーションサーバー、マイクロサービス、ゲームサーバー、中規模データストア、キャッシュフリートなど、コンピューティング、メモリ、ネットワークリソースのバランスが求められる汎用的なワークロード向けです 10。Graviton2ベースのM6gインスタンス比で最大25%の性能向上が見込まれます 10。M7gdはローカルNVMe SSDを搭載します。
- R7g/R7gd (メモリ最適化): オープンソースデータベース(MySQL, PostgreSQLなど)、インメモリキャッシュ(Redis, Memcachedなど)、リアルタイムビッグデータ分析といった、大容量メモリと高いメモリ帯域幅を必要とするワークロードに最適化されています 10。Graviton2ベースのR6gインスタンス比で最大25%の性能向上が期待されます 10。R7gdはローカルNVMe SSDを搭載します。
- Hpc7g (HPC最適化): Graviton3Eプロセッサを搭載し、密結合型のHPCワークロード向けに特化しています。Graviton3比で最大35%高いベクトル演算性能、Graviton2比で最大2倍の浮動小数点性能を提供します 4。
これらのEC2インスタンスに加え、Amazon RDS (Relational Database Service) 11 や Amazon EKS (Elastic Kubernetes Service) 23 といった主要なマネージドサービスでもGraviton3ベースのオプションが提供されており、ユーザーはインフラ管理の負担を軽減しつつGraviton3のメリットを享受できます。
表1: Graviton3インスタンスの主な仕様
インスタンスファミリー | サイズ | vCPU | メモリ (GiB) | ネットワーク帯域幅 (Gbps) | EBS帯域幅 (Gbps) |
C7g | medium | 1 | 2 | 最大 12.5 | 最大 10 |
large | 2 | 4 | 最大 12.5 | 最大 10 | |
xlarge | 4 | 8 | 最大 12.5 | 最大 10 | |
2xlarge | 8 | 16 | 最大 15 | 最大 10 | |
4xlarge | 16 | 32 | 最大 15 | 最大 10 | |
8xlarge | 32 | 64 | 15 | 10 | |
12xlarge | 48 | 96 | 22.5 | 15 | |
16xlarge | 64 | 128 | 30 | 20 | |
metal | 64 | 128 | 30 | 20 | |
M7g | medium | 1 | 4 | 最大 12.5 | 最大 10 |
large | 2 | 8 | 最大 12.5 | 最大 10 | |
xlarge | 4 | 16 | 最大 12.5 | 最大 10 | |
2xlarge | 8 | 32 | 最大 15 | 最大 10 | |
4xlarge | 16 | 64 | 最大 15 | 最大 10 | |
8xlarge | 32 | 128 | 15 | 10 | |
12xlarge | 48 | 192 | 22.5 | 15 | |
16xlarge | 64 | 256 | 30 | 20 | |
metal | 64 | 256 | 30 | 20 | |
R7g | medium | 1 | 8 | 最大 12.5 | 最大 10 |
large | 2 | 16 | 最大 12.5 | 最大 10 | |
xlarge | 4 | 32 | 最大 12.5 | 最大 10 | |
2xlarge | 8 | 64 | 最大 15 | 最大 10 | |
4xlarge | 16 | 128 | 最大 15 | 最大 10 | |
8xlarge | 32 | 256 | 15 | 10 | |
12xlarge | 48 | 384 | 22.5 | 15 | |
16xlarge | 64 | 512 | 30 | 20 | |
metal | 64 | 512 | 30 | 20 |
出典: 7
この表は、本レポートで主に比較対象となる汎用、コンピューティング最適化、メモリ最適化インスタンスの基本的なハードウェア構成を示しています。これらの仕様を把握することは、特定のインスタンスサイズ(例: large, xlarge, 4xlarge)間で行われるベンチマーク結果を解釈する上で不可欠な前提情報となります。
1.4. 競合プロセッサ (Intel Xeon, AMD EPYC) との基本的な違い
AWS Graviton3と、クラウド市場で広く利用されているIntel XeonおよびAMD EPYCプロセッサとの間には、いくつかの基本的な違いが存在します。
第一に、CPUアーキテクチャが異なります。GravitonはArmアーキテクチャを採用しており、これはRISC (Reduced Instruction Set Computing) に基づいています。一般にRISCは命令セットがシンプルで、電力効率に優れる傾向があります 32。一方、Intel XeonとAMD EPYCはx86アーキテクチャを採用しており、これはCISC (Complex Instruction Set Computing) に基づいています。CISCはより複雑な命令を一度に実行できますが、設計が複雑化し、消費電力が高くなる可能性があります 33。
第二に、仮想CPU(vCPU)と物理コアのマッピングが異なります。GravitonベースのEC2インスタンスでは、1つのvCPUが1つの物理コアに対応します 32。これに対し、Intel XeonやAMD EPYCベースのインスタンスでは、通常、1つの物理コアが同時マルチスレッディング(SMT、IntelではHyper-Threading)技術によって2つのvCPU(スレッド)として提供されます 32。つまり、同じvCPU数のインスタンスを比較する場合、GravitonインスタンスはIntel/AMDインスタンスの2倍の物理コアを持つことになります。
このvCPUと物理コアのマッピングの違いは、性能比較を複雑にする要因です。物理コア数が多いことは、特に並列処理性能においてGravitonに有利に働く可能性があります。一方で、x86のSMT技術は、特定のスループット重視のワークロード(データベースなど)において、単一コアのリソースを有効活用し、性能を向上させる効果が報告されています 36。しかし、高負荷時にはスレッド間のリソース競合が発生し、性能向上が頭打ちになる可能性も指摘されています 36。したがって、ベンチマーク結果、特に「vCPUあたり性能」や「vCPUあたりコスト」といった指標を解釈する際には、比較対象インスタンスの物理コア数を考慮に入れることが極めて重要です。例えば、後述するベンチマーク比較において、c7g.4xlarge (Graviton3) は16 vCPU/16物理コアであるのに対し、c6i.4xlarge (Intel Xeon) は16 vCPU/8物理コア(16スレッド)40、c6a.4xlarge (AMD EPYC) も16 vCPU/8物理コア(16スレッド)42 となっています。この違いが性能特性にどう影響するかを念頭に置く必要があります。
AWSがGravitonプロセッサを自社開発する背景には、技術的な側面だけでなく、ビジネス戦略的な意図も含まれています。IntelやAMDといった外部ベンダーへの依存度を低減し、プロセッサの設計、コスト構造、そして技術革新のペースを自社でコントロールすることが可能になります 1。これにより、AWSは特定のクラウドサービスやクラウドネイティブなワークロードに最適化された、よりコスト効率の高いコンピューティングリソースを顧客に提供できるようになります。これは、性能だけでなく、移行の容易さやコスト削減効果をアピールすることで 44、Gravitonプラットフォームへの顧客の移行を促進し、ある種のベンダーロックイン効果も狙った戦略と見ることができます。
2. クラウドインスタンスのベンチマーク手法
クラウド環境における仮想マシン(インスタンス)の性能を評価し比較するためには、体系的なベンチマーク手法が不可欠です。ここでは、その目的、種類、主要なツール、評価指標、そして実施上の注意点について解説します。
2.1. ベンチマークの目的と種類
クラウドインスタンスのベンチマークは、主に以下の目的で行われます。
- 性能比較: 異なるインスタンスタイプ、プロセッサ世代、あるいはクラウドプロバイダー間の性能差を定量的に比較する 45。
- コスト効率評価: 性能と価格(時間単価など)を組み合わせ、価格性能比(コストパフォーマンス)を評価する 47。
- サイジング: 特定のアプリケーションやワークロードに対して、適切な性能とコストを持つインスタンスサイズを選定する 46。
- ボトルネック特定: システムのどの部分(CPU、メモリ、ディスクI/O、ネットワーク)が性能の制約要因となっているかを特定する 45。
ベンチマークは、その性質によって大きく二つのカテゴリに分類できます。
- CPU/システムレベル(合成)ベンチマーク:
CPUの純粋な演算能力(整数演算、浮動小数点演算)、メモリアクセス速度(帯域幅、レイテンシ)、キャッシュ性能など、システムコンポーネントの基本的な性能を測定します。特定のアプリケーションに依存しないため、異なるハードウェア間の基礎体力比較に適しています。
- 例: SPEC CPU 48, Geekbench 45, sysbench (CPU, Memoryモード) 26, CoreMark 48, Phoronix Test Suite (PTS) に含まれる多くのテスト 9, HPL (LINPACK) 17, HPCC 61。
- アプリケーションレベル(実世界)ベンチマーク:
実際に想定されるアプリケーションやワークロードを実行し、その環境下での実性能(スループット、レイテンシなど)を測定します。合成ベンチマークよりも現実の利用シーンに近い性能評価が可能ですが、結果はアプリケーションやその設定に大きく依存します。
- 例:
- Webサーバー: NginxやApacheに対するリクエスト処理性能 (ツール: ApacheBench (ab), wrk, wrk2など) 42。
- データベース: オンライン・トランザクション処理 (OLTP) (ツール: sysbench (OLTPモード), HammerDBなど) 11、NoSQL (ツール: YCSB – Yahoo! Cloud Serving Benchmark) 46、分析処理 (ツール: TPC-H, TPC-DS) 46。
- HPC: SPEChpcスイート 48、NAS Parallel Benchmarks (NPB) 42、特定の科学技術計算アプリケーション (例: GROMACS, LAMMPS, OpenFOAM) 17。
- メディアエンコーディング/レンダリング: WebPエンコード 42, libavifエンコード 42, C-Ray 42, POV-Ray 42, Blender 60。
- 機械学習: TensorFlow Lite 42, ONNX Runtime 42, LeelaChessZero (チェスエンジン) 42, MLPerf 48。
- コンパイル時間: LLVM, GCC, Linuxカーネル, 各種アプリケーションのビルド時間 42。
- その他: データ圧縮 (7-Zip, Zstd) 42、暗号化処理 (OpenSSL) 42、Javaアプリケーション (DaCapo Benchmark Suite) 42、.NETアプリケーション 37。
- データセンター/ハイパースケール向け: Facebook (Meta) が開発したDCPerfは、データセンターで実行される多様なワークロードを代表するベンチマーク群を提供します 71。
2.2. 主要なベンチマークツール解説
本レポートで参照される主要なベンチマークツールについて解説します。
- SPEC CPU 2017: プロセッサ、メモリサブシステム、コンパイラの性能を評価するための業界標準ベンチマークスイートです 48。整数演算と浮動小数点演算のそれぞれについて、シングルタスクの実行時間を測る「Speed」(SPECspeed) と、単位時間あたりの処理能力(スループット)を測る「Rate」(SPECrate) の4つの主要メトリクスを提供します 50。結果はベースラインシステムに対する相対スコアで示され、高いほど高性能です。
- Geekbench: スマートフォンからサーバーまで、幅広いプラットフォームに対応したクロスプラットフォームベンチマークツールです 52。CPUのシングルコア性能とマルチコア性能、およびGPUの演算性能を測定します。暗号化、画像処理、機械学習など、実世界のタスクを模したテストが含まれています 45。結果は独自のスコアで表示され、オンラインデータベース (Geekbench Browser) で他のシステムと比較できます 52。ただし、コア数の多いサーバー環境では、そのスコアが実際のサーバープロセス性能を正確に反映しない場合があるとの指摘もあります 47。
- sysbench: CPU、メモリ、ディスクI/O、およびOLTPデータベース(MySQL, PostgreSQL)の性能を測定するための、軽量でスクリプト可能なマルチスレッドベンチマークツールです 45。CPUテストでは指定された上限までの素数計算 45、メモリテストでは指定サイズのブロックでの読み書きによる帯域幅やレイテンシ 45、OLTPテストではトランザクション処理性能 45 を測定します。設定パラメータ(スレッド数、テスト時間、データ量など)によって結果が大きく変動するため、比較の際は設定を揃えることが重要です 46。
- Phoronix Test Suite (PTS): オープンソースの包括的なベンチマークプラットフォームで、非常に多くのテストプロファイル(CPU、GPU、メモリ、ストレージ、各種アプリケーション)をサポートしています 47。テストの自動実行、結果の比較、オンラインデータベースOpenBenchmarking.orgとの連携が可能です 47。クラウド環境でのベンチマークにも適していると評価されています 47。本レポートで引用するOpenBenchmarking.orgの結果は、このPTSを用いて取得されたものです 9。
- アプリケーション固有ツール: 特定のアプリケーションの性能を測るためには、そのアプリケーションに関連するツールが用いられます。例えば、Webサーバーの性能測定にはwrk, wrk2, abなどが、データベースの性能測定にはYCSB, HammerDB, pgbench, mysqlslapなどが、HPCアプリケーションではそれぞれの標準入力データセットが用いられます。
2.3. 評価指標
ベンチマーク結果を評価するために、主に以下の指標が用いられます。
- スループット (Throughput): 単位時間あたりに処理できる仕事量を示します。指標の例としては、Webサーバーのリクエスト毎秒 (RPS: Requests Per Second)、データベースのトランザクション毎秒 (TPS: Transactions Per Second) やクエリ毎秒 (QPS: Queries Per Second)、演算性能を示すMop/s (Million Operations per Second) やGFLOP/s (Giga Floating point Operations per Second)、データ転送速度を示すMB/sやGB/s、機械学習の推論回数/分などがあります 3。一般的に、この値が高いほど高性能です。
- レイテンシ (Latency): ある処理が完了するまでにかかる時間を示します。ミリ秒 (ms) や秒 (sec) で表されることが多いです。平均レイテンシだけでなく、応答時間のばらつきを示すために最大レイテンシやパーセンタイル値(例: 95パーセンタイル、99パーセンタイル)も重要な指標となります。特にインタラクティブなシステムでは、平均値が低くても一部のリクエストのレイテンシが極端に大きいとユーザー体験を損なうため、パーセンタイル値が重視されます 11。一般的に、この値が低いほど高性能です。
- スコア (Score): ベンチマークツールが独自の計算方法に基づいて算出する総合的な性能指標です。Geekbench ScoreやSPECrate Score、7-ZipのMIPSなどがこれに該当します 42。異なるツール間のスコアは直接比較できません。
- 価格性能比 (Price/Performance): 上記の性能指標(スループットやスコアなど)を、インスタンスの時間単価などのコストで割った値です。コストあたりの性能効率を示し、費用対効果を評価する上で非常に重要な指標となります 2。
2.4. ベンチマーク実施上の注意点
クラウド環境でベンチマークを実施し、その結果を解釈する際には、いくつかの注意点があります。
- 再現性と環境: クラウドインスタンスは物理サーバー上のリソースを共有しているため、「ノイジーネイバー」(他のテナントの高負荷)の影響を受けて性能が変動する可能性があります。そのため、信頼性のある結果を得るためには、複数回テストを実行し、平均値や中央値、標準偏差などを確認することが推奨されます 46。また、比較可能性を確保するためには、テストに使用した環境(OS、カーネルバージョン、コンパイラ、ライブラリバージョン、ベンチマークツールのバージョン、設定パラメータなど)を正確に記録し、明記することが不可欠です 42。
- バースト性能: EC2のT系インスタンスにおけるCPUクレジットのように、一部のクラウドインスタンスリソース(CPU、ディスクI/O、ネットワーク帯域)は、短時間であればベースライン性能を超える「バースト」が可能です 46。ベンチマーク実施時には、このバースト性能の影響を考慮する必要があります。短時間のテストではバースト性能が結果を良く見せる可能性があるため、定常状態での性能を評価するには十分なテスト時間が必要です 46。あるいは、意図的にバーストクレジットを使い切った状態でテストし、ベースライン性能を測定する方法もあります 46。
- テスト期間とワークロード: CPUのみを対象とするようなテストでは比較的短時間(例: 10秒)でも安定した結果が得られるかもしれませんが、ストレージシステムを含むようなテストでは、キャッシュの影響などを排除し安定した性能を測定するために、より長いテスト期間(例: 30秒以上)が推奨されます 46。また、ベンチマークに使用するワークロードは、できる限り実際の利用シナリオを反映したものを選ぶことが重要です 46。合成ベンチマークの結果が、必ずしも実アプリケーションの性能を正確に予測するとは限りません。
クラウドベンチマークの結果を解釈する際には、これらの点を踏まえる必要があります。公開されているベンチマークデータは、特定の条件下で取得されたスナップショットに過ぎません。利用者の実際のワークロード、実行タイミング、周辺環境(ネットワーク状況など)によって、性能は変動し得ます。特に、異なる情報源からのベンチマーク結果を比較する場合や、一見矛盾するような結果(例えば、後述するNginxのベンチマークにおけるIntelとArmの主張の違い 66)を評価する際には、それぞれのテストがどのような環境、設定、ワークロードで行われたのか、詳細情報を確認することが極めて重要です。テスト条件の違いが結果の違いを生む主な要因であることが多いため、表面的な数値だけを比較するのではなく、その背景にあるコンテキストを理解しようと努めるべきです。
表2: 主なベンチマークツールの概要
ツール名 | 主要指標例 | 主な用途・測定対象 |
SPEC CPU 2017 | SPECrate/SPECspeed Score (Integer/FP) | CPU演算性能(整数/浮動小数点)、メモリサブシステム、コンパイラ性能 |
Geekbench | Single/Multi-Core Score, Compute Score | CPUコア性能、GPU演算性能(クロスプラットフォーム比較) |
sysbench (CPU) | Events/sec, Total time, Latency (ms) | CPU演算速度(素数計算) |
sysbench (Memory) | Operations/sec, Total time (s), Bandwidth (MiB/s), Latency (ms) | メモリ帯域幅、メモリアクセスレイテンシ |
sysbench (FileIO) | Requests/sec (IOPS), Throughput (MiB/s), Latency (ms) | ディスクI/O性能(ランダム/シーケンシャル रीड/ライト) |
sysbench (OLTP) | Transactions/sec (TPS), Queries/sec (QPS), Latency (ms) | データベース性能(MySQL, PostgreSQL向けOLTPワークロード) |
Nginx Bench (wrk, wrk2, ab) | Requests/sec (RPS), Latency (ms), Throughput (MB/s) | Webサーバー性能(HTTP/HTTPSリクエスト処理能力) |
YCSB (Yahoo! Cloud Serving B.) | Operations/sec (OPS), Latency (ms) | NoSQLデータベース性能(キーバリュー操作など) |
Phoronix Test Suite (PTS) | 各テスト固有(多岐にわたる) | CPU, GPU, メモリ, ストレージ, ネットワーク, アプリケーションなど、広範なシステムコンポーネントの性能評価(自動化・比較) |
HPL (High Performance Linpack) | GFLOP/s | HPCにおける密行列演算性能(スーパーコンピュータのランキングTop500で使用) |
SPEChpc | スイート固有の性能指標 | HPCアプリケーション(科学技術計算)の実性能評価 |
GROMACS, LAMMPS, etc. | ns/day (シミュレーション速度) | 分子動力学など特定のHPCアプリケーション性能 |
OpenSSL | Operations/sec (sign/verify), Throughput (bytes/sec) | 暗号化・復号処理性能(RSA, AES, SHAなど) |
7-Zip, Zstd | Compression/Decompression Speed (MB/s), Rating (MIPS) | データ圧縮・解凍性能 |
Blender, C-Ray, POV-Ray | Render Time (seconds) | 3Dレンダリング性能 |
TensorFlow Lite, ONNX Runtime | Inferences/sec or minute, Latency (microseconds) | 機械学習モデルの推論性能 |
Compilation Tests (LLVM, etc.) | Time to Compile (seconds) | ソフトウェアのビルド時間 |
.NET Benchmarks (Bombardier) | Requests/sec (RPS), Latency (ms) | .NET Webアプリケーションの性能 |
出典: 11
この表は、本レポートで引用される可能性のある様々なベンチマークツールとその目的、主要な評価指標をまとめたものです。これにより、後続のセクションで提示される多様なベンチマーク結果の背景にある測定内容を理解しやすくなります。
3. ワークロード別ベンチマーク比較分析
ここでは、収集したベンチマークデータをワークロードの種類(計算集約型、メモリ集約型、Webサービス・汎用、その他)ごとに分類し、AWS Graviton3インスタンスの性能を、Graviton2、Intel Xeon、AMD EPYC搭載インスタンスと比較分析します。
3.1. 計算集約型ワークロード (HPC, Video Encoding, Scientific Modeling, Compilationなど)
計算集約型ワークロードは、CPUの演算能力、特に浮動小数点演算性能や並列処理能力が性能を大きく左右します。
3.1.1. Graviton3 vs Graviton2 (c7g vs c6g)
AWSは公式に、Graviton3 (C7g) がGraviton2 (C6g) に対して最大25%高い演算性能と、最大2倍の浮動小数点性能を提供すると発表しています 4。
実際のベンチマーク結果を見ると、この主張を裏付ける、あるいはそれを上回る性能向上が確認されています。
- Sysbench CPU: c7g.xlargeはc6g.xlargeに対し、1秒あたりのイベント数で約103%高いスコア(4426.78 vs 2181.39 events/sec)を記録しました。平均レイテンシも約半分(1.81ms vs 3.66ms)に短縮されており、CPUコア自体の基本的な処理能力が大幅に向上していることを示唆しています 59。
- Phoronix Test Suite (PTS) / OpenBenchmarking.org: c7g.4xlargeとc6g.4xlargeをUbuntu 22.04環境で比較した詳細なベンチマーク 42 では、多くのテストでGraviton3がGraviton2を大幅に上回りました。
- HPC関連: High Performance Conjugate Gradient (HPCG) で約33%向上 (26.3 vs 19.7 GFLOP/s)。NAS Parallel Benchmarks (NPB) スイートの多くのテスト(BT.C, CG.C, FT.C, LU.C, MG.C, SP.C, IS.D)で50%以上の性能向上。分子動力学シミュレーション LAMMPS で約42%向上 (11.3 vs 7.9 ns/day)。流体力学ベンチマーク LULESH で約82%向上。
- 汎用演算/圧縮: CoreMarkで約28%向上。7-Zip圧縮レーティングで約91%、解凍レーティングで約28%向上。Zstd圧縮速度(Level 3)で約22%向上、解凍速度(Level 19)で約49%向上。
- レンダリング/コンパイル: C-Ray(レイトレーシング)で実行時間が約38%短縮。POV-Rayで約26%短縮。Apache, Gem5, LLVM, PHPなどのソフトウェアコンパイル時間も20-30%程度短縮。
- AI/チェス: StockfishやasmFish(チェスエンジン)で約7%向上。LeelaChessZero(ニューラルネットワークベースのチェスエンジン)ではBLASバックエンドで約10倍、Eigenバックエンドでは同等の性能。
- HPC特化インスタンス: Graviton3Eを搭載したHpc7gは、Graviton2搭載インスタンスと比較して、HPL (LINPACK) ベンチマークで最大2倍、生命科学アプリケーションGROMACSで20%高い性能を示しました 17。燃焼シミュレーションAVBPでは、コアあたり1.8倍高速化されたとの報告もあります 17。
- ユーザー事例/コメント: Ansys(構造解析ソフトウェア)のベンチマークでは、C7gがC6g比で35%の性能向上を達成したと報告されています 22。また、あるユーザーは科学技術計算系の自作ベンチマークでGraviton3がGraviton2の約1.7倍高速だったとコメントしています 13。さらに、C7gへ移行した際にインスタンスサイズを1段階小さくしても、C6g比で60%の性能向上を達成したという報告もあります 13。
これらの結果から、Graviton3はGraviton2に対して、特に計算集約的なワークロードにおいて、AWSの公式発表値である25%を大きく上回る性能向上を実現しているケースが多いことがわかります。HPCカーネル、分子動力学、レンダリング、コンパイルといった多様なタスクで30%から80%以上、場合によってはそれ以上の性能向上が見られます。これは、Graviton3におけるIPC(クロックあたりの命令実行数)の向上、キャッシュアーキテクチャの改善、そしてDDR5メモリによる帯域幅向上が複合的に寄与した結果と考えられます。Sysbench CPUでの100%超の向上はマイクロベンチマーク特有の顕著な例かもしれませんが、全体的な傾向としてGraviton3が計算能力においてGraviton2から大きな飛躍を遂げたことは明らかです。
3.1.2. Graviton3 vs Intel Xeon (c7g vs c6i/c7i)
次に、Graviton3 (C7g) とIntel Xeon搭載インスタンス(C6i: 第3世代Xeon Scalable “Ice Lake”、C7i: 第4世代Xeon Scalable “Sapphire Rapids”)を比較します。
- Phoronix Test Suite (PTS) / OpenBenchmarking.org: c7g.4xlarge (Graviton3, 16物理コア) と c6i.4xlarge (Xeon Platinum 8375C, 8物理コア/16スレッド) の比較 40 では、ワークロードによって優劣が分かれました。
- Graviton3優位: LAMMPS (約82%高速)、コンパイル時間 (Apache, Gem5, LLVM, PHPで10-20%高速)、レンダリング (C-Rayで約58%高速、POV-Rayで約28%高速)、Stockfish/asmFish (約16%高速)、OpenSSL SHA256 (約8倍高速)、TensorFlow Lite/ONNX推論 (多くのモデルで高速)。
- Intel Xeon優位: HPCG (約9%高速)、NPB (FT.C, MG.Cなどで高速)、7-Zip解凍 (約7%高速)、GROMACS (約28%高速)、OpenSSL RSA4096 (signで約3倍高速、verifyで約1.3倍高速)。
- ほぼ同等: LULESH。
- SPECrate 2017: Intelが公開した資料によると、C6iインスタンスはC6a (AMD EPYC) インスタンスに対し、特に浮動小数点性能 (SPECrate2017_fp_base) で最大1.56倍の性能を示しました 49。これはIntel XeonのAVX-512命令セットの効果が大きいと考えられます。Graviton3はSVE (Scalable Vector Extension) 17 をサポートしていますが、AVX-512との直接的な性能比較は単純ではありません。AVX-512に高度に最適化されたワークロードではIntelが有利になる可能性があります。
- ブログベンチマーク: ある日本語ブログ 78 では、c7i.large (Xeon 8488C Sapphire Rapids) と c7g.large (Graviton3) を比較し、実施されたベンチマークスイート全体の結果として、C7iがC7gよりも17-25%性能が低かったと報告しています。ただし、同ブログではC7iはC6iに対しては約14%の性能向上を示したとも述べています。
- .NET 8 Web アプリケーション: 高負荷なテストシナリオ(暗号化処理を含む)では、c7g.xlargeがc7i.xlargeよりも52%高い秒間リクエスト数 (RPS) を達成しました 37。
これらの結果を総合すると、Graviton3とIntel Xeonの性能比較は、実行するワークロードの種類に強く依存します。Graviton3は、物理コア数の多さ(同vCPU数比較で2倍)やArmアーキテクチャの特性が活きる並列処理、コンパイル、レンダリング、一部の機械学習推論などで優位性を示す傾向があります。一方、Intel Xeonは、強力な浮動小数点演算ユニット(特にAVX-512)や高いシングルスレッド性能が求められるHPCの一部、特定の暗号処理(RSAなど)で有利になる場合があります。最新世代のSapphire Rapids (C7i) との比較においても、Graviton3が健闘、あるいは特定のワークロードでは上回る結果が報告されており、単純な優劣をつけることは困難です。ワークロードの特性を理解し、それに合ったアーキテクチャを選択することが重要となります。例えば、.NETの高負荷Webアプリケーションの例 37 は、多くの同時リクエストを処理するようなシナリオでは、Graviton3の物理コア数の多さがSMTに依存するIntel Xeonに対して有利に働く可能性を示唆しています。
3.1.3. Graviton3 vs AMD EPYC (c7g vs c6a/c7a)
Graviton3 (C7g) とAMD EPYC搭載インスタンス(C6a: 第3世代EPYC “Milan”、C7a: 第4世代EPYC “Genoa”)の比較データは、Intel Xeonとの比較ほど多くはありませんが、いくつかのベンチマーク結果が存在します。
- Phoronix Test Suite (PTS) / OpenBenchmarking.org: c7g.4xlarge (Graviton3, 16物理コア) と c6a.4xlarge (EPYC 7R13 Milan, 8物理コア/16スレッド) の比較 40 では、こちらもワークロード依存性が高い結果となりました。
- Graviton3優位: HPCG (約5.1倍高速)、コンパイル時間 (Apache, LLVM, PHPで高速)、レンダリング (C-Ray, POV-Rayで高速)、Stockfish/asmFish (高速)、OpenSSL SHA256 (約11倍高速)、GROMACS (約13%高速)、TensorFlow Lite/ONNX推論 (多くのモデルで高速)。
- AMD EPYC優位: NPB (BT.C, LU.Cなどで高速)、LAMMPS (約33%高速)、OpenSSL RSA4096 (signで約3.8倍高速、verifyで約1.3倍高速)。
- ほぼ同等: LULESH、7-Zip圧縮/解凍。
- SPECrate 2017: 前述のIntelの資料 49 では、C6i (Intel) がC6a (AMD) を上回る結果でしたが、これは特定のベンチマークスイートにおける比較です。
- HPC Benchmark (miniFE, Xcompact3d): Graviton4 (Graviton3の次世代) のベンチマークレビュー 60 において、Graviton4がHPCミニアプリケーション (miniFE, Xcompact3d) でGraviton3を大幅に上回り、場合によっては第4世代AMD EPYC (Genoa) インスタンスをも上回ったと報告されています。これは、GravitonアーキテクチャがHPC分野でも競争力を持っていることを示唆しています。
Graviton3とAMD EPYC (Milan) の比較においても、ワークロードによって得意不得意が分かれることがわかります。Graviton3はHPCG、コンパイル、レンダリング、一部のML/暗号処理で強みを見せています。一方、AMD EPYCはNPBの多くのテストやLAMMPS、RSA暗号処理で優れた性能を発揮します。ここでも、物理コア数(Graviton3)とSMTコア数(EPYC)の違いが性能特性に影響を与えている可能性があります。HPCGでのGraviton3の顕著な性能や、RSA暗号でのEPYCの圧倒的な性能は、それぞれのアーキテクチャが特定の計算パターンに対して高度に最適化されていることを示唆しています。
表3: 計算集約型ワークロード ベンチマーク比較 (抜粋)
インスタンスタイプ | ベンチマーク (単位) | スコア/時間 | 相対性能 (vs c6g.4xlarge) | 価格性能比ランク (vs c6g, c6a, c6i) | 出典サイト |
c7g.4xlarge | Sysbench CPU (events/sec) | 4426.78 | 203% | N/A | learnaws.org 59 |
c6g.4xlarge | Sysbench CPU (events/sec) | 2181.39 | 100% | N/A | learnaws.org 59 |
c7g.4xlarge | LLVM Compilation (Time To Compile, sec) | 544.93 | 125% (時間短縮率) | 1位 | OpenBenchmarking.org 42 |
c6g.4xlarge | LLVM Compilation (Time To Compile, sec) | 682.98 | 100% | 2位 | OpenBenchmarking.org 42 |
c6i.4xlarge | LLVM Compilation (Time To Compile, sec) | 527.46 | 129% (時間短縮率) | 4位 | OpenBenchmarking.org 42 |
c6a.4xlarge | LLVM Compilation (Time To Compile, sec) | 493.76 | 138% (時間短縮率) | 3位 | OpenBenchmarking.org 42 |
c7g.4xlarge | HPCG (GFLOP/s) | 26.3058 | 133% | 1位 | OpenBenchmarking.org 42 |
c6g.4xlarge | HPCG (GFLOP/s) | 19.7218 | 100% | 2位 | OpenBenchmarking.org 42 |
c6i.4xlarge | HPCG (GFLOP/s) | 28.6603 | 145% | 4位 | OpenBenchmarking.org 42 |
c6a.4xlarge | HPCG (GFLOP/s) | 5.0604 | 26% | 3位 | OpenBenchmarking.org 42 |
c7g.4xlarge | GROMACS (water_GMX50_bare, Ns/Day) | 1.128 | 144% | 2位 | OpenBenchmarking.org 42 |
c6g.4xlarge | GROMACS (water_GMX50_bare, Ns/Day) | 0.781 | 100% | 1位 | OpenBenchmarking.org 42 |
c6i.4xlarge | GROMACS (water_GMX50_bare, Ns/Day) | 1.452 | 186% | 4位 | OpenBenchmarking.org 42 |
c6a.4xlarge | GROMACS (water_GMX50_bare, Ns/Day) | 1.004 | 129% | 3位 | OpenBenchmarking.org 42 |
c7g.4xlarge | 7-Zip Compression (Compression Rating, MIPS) | 246256 | 191% | 1位 | OpenBenchmarking.org 42 |
c6g.4xlarge | 7-Zip Compression (Compression Rating, MIPS) | 128597 | 100% | 3位 | OpenBenchmarking.org 42 |
c6i.4xlarge | 7-Zip Compression (Compression Rating, MIPS) | 200204 | 156% | 4位 | OpenBenchmarking.org 42 |
c6a.4xlarge | 7-Zip Compression (Compression Rating, MIPS) | 266631 | 207% | 2位 | OpenBenchmarking.org 42 |
注: 価格性能比ランクはOpenBenchmarking.org 43 の Performance Per Dollar (DPH) 指標に基づき、値が高いほど優位(1位が最高)。相対性能はc6g.4xlargeを100%として算出。Sysbench CPUはxlargeインスタンスの結果 59。
この表は、計算集約型ワークロードにおける主要なベンチマーク結果をインスタンスタイプ間で直接比較できるようにまとめたものです。CPUマイクロベンチマーク、コンパイル時間、HPCカーネル、圧縮といった代表的なタスクにおける性能差と、コスト効率(価格性能比)を定量的に示しています。
3.2. メモリ集約型ワークロード (Databases, In-Memory Caches, Real-time Analyticsなど)
データベース、インメモリキャッシュ、リアルタイム分析などのワークロードでは、CPU性能に加えて、メモリアクセス速度(帯域幅とレイテンシ)が性能を決定する重要な要因となります。Graviton3が採用したDDR5メモリは、この種のワークロードに大きな影響を与える可能性があります。
3.2.1. Graviton3 vs Graviton2 (m7g/r7g vs m6g/r6g)
AWSは、M7g/R7gインスタンスがM6g/R6gインスタンスに対して最大25%の性能向上を提供すると発表しています 10。この向上には、DDR5メモリによる帯域幅50%増が大きく寄与していると考えられます 10。
ベンチマーク結果は、このメモリ性能向上の効果を明確に示しています。
- Sysbench Memory: m7g.xlargeおよびr7g.xlargeは、それぞれ対応するm6g.xlargeおよびr6g.xlargeと比較して、メモリ操作の総実行時間を約38%短縮しました(例: m7g 1.27s vs m6g 2.04s)26。これはDDR5メモリの帯域幅向上が直接的に性能向上に結びついていることを強く示唆しています。
- Amazon RDS: Graviton3ベースのRDSインスタンス (db.m7g) とGraviton2ベース (db.m6g) を比較したベンチマーク 11 では、db.m7gが平均して29%多い秒間クエリ数 (QPS) を処理し、平均レイテンシも26%削減されました。テストされたデータベースエンジン(MySQL, PostgreSQL, MariaDB)ごとに見ると、性能向上率は19%から34%の範囲でした。さらに、時間単価あたりの性能(価格性能比)で比較しても、db.m7gはdb.m6gに対して平均22%優れており、特にMariaDBでは27%の優位性を示しました 11。
これらの結果から、メモリ集約型ワークロードにおいてGraviton3はGraviton2に対して顕著な性能向上を達成していることが確認できます。DDR5メモリの採用は、単なるスペック上の向上だけでなく、実際のデータベースやインメモリ処理の性能(スループットとレイテンシの両方)に明確なメリットをもたらしています。
3.2.2. Graviton3 vs Intel Xeon (m7g/r7g vs m6i/m7i/r6i/r7i)
Graviton3とIntel Xeon搭載インスタンスをメモリ集約型ワークロードで比較したデータも存在します。
- MongoDB (YCSB): Intelが実施したベンチマーク 69 では、メモリ最適化インスタンス (Rシリーズ) を使用し、90%リード/10%アップデートのワークロードでMongoDBの性能を比較しました。その結果、第4世代Intel Xeon Scalable (Sapphire Rapids) を搭載したR7iおよびR7izインスタンスが、テストされた全インスタンス(R7g (Graviton3), R7a (AMD EPYC Genoa), および旧世代のR6i, R6g, R6aを含む)の中で最高の性能を示しました。さらに、R7iは価格性能比においても最も優れており、例えばR7i.2xlargeはR7g.2xlargeに対して価格性能比で16%優位でした 69。
- MySQL (Sysbench Read-Only): Perconaが実施したM6世代インスタンスの比較 79 では、リードオンリーのMySQLワークロードにおいて、M6i (Intel Ice Lake) が M6g (Graviton2) および M6a (AMD Milan) に対して、ほとんどの場合で高いスループットを示し、最大で45%程度の差が見られました。これはGraviton3との直接比較ではありませんが、MySQLのような特定のデータベースワークロードではIntel Xeonアーキテクチャが有利な場合があることを示唆しています。
- Apache Kafka: Kafkaのベンチマーク 77 では、m7g (Graviton3) と m6i (Intel Ice Lake) は、旧世代のインスタンス (m6g, m5a, m5) と比較して、より高いEBS帯域幅とネットワーク帯域幅を持っており、これがI/O待ち時間 (IOWait) の短縮につながり、全体として高いスループットを達成しました。負荷時の秒間リクエスト数ではm6iがm7gをわずかに上回りましたが、ネットワーク送信データ量はm7gの方が多く、プロデューサーレイテンシは同等、コンシューマーレイテンシは両者ともに低いレベルでした。
これらの結果は、メモリ集約型ワークロードにおけるGraviton3とIntel Xeonの比較が、ワークロードの特性によって異なる様相を呈することを示しています。MongoDBのYCSBベンチマークでは、最新のIntel Xeon (R7i) がGraviton3 (R7g) を性能および価格性能比で上回る結果となりました。これは、Xeonのコアあたりの性能、キャッシュ階層の設計、あるいは特定の命令セット(例えばデータ圧縮や検索に関連するもの)がMongoDBの処理に適していた可能性を示唆します。一方で、Kafkaのようなデータストリーミングワークロードでは、CPU性能だけでなく、インスタンスに割り当てられたI/O性能(EBS帯域、ネットワーク帯域)が性能を大きく左右する要因となります。このテストでは、高いI/Oスペックを持つm7gとm6iが同様に高い性能レベルを示しており、CPUアーキテクチャ間の差よりも世代間のI/O性能差の方が影響が大きかったと考えられます。
3.2.3. Graviton3 vs AMD EPYC (m7g/r7g vs m6a/m7a/r6a/r7a)
Graviton3とAMD EPYC搭載インスタンスのメモリ集約型ワークロードにおける直接比較データは限られています。
- MongoDB (YCSB): 前述のIntelによるベンチマーク 69 では、R7i.2xlarge (Intel) が R7a.2xlarge (AMD EPYC Genoa) に対して価格性能比で28%優位でした。同テストでR7iがR7g (Graviton3) に対して16%優位だったことを考慮すると、R7gがR7aに対して価格性能比で優れている可能性があります(つまり、R7i > R7g > R7a の順である可能性)。
- MySQL (Sysbench Read-Only): M6世代の比較 79 では、M6a (AMD Milan) は M6i (Intel) に近い性能を示し、M6g (Graviton2) よりは高性能でした。
- Apache Kafka: Kafkaのベンチマーク 77 では、m6a (AMD Milan) は、m5aと同様に、高負荷時にEBS帯域幅がボトルネックとなりやすく、コンシューマーレイテンシが増大し、クラスター全体の安定性に影響を与える傾向が見られました。これに対し、m7g (Graviton3) はより安定して高い性能を維持していました。
利用可能なデータからは、Graviton3と最新のAMD EPYC(Genoa)の直接比較はまだ少ないものの、いくつかの示唆が得られます。MongoDBのYCSB結果からは、価格性能比においてAMD (R7a) はIntel (R7i) に劣後しており、Graviton3 (R7g) に対しても不利な可能性があります。Kafkaのベンチマークでは、第3世代EPYC (m6a) がI/Oボトルネックの影響を受けやすい側面が見られ、高いI/O性能を持つGraviton3 (m7g) の方が安定性と性能の両面で優位でした。これは、メモリ集約型ワークロードであっても、ディスクI/OやネットワークI/Oが性能の律速段階となりうる場合に、インスタンス全体のバランス(CPU性能、メモリ帯域、I/O性能)が重要であることを示しています。
表4: メモリ/データベースワークロード ベンチマーク比較 (抜粋)
インスタンスタイプ | ベンチマーク (単位) | スコア/時間/比率 | 比較対象 | 出典サイト |
m7g.xlarge | Sysbench Memory (Total time, sec) | 1.2677 | vs m6g.xlarge | learnaws.org 26 |
m6g.xlarge | Sysbench Memory (Total time, sec) | 2.0420 | – | learnaws.org 26 |
r7g.xlarge | Sysbench Memory (Total time, sec) | 1.2499 | vs r6g.xlarge | learnaws.org 28 |
r6g.xlarge | Sysbench Memory (Total time, sec) | 2.0175 | – | learnaws.org 28 |
db.m7g.xlarge | RDS Avg QPS Improvement (%) | 29% (平均) | vs db.m6g.xlarge | AWS Blog 11 |
db.m7g.xlarge | RDS Avg Latency Reduction (%) | 26% (平均) | vs db.m6g.xlarge | AWS Blog 11 |
db.m7g.xlarge | RDS Price/Performance QPS Improvement (%) | 22% (平均) | vs db.m6g.xlarge | AWS Blog 11 |
R7i.2xlarge | MongoDB YCSB Perf/Price Ratio (Normalized to R7i=1.00) | 1.00 | – | Intel Blog 69 (図2参照) |
R7g.2xlarge | MongoDB YCSB Perf/Price Ratio (Normalized to R7i=1.00) | ~0.86 | vs R7i.2xlarge | Intel Blog 69 (図2参照、グラフから推定) |
R7a.2xlarge | MongoDB YCSB Perf/Price Ratio (Normalized to R7i=1.00) | ~0.78 | vs R7i.2xlarge | Intel Blog 69 (図2参照、グラフから推定) |
注: MongoDB YCSBの価格性能比はR7i.2xlargeを1.00とした相対値。グラフからの推定値を含む。
この表は、メモリ性能が重要となるタスクにおける性能差を定量化しています。Sysbench Memoryの結果はGraviton3におけるDDR5の効果を直接示し、RDSのベンチマーク結果は実際のデータベースワークロードでの性能向上率と価格性能比の改善を示しています。MongoDB YCSBの結果は、競合アーキテクチャとの比較におけるGraviton3の位置づけを示唆します。
3.3. Webサービス・汎用ワークロード (Application Servers, Microservicesなど)
Webサーバー、アプリケーションサーバー、マイクロサービスといった汎用的なワークロードでは、CPU処理、メモリアクセス、ネットワークI/O、場合によっては暗号化処理などが複合的に性能に影響します。
3.3.1. Graviton3 vs Graviton2 (m7g vs m6g)
AWSは汎用インスタンスM7gがM6gに対して最大25%の性能向上を提供すると発表しています 10。
- Sysbench CPU: m7g.xlargeはm6g.xlargeに対して、秒間イベント数で約9%の向上(4429.31 vs 4060.45 events/sec)を記録しました 26。これはコンピューティング最適化インスタンス (C7g vs C6g) で見られたほどの大きな差ではありませんが、改善は確認できます。
- Sysbench Memory: 一方、メモリ性能に関しては、m7g.xlargeはm6g.xlargeに対して実行時間を約38%短縮しており(1.27s vs 2.04s)26、DDR5メモリの恩恵が大きいことがわかります。
汎用インスタンス(Mシリーズ)においても、Graviton3はGraviton2に対して性能向上、特にメモリアクセス性能の大幅な改善が見られます。Sysbench CPUでの向上率はCシリーズほどではありませんが、Webサービスなどで頻繁に発生するメモリアクセスが高速化されることは、全体的な応答性向上に寄与すると考えられます。
3.3.2. Graviton3 vs Intel Xeon (m7g vs m6i/m7i, c7g vs c6i/c7i for Nginx)
Webサーバーソフトウェアとして広く利用されるNginxの性能比較では、特にHTTPS通信のように暗号化処理が伴う場合に、結果の解釈に注意が必要です。
- Nginx (HTTPS): IntelとArm (AWSパートナー) から、一見矛盾するベンチマーク結果が報告されています。
- Intelの報告 66 では、C6iインスタンス (Intel Ice Lake) でCrypto Acceleration (Intel QAT: QuickAssist Technology) を有効にした場合、C7gインスタンス (Graviton3) に対して最大2.67倍多い秒間接続数を処理できたとしています。これは、QATによる暗号化処理のハードウェアオフロードが大きな効果を発揮したことを示しています。
- 一方、Armコミュニティブログの報告 67 では、ネットワーク最適化インスタンスを用いた比較(C7gn (Graviton3E) vs C6in (Intel Ice Lake))で、C7gnがC6inに対して最大91%高い性能(RPS)、最大71%高い価格性能比を達成したとしています。このテストでは、JWT (JSON Web Token) 認証処理も含まれており、QATの利用状況は明記されていませんが、異なるテストシナリオとインスタンスタイプが用いられています。
- .NET 8 Web アプリケーション: 前述の通り、高負荷な.NETアプリケーションのテストでは、c7g.xlarge (Graviton3) が c7i.xlarge (Intel Sapphire Rapids) に対して、性能(RPSで+52%)および価格性能比(最大+85.6%)の両面で大きな優位性を示しました 37。低負荷なテスト(ネットワーク律速の可能性)でも、価格の安さからGraviton3の価格性能比が23%以上優れていました。
これらの結果から、Webサーバー、特にHTTPSを用いた場合の性能比較は、CPUアーキテクチャそのものだけでなく、暗号化処理を高速化する専用ハードウェア(Intel QATなど)の有無や、テストでそれが有効化されているかどうかに大きく依存することがわかります。Intel QATが有効な場合、Intel Xeonインスタンスは暗号化処理において大きなアドバンテージを持ちます。しかし、QATを利用しない場合や、CPU負荷が非常に高くなるようなアプリケーション(例:.NETの高負荷テスト)では、Graviton3の物理コア数の多さが性能とコスト効率の両面で有利に働く可能性があります。ユーザーは自身のワークロードにおける暗号化処理の比重や、QATのようなアクセラレータの利用可否を考慮してインスタンスを選択する必要があります。
3.3.3. Graviton3 vs AMD EPYC (m7g vs m6a/m7a, c7g vs c6a/c7a for Nginx)
Graviton3とAMD EPYCのWebサービス関連での直接比較データはさらに限られます。
- Nginx (HTTPS): Intelの報告 68 によると、C6i (Intel Ice Lake, QAT有効) は C6a (AMD Milan) に対して最大3.02倍の秒間接続数を処理できました。これは、AMD EPYCもIntel QATのような専用暗号化アクセラレータを持たない場合、暗号化が重いワークロードでは不利になる可能性を示唆しています。Graviton3との比較ではありませんが、同様の傾向が当てはまる可能性があります。
現状では、Webサービス、特に暗号化処理を含むワークロードにおけるGraviton3とAMD EPYCの性能比較に関する公開データは不足しています。一般的な傾向として、暗号化処理の負荷が高い場合は、専用アクセラレータを持つIntel Xeon (QAT有効時) が有利であり、Graviton3とAMD EPYCはその点で見劣りする可能性があります。HTTP通信のような暗号化を含まない場合や、アプリケーションロジック自体の処理が支配的なワークロードでの比較が待たれます。
表5: Webサービスワークロード ベンチマーク比較 (抜粋)
インスタンスタイプ | ベンチマーク (単位) | テストシナリオ | スコア/レート | 価格性能比 (vs C7g) | 出典サイト |
C6i.64xlarge | Nginx (Connections/sec) | HTTPS (TLS), Intel QAT有効 | C7gの最大2.67倍 | 不明 (Intel優位) | Intel PDF 66 |
C7g.64xlarge | Nginx (Connections/sec) | HTTPS (TLS) | ベースライン | ベースライン | Intel PDF 66 |
C7gn.4xlarge | Nginx (RPS) | HTTPS (TLS), JWT認証含む | C6in比 最大+91% | C6in比 最大+71% | Arm Blog 67 |
C6in.4xlarge | Nginx (RPS) | HTTPS (TLS), JWT認証含む | ベースライン | ベースライン | Arm Blog 67 |
c7g.xlarge | .NET 8 Web App (RPS, Encrypted Weather Summary) | 高負荷, HTTPS | c7i比 +52% | c7i比 +85.6% | AWS Blog 37 |
c7i.xlarge | .NET 8 Web App (RPS, Encrypted Weather Summary) | 高負荷, HTTPS | ベースライン | ベースライン | AWS Blog 37 |
c7g.xlarge | .NET 8 Web App (RPS, TE Fortunes) | 低負荷 (ネットワーク律速?), HTTPS | c7iとほぼ同等 | c7i比 +23% | AWS Blog 37 |
c7i.xlarge | .NET 8 Web App (RPS, TE Fortunes) | 低負荷 (ネットワーク律速?), HTTPS | ベースライン | ベースライン | AWS Blog 37 |
注: Nginxの結果は異なる情報源からのものであり、テスト条件(インスタンスタイプ、QAT有無、ワークロード詳細)が異なるため直接比較は困難。価格性能比は各出典元での比較。
この表は、Webサービス関連のベンチマーク結果を示しています。Nginxの比較では、テスト条件によって結果が大きく異なることを示唆しています。Intel QATのようなアクセラレータの利用が性能を左右する一方で、.NETアプリケーションの例では、高負荷時にGraviton3のアーキテクチャとコスト効率が有利に働く可能性を示しています。
3.4. その他のワークロード (Cryptography, ML Inference, Compressionなど)
Graviton3は、汎用演算性能やメモリ性能の向上に加え、特定の処理(暗号化、機械学習、浮動小数点演算)に対するアクセラレーションも強化されています。
3.4.1. Graviton3 vs Graviton2
AWSは公式に、Graviton3がGraviton2に対して暗号化性能で最大2倍、機械学習性能で最大3倍高速であると発表しています 3。
Phoronix Test Suiteによるc7g.4xlargeとc6g.4xlargeの比較 42 でも、これらの分野での大幅な性能向上が確認されています。
- 暗号化 (OpenSSL 3.0): SHA256ハッシュ計算で約8倍、RSA4096署名生成で約9倍、RSA4096署名検証で約3.3倍高速化。
- 機械学習推論: TensorFlow Liteを用いたテストでは、多くのモデルで高速化が見られました(例: SqueezeNetで約1.2倍、Inception V4で約3.7倍、Mobilenet Floatで約1.2倍)。ONNX Runtimeを用いたテストでも同様の傾向が見られ(例: GPT-2で約1.6倍、bert-squadで約2.2倍、ArcFace ResNet-100で約2倍)、AWSの「最大3倍」という主張を裏付ける結果となっています。
- 圧縮/解凍: 7-Zip圧縮レーティングで約1.9倍、解凍レーティングで約1.3倍向上。Zstd圧縮速度(Level 3)で約1.2倍、解凍速度(Level 19)で約1.5倍向上。
これらの結果は、Graviton3がGraviton2から、特に暗号処理と機械学習推論の分野で飛躍的な性能向上を遂げていることを示しています。AWSの主張通りの、あるいはそれを超える改善が見られるケースもあり、これらの処理を多用するアプリケーションではGraviton3への移行メリットが大きいと考えられます。圧縮・解凍性能の向上は、データ処理や転送における効率改善にも寄与します。
3.4.2. Graviton3 vs Intel Xeon
Graviton3とIntel Xeon (Ice Lake) の比較 42 では、以下の傾向が見られました。
- 暗号化 (OpenSSL 3.0): SHA256ではGraviton3がIntel Xeon (c6i) の約8倍高速でしたが、RSA4096署名生成では逆にIntel XeonがGraviton3の約3倍高速、署名検証でもIntel Xeonが約1.3倍高速でした。前述のNginx (HTTPS) の結果 66 も考慮すると、Intel QATを有効にした場合はさらにIntel Xeonが有利になる可能性があります。
- 機械学習推論: TensorFlow LiteおよびONNX Runtimeを用いたテストでは、多くのモデルでGraviton3がIntel Xeon (c6i) よりも高速でした。
- 圧縮/解凍: 7-Zip圧縮ではGraviton3が約1.2倍高速、解凍ではIntel Xeonが約1.07倍高速と拮抗。Zstd圧縮速度(Level 3)ではGraviton3がIntel Xeonの約7.7倍と圧倒的に高速でしたが、解凍速度(Level 19)ではほぼ同等でした。
暗号処理の性能は、アルゴリズムの種類と、ハードウェアアクセラレーション機能(Intel QATなど)の有無および利用状況に強く依存します。Graviton3はSHA系のアルゴリズムで優れた性能を発揮しますが、RSAではIntel Xeonに劣る場合があり、特にQATが有効な場合はIntelの優位性が高まります。機械学習推論や特定の圧縮アルゴリズム(Zstd圧縮)においては、Graviton3がIntel Xeon (Ice Lake世代) を上回る性能を示すケースが多く見られます。
3.4.3. Graviton3 vs AMD EPYC
Graviton3とAMD EPYC (Milan) の比較 42 では、以下の結果が得られました。
- 暗号化 (OpenSSL 3.0): SHA256ではGraviton3がAMD EPYC (c6a) の約11倍高速でしたが、RSA4096署名生成では逆にAMD EPYCがGraviton3の約3.8倍高速、署名検証でもAMD EPYCが約1.3倍高速でした。
- 機械学習推論: TensorFlow LiteおよびONNX Runtimeを用いたテストでは、多くのモデルでGraviton3がAMD EPYC (c6a) よりも高速でした。
- 圧縮/解凍: 7-Zip圧縮ではAMD EPYCが約1.08倍高速、解凍ではGraviton3が約1.05倍高速と拮抗。Zstd圧縮速度(Level 3)ではGraviton3がAMD EPYCの約5.3倍と非常に高速でしたが、解凍速度(Level 19)ではほぼ同等でした。
Graviton3とAMD EPYC (Milan世代) の比較においても、ワークロード依存性が高いことがわかります。Graviton3はSHA系暗号、機械学習推論、Zstd圧縮で優位性を示しています。一方、AMD EPYCはRSA暗号や7-Zip圧縮で健闘しています。ここでも、各CPUアーキテクチャが特定のアルゴリズムや処理パターンに対して異なるレベルの最適化が施されていることがうかがえます。
4. 価格性能比の考察
AWS Gravitonプロセッサの導入における最も重要な動機の一つは、コスト効率の改善です。ここでは、インスタンスの価格とベンチマーク結果を組み合わせて、Graviton3の価格性能比を評価します。
4.1. オンデマンド価格比較
まず、各インスタンスタイプのオンデマンド時間単価を比較します。価格はリージョンやOSによって異なりますが、ここでは主に米国西部(オレゴン、us-west-2)または東京(ap-northeast-1)リージョンのLinuxインスタンスを基準とします。
- Graviton3 vs Graviton2: 一般的に、Graviton3インスタンス (C7g, M7g, R7g) は、対応するGraviton2インスタンス (C6g, M6g, R6g) よりも若干(5-7%程度)高価に設定されています 26。例えば、us-west-2リージョンのlargeサイズでは、c7g ($0.0725) は c6g ($0.0680) より約6.6%高価です 78。
- Graviton3 vs Intel/AMD: Graviton3インスタンスは、同等サイズの最新世代Intel Xeon (C7i, M7i, R7i) やAMD EPYC (C7a, M7a, R7a) 搭載インスタンスと比較して、一般的に安価です 25。例えば、us-west-2リージョンのlargeサイズで比較すると、c7g ($0.0725) は c7i ($0.08925) より約18.7%安く、c7a (0.1026,us−east−1[81])よりさらに安価です。∗∗表6:インスタンス価格比較(オンデマンド、Linux、us−west−2、largeサイズ)∗∗∣インスタンスタイプ∣プロセッサ世代/種類∣時間単価() | | :—————– | :————————— | :———– | | c7g.large | Graviton3 | 0.0725 | | c6g.large | Graviton2 | 0.0680 | | c7i.large | Intel Xeon 4th Gen (Sapphire Rapids) | 0.08925 | | c6i.large | Intel Xeon 3rd Gen (Ice Lake) | 0.0850 | | c7a.large | AMD EPYC 4th Gen (Genoa) | 0.0872 () | | c6a.large | AMD EPYC 3rd Gen (Milan) | 0.0765 | | m7g.large | Graviton3 | 0.0816 | | m6g.large | Graviton2 | 0.0770 | | m7i.large | Intel Xeon 4th Gen (Sapphire Rapids) | 0.1008 | | m6i.large | Intel Xeon 3rd Gen (Ice Lake) | 0.0960 | | m7a.large | AMD EPYC 4th Gen (Genoa) | 0.0985 () | | m6a.large | AMD EPYC 3rd Gen (Milan) | 0.0864 | | r7g.large | Graviton3 | 0.1071 | | r6g.large | Graviton2 | 0.1008 | | r7i.large | Intel Xeon 4th Gen (Sapphire Rapids) | 0.1344 | | r6i.large | Intel Xeon 3rd Gen (Ice Lake) | 0.1260 | | r7a.large | AMD EPYC 4th Gen (Genoa) | 0.1301 (*) | | r6a.large | AMD EPYC 3rd Gen (Milan) | 0.1152 |
出典: 11。価格はus-west-2リージョンを基本とし、()はus-east-1の価格から推定または他資料参照。最新価格はAWS公式で要確認。*
この表は、本レポートで比較対象となる主要なインスタンスファミリーの代表的なサイズ(large)における時間単価を示しています。このコスト情報が、次項の価格性能比分析の基礎となります。
4.2. ベンチマーク結果に基づく価格性能分析
インスタンスの価格と、セクション3で示したベンチマーク結果を組み合わせることで、価格性能比を評価します。
- Graviton3 vs Graviton2: Graviton3インスタンスはGraviton2よりも若干高価ですが、多くのワークロードで価格上昇率を上回る性能向上を実現しているため、結果として価格性能比はGraviton3の方が高くなる傾向があります 11。例えば、Amazon RDSのベンチマークでは、Graviton3 (db.m7g) はGraviton2 (db.m6g) に対して価格性能比で平均22%、最大27%(MariaDBの場合)優れていました 11。learnaws.orgのSysbenchテストでも、C7g/M7g/R7gは対応するC6g/M6g/R6gよりも価格性能比が良いと結論付けられています 26。
- Graviton3 vs Intel/AMD: Graviton3インスタンスは、その低い価格設定と競争力のある性能により、多くのワークロードにおいてIntel XeonやAMD EPYC搭載インスタンスよりも優れた価格性能比を示すことが報告されています 12。
- OpenBenchmarking.orgで公開されている多数のベンチマーク結果の価格性能比(Performance Per Dollar)を比較すると、c7g.4xlarge (Graviton3) が c6g.4xlarge (Graviton2), c6a.4xlarge (AMD Milan), c6i.4xlarge (Intel Ice Lake) のいずれよりも優れているテストが多く見られます 42。
- 高負荷な.NET Webアプリケーションのテストでは、c7g.xlargeがc7i.xlarge (Intel Sapphire Rapids) に対して価格性能比で最大85.6%優位でした 37。
- ArmコミュニティブログのNginxベンチマーク報告では、C7gn (Graviton3E) が C6in (Intel Ice Lake) に対して価格性能比で最大71%優位でした 67。
- 例外: ただし、すべてのワークロードでGraviton3が最高の価格性能比を提供するわけではありません。
- MongoDBのYCSBベンチマークでは、R7i.2xlarge (Intel Sapphire Rapids) が R7g.2xlarge (Graviton3) に対して価格性能比で16%優位でした 69。
- Intelが報告したNginx (HTTPS) ベンチマークでは、QATを有効にしたC6iがC7gを性能で大幅に上回っており、価格差を考慮してもC6iの方が価格性能比で有利になる可能性が高いです 66。
これらの分析から、Graviton3インスタンスの最大の魅力はその優れた価格性能比にあると言えます。絶対的な性能で常に競合のx86プロセッサを凌駕するわけではありませんが、多くの場合、より低いコストで同等以上の性能を提供できます。AWSが主張する「最大40%の価格性能向上」(Graviton2比)といった一般的なフレーズは、ワークロードに依存するため鵜呑みにできませんが、多くの独立したベンチマークがGraviton3の高いコスト効率を裏付けています。ただし、MongoDBや暗号化処理が非常に重いNginxのように、特定のワークロードや構成においては最新のx86インスタンスが価格性能比で勝るケースも存在するため、最終的なインスタンス選択は、ターゲットワークロードでの具体的なベンチマーク評価に基づいて行うことが推奨されます。
4.3. エネルギー効率とTCOへの影響
Graviton3プロセッサは、性能向上と同時にエネルギー効率の改善も重要な設計目標として掲げられています。
- 省電力性: AWSは、Graviton3ベースのインスタンスが、同等の性能を持つ他のEC2インスタンスと比較して最大60%少ないエネルギーで動作すると主張しています 3。これは、Armアーキテクチャが一般的にx86アーキテクチャよりも電力効率に優れているとされる特性 33 を反映したものです。
- TCOへの影響: この高いエネルギー効率は、AWS自身のデータセンター運用コスト(電力消費、冷却コスト)の削減に直接的に貢献します。これが、Gravitonインスタンスを競合のx86インスタンスよりも低価格で提供できる要因の一つと考えられます 33。エンドユーザーにとっては、インスタンス利用料金の形で間接的にコスト削減の恩恵を受けることになります。
- 持続可能性: 加えて、エネルギー消費量の削減は、企業の二酸化炭素排出量削減目標やサステナビリティ戦略にも貢献します 12。環境負荷低減への関心が高まる中、Gravitonインスタンスの採用は、技術的なメリットだけでなく、環境面でのアピールポイントにもなり得ます。
- 高密度実装: Graviton3サーバーが採用しているとされる3ソケット/マザーボード設計 13 は、物理的なラックスペースあたりの演算能力を高める試みと解釈できます。これは、データセンター全体の効率を最大化し、電力あたりの性能を高めるという、エネルギー効率を重視する設計思想とも一致しています。
Gravitonプロセッサの高いエネルギー効率は、単なる技術的な特徴に留まらず、AWSのコスト戦略、価格競争力、そして顧客企業のサステナビリティ目標達成支援という、複数のビジネスおよび環境戦略と密接に連携した要素であると言えます。
5. 結論
本調査では、AWS Graviton3プロセッサ搭載EC2インスタンスについて、公式情報、アーキテクチャ、ターゲットワークロード、そしてGraviton2、Intel Xeon、AMD EPYC搭載インスタンスとの広範なベンチマーク比較分析を行いました。
Graviton3の主な特徴と性能:
- アーキテクチャ: Arm Neoverse V1コア、DDR5メモリ、チップレット設計を採用し、性能、メモリ帯域、特定ワークロード(浮動小数点、暗号、ML)のアクセラレーション、エネルギー効率の多面的な向上を目指しています。
- Graviton2比: 計算集約型ワークロードではAWS公式発表の25%を上回る性能向上(30-80%以上)を示すケースが多く、メモリ集約型ワークロードではDDR5の効果により顕著な性能向上(例: RDSで20-30%)が見られます。暗号処理やML推論でも大幅な高速化が確認されています。
- Intel Xeon比: ワークロード依存性が高く、Graviton3は物理コア数の多さが活きる並列処理、コンパイル、レンダリング、一部ML推論で優位性を示す一方、Intel XeonはAVX-512が有効なHPCの一部や特定の暗号処理(RSA、QAT利用時)で有利な場合があります。最新世代 (Sapphire Rapids) との比較でもGraviton3は健闘しています。
- AMD EPYC比: こちらもワークロード依存性が高く、Graviton3はHPCG、コンパイル、レンダリング、一部ML/暗号処理で優位、AMD EPYC (Milan) はNPBの一部、LAMMPS、RSA暗号で強みを見せます。KafkaベンチマークではGraviton3の方が安定性とI/O性能で優位でした。
価格性能比と推奨事項:
- 価格性能比: Graviton3の最大の強みはその価格性能比にあります。Graviton2比では性能向上が価格上昇を上回り、多くの場合でコスト効率が向上します。競合のIntel/AMDインスタンスと比較しても、多くの場合でより低いコストで同等以上の性能を提供可能です。
- 例外: ただし、MongoDB (vs R7i) や暗号化負荷の高いNginx (vs QAT有効C6i) など、特定のワークロードや構成では最新のx86インスタンスが価格性能比で上回るケースも存在します。
- 推奨事項:
- 新規ワークロードや、既存ワークロードのコスト最適化を検討する場合、Graviton3インスタンスは有力な第一候補となります。特に、Webサーバー、マイクロサービス、コンテナ、データ処理、オープンソースデータベース、キャッシュサーバー、ML推論など、Armエコシステムが成熟している分野では移行のメリットが大きいと考えられます。
- 性能要件が非常に厳しいワークロードや、特定のx86命令セット(AVX-512など)への依存度が高いワークロード、あるいはArm版が存在しないソフトウェアを利用している場合は、Intel XeonやAMD EPYCインスタンスが引き続き適切な選択肢となる可能性があります。
- 最終的なインスタンスタイプの選定にあたっては、ターゲットとする具体的なワークロードを用いたベンチマークテストを実施し、性能とコストの両面から評価することが不可欠です。公開されているベンチマーク結果は参考になりますが、自身の環境とユースケースにおける実際の性能を確認することが最も重要です。
将来展望:
AWSはGraviton4プロセッサを発表しており 29、さらなる性能向上(Graviton3比で平均30%高速、コア数増強、メモリ帯域幅75%向上)が期待されています 21。クラウドにおけるArmアーキテクチャの採用は今後も拡大し、Intel、AMDとの競争はさらに激化していくと予想されます。ユーザーは、進化し続けるプロセッサオプションの中から、自身の要件に最も合致するも
引用文献
- What Is AWS Graviton? Here’s When To Use It – CloudZero, 5月 1, 2025にアクセス、 https://www.cloudzero.com/blog/aws-graviton/
- [速報]AWS、ARMベースの独自プロセッサを強化した「Graviton 3」および新インスタンス「C7gインスタンス」発表。AWS re:Invent 2021 – Publickey, 5月 1, 2025にアクセス、 https://www.publickey1.jp/blog/21/awsarmgraviton_3c7gaws_reinvent_2021.html
- AWS Graviton – Wikipedia, 5月 1, 2025にアクセス、 https://en.wikipedia.org/wiki/AWS_Graviton
- AWSがArm Neoverseでクラウド価格/性能の向上とCPUのシリコンイノベーションを推進, 5月 1, 2025にアクセス、 https://www.arm.com/ja/partners/aws
- プレビューに参加しましょう — AWS Graviton3 プロセッサを搭載した Amazon EC2 C7g インスタンス, 5月 1, 2025にアクセス、 https://aws.amazon.com/jp/blogs/news/join-the-preview-amazon-ec2-c7g-instances-powered-by-new-aws-graviton3-processors/
- Amazon AWS Launches Graviton3 Arm Processors – ServeTheHome, 5月 1, 2025にアクセス、 https://www.servethehome.com/amazon-aws-launches-graviton3-arm/
- New – Amazon EC2 C7g Instances, Powered by AWS Graviton3 Processors, 5月 1, 2025にアクセス、 https://aws.amazon.com/blogs/aws/new-amazon-ec2-c7g-instances-powered-by-aws-graviton3-processors/
- AWS Graviton3 プロセッサを搭載した新しい Amazon EC2 C7g インスタンスを発表, 5月 1, 2025にアクセス、 https://aws.amazon.com/jp/about-aws/whats-new/2022/05/amazon-ec2-c7g-instances-powered-aws-graviton3-processors/
- Amazon Graviton3 Benchmarks – Nice Performance Uplift With AWS …, 5月 1, 2025にアクセス、 https://www.phoronix.com/review/aws-graviton3-c7g
- New Graviton3-Based General Purpose (m7g) and Memory-Optimized (r7g) Amazon EC2 Instances | AWS News Blog, 5月 1, 2025にアクセス、 https://aws.amazon.com/blogs/aws/new-graviton3-based-general-purpose-m7g-and-memory-optimized-r7g-amazon-ec2-instances/
- Powering Amazon RDS with AWS Graviton3: Benchmarks | AWS …, 5月 1, 2025にアクセス、 https://aws.amazon.com/blogs/database/powering-amazon-rds-with-aws-graviton3-benchmarks/
- AWS Graviton3 – CelerData, 5月 1, 2025にアクセス、 https://celerdata.com/glossary/aws-graviton3
- AWS Graviton3 Hits GA with 3 Sockets Per Motherboard Designs, 5月 1, 2025にアクセス、 https://www.servethehome.com/amazon-aws-graviton3-hits-ga-with-3-sockets-per-motherboard-designs-tri-socket-arm/
- Amazon Graviton Processor – Amazon Web Services, 5月 1, 2025にアクセス、 https://www.amazonaws.cn/en/ec2/graviton/
- AWS Graviton3 プロセッサを搭載した EC2 C7g インスタンスが発表されました。, 5月 1, 2025にアクセス、 https://www.skyarch.net/blog/aws-graviton3-%E3%83%97%E3%83%AD%E3%82%BB%E3%83%83%E3%82%B5%E3%82%92%E6%90%AD%E8%BC%89%E3%81%97%E3%81%9F-ec2-c7g-%E3%82%A4%E3%83%B3%E3%82%B9%E3%82%BF%E3%83%B3%E3%82%B9%E3%81%8C%E7%99%BA%E8%A1%A8/
- Amazon EC2 C7g instances – Compute –Amazon Web Services, 5月 1, 2025にアクセス、 https://aws.amazon.com/ec2/instance-types/c7g/
- Amazon EC2 Hpc7g Instances – AWS, 5月 1, 2025にアクセス、 https://aws.amazon.com/ec2/instance-types/hpc7g/
- M7g (汎用), R7g(メモリ最適化) AWS Graviton 3を搭載する新しいEC2インスタンスがリリースされました | DevelopersIO, 5月 1, 2025にアクセス、 https://dev.classmethod.jp/articles/m7g-r7g-new-ec2-instances/
- Providers Instance Types – VPSBenchmarks, 5月 1, 2025にアクセス、 https://www.vpsbenchmarks.com/instance_types
- [速報] AWS Graviton3プロセッサを搭載したEC2 C7gインスタンスを発表! #reinvent, 5月 1, 2025にアクセス、 https://dev.classmethod.jp/articles/reinvent2021-amazon-ec2-c7g-and-graviton3/
- A Deep Dive into AWS Graviton Instances – CloudOptimo, 5月 1, 2025にアクセス、 https://www.cloudoptimo.com/blog/a-deep-dive-into-aws-graviton-instances/
- AWS Graviton deep dive: The best price performance for your AWS workloads – © 2022, Amazon Web Services, Inc. or its affiliates. All rights reserved., 5月 1, 2025にアクセス、 https://d1.awsstatic.com/events/Summits/reinvent2022/CMP327_AWS-Graviton-deep-dive-The-best-price-performance-for-your-AWS-workloads.pdf
- AWS Graviton Processor – Amazon EC2, 5月 1, 2025にアクセス、 https://aws.amazon.com/ec2/graviton/
- Graviton3、プライベート5G、デジタルツイン AWS re:Invent 2021で発表されたアップデート (1/3), 5月 1, 2025にアクセス、 https://ascii.jp/elem/000/004/076/4076958/
- Amazon EC2 Instance Types – VPSBenchmarks, 5月 1, 2025にアクセス、 https://www.vpsbenchmarks.com/instance_types/amazon_ec2
- AWS EC2 Instance Comparison: M7g vs M6g, 5月 1, 2025にアクセス、 https://www.learnaws.org/2023/02/25/m7g-m6g/
- Amazon EC2 Instance Types – Compute – AWS, 5月 1, 2025にアクセス、 https://aws.amazon.com/ec2/instance-types/
- AWS EC2 Instance Comparison: R7g vs R6g – Learn AWS, 5月 1, 2025にアクセス、 https://www.learnaws.org/2023/02/25/r7g-r6g/
- AWS、データセンターの軽量化を実現する「Nitro v5」、HPC特化版の「Graviton3E」などの新チップをre:Inventで発表 – クラウド Watch, 5月 1, 2025にアクセス、 https://cloud.watch.impress.co.jp/docs/event/1459689.html
- AWS Graviton3 で Amazon RDS を稼働: ベンチマーク | Amazon Web Services ブログ, 5月 1, 2025にアクセス、 https://aws.amazon.com/jp/blogs/news/powering-amazon-rds-with-aws-graviton3-benchmarks/
- Instructure が AWS Graviton3 プロセッサを使用して、コストを 20% 削減しながら最大 30% スケールアップ | 導入事例, 5月 1, 2025にアクセス、 https://aws.amazon.com/jp/solutions/case-studies/instructure-case-study/
- Intel vs AMD vs Graviton: Amazon EC2 Processor Differences and Distribution – Vantage, 5月 1, 2025にアクセス、 https://www.vantage.sh/blog/aws-ec2-processors-intel-vs-amd-vs-graviton-adoption
- AMD vs Intel vs Graviton: Comparison between Modern Processors – CloudOptimo, 5月 1, 2025にアクセス、 https://www.cloudoptimo.com/blog/amd-vs-intel-vs-graviton-comparison-between-modern-processors/
- Processor Options & Comparison on AWS – Is Graviton a game changer? – Versent, 5月 1, 2025にアクセス、 https://versent.com.au/blog/processor-options-comparison-on-aws-is-graviton-a-game-changer/
- How can Arm chips like AWS Graviton be faster and cheaper than x86 chips from Intel or AMD? – Reddit, 5月 1, 2025にアクセス、 https://www.reddit.com/r/aws/comments/17gtcd0/how_can_arm_chips_like_aws_graviton_be_faster_and/
- What’s your experience with AWS Graviton processors? – Reddit, 5月 1, 2025にアクセス、 https://www.reddit.com/r/aws/comments/1hiikoa/whats_your_experience_with_aws_graviton_processors/
- Powering .NET 8 with AWS Graviton3: Benchmarks | .NET on AWS …, 5月 1, 2025にアクセス、 https://aws.amazon.com/blogs/dotnet/powering-net-8-with-aws-graviton3-benchmarks/
- Intel vs AMD vs Graviton:Amazon EC2 处理器| MofCloud – Mof 云智能助手, 5月 1, 2025にアクセス、 https://mofcloud.cn/blog/blog/2024-12-23-intel-amd-graviton
- Benchmarking Amazon EC2’s New C6a Instances Powered By 3rd Gen EPYC – Phoronix, 5月 1, 2025にアクセス、 https://www.phoronix.com/review/amazon-ec2-c6a/4
- Amazon Graviton3 vs. Intel Xeon vs. AMD EPYC Performance Review – Phoronix, 5月 1, 2025にアクセス、 https://www.phoronix.com/review/graviton3-amd-intel
- Why should I choose Graviton-based RDS instances instead of Intel/AMD-based (and viceversa)? : r/aws – Reddit, 5月 1, 2025にアクセス、 https://www.reddit.com/r/aws/comments/17h13jv/why_should_i_choose_gravitonbased_rds_instances/
- Amazon EC2 Graviton3 Benchmark Comparison Performance – OpenBenchmarking.org, 5月 1, 2025にアクセス、 https://openbenchmarking.org/result/2205260-PTS-GRAVITON42
- Amazon EC2 Graviton3 Benchmark Comparison Performance – OpenBenchmarking.org, 5月 1, 2025にアクセス、 https://openbenchmarking.org/result/2205260-PTS-GRAVITON42&sgm=1&swl=1&ppd_YTEuNHhsYXJnZSBHcmF2aXRvbg=0.408&ppd_YzZnLjR4bGFyZ2UgR3Jhdml0b24y=0.544&ppd_YzdnLjR4bGFyZ2UgR3Jhdml0b24z=0.58&ppd_YzZhLjR4bGFyZ2UgRVBZQw=0.612&ppd_YzZpLjR4bGFyZ2UgWGVvbg=0.68&ppt=DPH&sor
- Putting AWS Graviton and its Arm CPU Performance in Context – ServeTheHome, 5月 1, 2025にアクセス、 https://www.servethehome.com/putting-aws-graviton-its-arm-cpu-performance-in-context/
- Top 10 linux benchmarking tools in 2025 – To test the performance of CPU, Ram, Network etc, 5月 1, 2025にアクセス、 https://theserverhost.com/blog/post/top-10-linux-benchmarking-tools
- Benchmark series part 1: Benchmarking virtual cloud hardware using 6 great tools, 5月 1, 2025にアクセス、 https://www.augmentedmind.de/2024/02/11/benchmark-virtual-cloud-hardware/
- Cloud Benchmarking: Server Performance Benchmark Methodology – Novatec, 5月 1, 2025にアクセス、 https://www.novatec-gmbh.de/en/insights/blog/cloud-benchmarking/
- Benchmarks – SPEC.org, 5月 1, 2025にアクセス、 https://www.spec.org/products/
- AWS EC2 C6i Instances Enabled by 3rd Gen Intel® Xeon® Scalable Processors Delivered Better Compute Performance, 5月 1, 2025にアクセス、 https://cdrdv2-public.intel.com/766407/specrate2017-on-aws-c6i-vs-c6a.pdf
- SPEC CPU ® 2017 benchmark, 5月 1, 2025にアクセス、 https://www.spec.org/cpu2017/
- SPEC CPU 2017 Results – SPEC.org, 5月 1, 2025にアクセス、 https://www.spec.org/cpu2017/results/
- Geekbench 6 – Cross-Platform Benchmark, 5月 1, 2025にアクセス、 https://www.geekbench.com/
- Amazon EC2 m6i.large vs Amazon EC2 m5.large – Geekbench Browser, 5月 1, 2025にアクセス、 https://browser.geekbench.com/v5/cpu/compare/9364082?baseline=10524446
- Amazon EC2 m6a.xlarge – Geekbench, 5月 1, 2025にアクセス、 https://browser.geekbench.com/v5/cpu/20612223
- Amazon EC2 m6a.large – Geekbench, 5月 1, 2025にアクセス、 https://browser.geekbench.com/v5/cpu/12021798
- Cost-Performance Evaluation of General Compute Instances: AWS, 5月 1, 2025にアクセス、 https://ijcttjournal.org/2024/Volume-72%20Issue-11/IJCTT-V72I11P127.pdf
- sysbench CPU – Projector – Cloud Mercato, 5月 1, 2025にアクセス、 https://projector.cloud-mercato.com/projects/state-of-the-art-of-european-iaas-compute-q2-2022/sysbench-cpu/graph
- sysbench CPU – Projector – Cloud Mercato, 5月 1, 2025にアクセス、 https://projector.cloud-mercato.com/projects/aws-vs-azure-vs-google-vs-ibm-vs-oracle-vms-q4-2024/sysbench-cpu/graph
- AWS EC2 Instance Comparison: C7g vs C6g, 5月 1, 2025にアクセス、 https://www.learnaws.org/2022/10/21/c7g-vs-c6g/
- AWS Graviton4 CPU benchmarked against AMD and Intel processors — faster than predecessors and more cost-effective | Tom’s Hardware, 5月 1, 2025にアクセス、 https://www.tomshardware.com/pc-components/cpus/aws-graviton4-cpu-benchmarked-against-amd-and-intel-processors-faster-than-predecessors-and-more-cost-effective-than-incumbents
- Benchmarking Bare Metal Cloud Servers for HPC Applications – Department of Computer Science, 5月 1, 2025にアクセス、 https://www.cs.utsa.edu/~atc/pub/C50.pdf
- Performance Analysis of High Performance Computing Applications on the Amazon Web Services Cloud, 5月 1, 2025にアクセス、 https://www.nersc.gov/assets/NERSC-Staff-Publications/2010/CloudCom.pdf
- Apache vs. Nginx performance benchmark – YouTube, 5月 1, 2025にアクセス、 https://www.youtube.com/watch?v=Fx8afVZJLd4
- Compare Nginx and Apache: Key Features & Performance Benchmark – HostScore, 5月 1, 2025にアクセス、 https://hostscore.net/learn/nginx-vs-apache/
- Head-to-Head Performance Comparison of Nginx and Apache – Pressable, 5月 1, 2025にアクセス、 https://pressable.com/blog/head-to-head-performance-comparison-of-nginx-and-apache/
- NGINX on AWS C6i vs. C7g – Intel, 5月 1, 2025にアクセス、 https://cdrdv2-public.intel.com/764671/nginx-on-aws-c6i-vs-c7g-benchmark.pdf
- Nginx Performance on AWS Graviton3 – Servers and Cloud Computing blog, 5月 1, 2025にアクセス、 https://community.arm.com/arm-community-blogs/b/infrastructure-solutions-blog/posts/nginx-performance-on-graviton-3
- NGINX Performance on AWS C6i vs C6a – Intel, 5月 1, 2025にアクセス、 https://cdrdv2-public.intel.com/753045/NGINX-Performance-on-AWS-C6i-vs-C6a-1.pdf
- Which memory-optimized AWS EC2 instance type is best for …, 5月 1, 2025にアクセス、 https://community.intel.com/t5/Blogs/Tech-Innovation/Cloud/Which-memory-optimized-AWS-EC2-instance-type-is-best-for-MongoDB/post/1615010
- SPEChpc ® 2021 benchmark – SPEC.org, 5月 1, 2025にアクセス、 https://www.spec.org/hpc2021/
- DCPerf: An open source benchmark suite for hyperscale compute applications, 5月 1, 2025にアクセス、 https://engineering.fb.com/2024/08/05/data-center-engineering/dcperf-open-source-benchmark-suite-for-hyperscale-compute-applications/
- ベンチマークで性能比較! クラウドにおける効率的なサイジングを考えよう | Fujitsu Cloud Direct, 5月 1, 2025にアクセス、 https://clouddirect.jp.fujitsu.com/service/navi-fjcloud-benchmark_cpu
- Azure Windows VM のコンピューティング ベンチマーク スコア – Learn Microsoft, 5月 1, 2025にアクセス、 https://learn.microsoft.com/ja-jp/azure/virtual-machines/windows/compute-benchmark-scores
- CPUの性能比較表|2025年最新版 – | 法人様向けパソコンならドスパラプラス, 5月 1, 2025にアクセス、 https://dosparaplus.com/library/details/001536.html
- Intel(インテル)CPU性能比較表【2025年4月9日更新】 – ドスパラ, 5月 1, 2025にアクセス、 https://www.dospara.co.jp/5info/cts_lp_intel_cpu.html
- どのインスタンスを選べばいいの?EC2性能比較! | インフォメーション・ディベロプメント, 5月 1, 2025にアクセス、 https://www.idnet.co.jp/column/page_196.html
- Kafka Benchmarking on AWS Graviton2, Graviton3 and AMD – The New Stack, 5月 1, 2025にアクセス、 https://thenewstack.io/kafka-benchmarking-on-aws-graviton2-graviton3-and-amd/
- AWS CPU C7i の性能検証 | 外道父の匠, 5月 1, 2025にアクセス、 https://blog.father.gedow.net/2023/10/06/aws-cpu-c7i-benchmark/
- Comparing Graviton (ARM) Performance to Intel and AMD for MySQL (Part 3) – Percona, 5月 1, 2025にアクセス、 https://www.percona.com/blog/comparing-graviton-arm-performance-to-intel-and-amd-for-mysql-part-3/
- Amazon Graviton3 vs. Intel Xeon vs. AMD EPYC Performance Review : r/hardware – Reddit, 5月 1, 2025にアクセス、 https://www.reddit.com/r/hardware/comments/v06wrg/amazon_graviton3_vs_intel_xeon_vs_amd_epyc/
- AWS EC2 Instances Benchmark – RunsOn, 5月 1, 2025にアクセス、 https://runs-on.com/benchmarks/aws-ec2-instances/
- AWS CPU C6i/C6a の性能検証 – 外道父の匠, 5月 1, 2025にアクセス、 https://blog.father.gedow.net/2022/07/23/aws-c6i-c6a-benchmark/
- サクッとわかるGraviton3。AWSの第3世代カスタムARMプロセッサ – Zenn, 5月 1, 2025にアクセス、 https://zenn.dev/quiver/articles/c180040daa05ab
- Amazon Unveils Graviton4: A 96-Core ARM CPU with 536.7 GBps Memory Bandwidth, 5月 1, 2025にアクセス、 https://www.anandtech.com/show/21172/amazon-unveils-graviton4-a-96core-cpu-with-5367-gbs-memory-bandwidth