読む前に覚えておきたい用語
GPU
「Graphics Processing Unit(画像処理装置)」の略称で、高い並列性と高速メモリアクセスが必要なグラフィックスの処理を、CPUに代わって行うコプロセッサのこと。「GPU」の名称は1999年8月にnVIDIAがリリースした「GeForce 256」で初めて使用され、以降ジオメトリ演算機能を備えたグラフィックスチップの総称となった。
統合GPU
CPUやチップセットなどに統合されたGPUを「統合GPU(インテグレーテッドGPU)」と呼ぶ。2006年発売のCore 2プロセッサ(Core)ではロジックボード上のチップセットにGPU機能を統合していたが、2011年発売の第2世代Coreプロセッサ(Sandy Bridge)以降はダイレベルでCPUにGPUの機能が統合された。
Intel HD Graphics
インテルが開発した統合GPUのブランド名。最初のインテルHDグラフィックスは第1世代Core iプロセッサ(Nehalem)のローエンド製品に採用された。第2世代Coreプロセッサ以降強化が進み、第4世代Coreプロセッサ(Haswell)ではその上位モデルとして「インテルIrisグラフィックス」ブランドが追加された。
iFixit – Mac Pro Late 2013 Teardown
【URL】https://www.ifixit.com/Teardown/Mac+Pro+Late+2013+Teardown/20778
画像処理を一手に担うGPUの生い立ち
コンピュータが行う処理の中でも特にリソースを使うのがグラフィックスの処理だ。GPUはグラフィックス処理を専門に実行するコプロセッサのことで、CPUをグラフィックス処理から解放し、システム全体の性能向上を目指すために搭載される。
Macは1984年のリリース当初よりGUIベースのOSを採用しており、もともとシステム全体の処理の中でグラフィックスの占める割合が大きい。そのため、早い時期からグラフィックス処理を専任する「QuickDrawアクセラレータ機能」を備えたグラフィックスカードが多数リリースされ、CPU負荷を低減する仕組みが導入されていた。
1995年にウィンドウズ95がリリースされるとこの仕組みはコンピュータ市場全体に波及し、ATIやnVIDIA、3dFX、Matrox、S3といったグラフィックスチップベンダーが登場した。1999年にリリースされたnVIDIAの「GeForce 256」はジオメトリ演算機能により従来よりも高度な3D演算を可能にした製品で、このチップには初めて「GPU」の名称が与えられた。そして現在に至るまで GPUはグラフィックス処理コプロセッサの総称として使われている。
CPUの大手メーカーであるインテルは1998年にReal3Dと共同開発した同社初のグラフィックス処理コプロセッサ「i740(Intel 740)」をリリースした。これは商業的には成功しなかったが、インテルはこのi740の改良型をベースにしてチップセットにグラフィックス機能を統合した「統合GPU」を開発した。第1世代「コア(Core)」プロセッサまで、GPUはチップセットに統合されていたが、第2世代コアプロセッサではメモリコントローラを含めたMCHの機能が丸ごとCPUダイに統合され、その際にグラフィックス機能も大幅に強化したうえで「インテルHDグラフィックス」のブランド名が与えられた。これ以降、インテルのプロセッサはCPUにGPUの機能を内蔵する「統合GPU」タイプになっている。
2種類のGPUが持つメリットとデメリット
nVIDIAやAMDなどのベンダーがリリースしているGPUは、CPUとは別のチップとして搭載される「独立GPU」であり、両者はPCIエキスプレスで接続される。一方でインテルの作る「統合GPU」はCPUとダイレベルで統合されており、CPUコアとはリングバスなどのインターコネクト(チップ内部の高速インターフェイス)で接続される。
統合GPUには独立GPUにはないウィークポイントがいくつか存在する。1つはダイレベルでCPUと統合されているため、多くのトランジスタを詰め込むことができず、性能面で不利となる点だ。また、CPUとGPUのダイが隣接するため、両者の発熱をバランス良く処理しなければならず、GPUの性能のみを大きく向上させることも物理的に難しい。前者の問題はプロセスの微細化やダイサイズの大型化によって改善の可能性があり、また後者の問題も、GPUとCPUのいずれかの負荷が少ないときに、もう一方のプロセッサを高速に動作させる「ターボ・ブースト機能」の導入によって低減している。
統合GPUのもっとも深刻な弱点は、メモリアクセス帯域の制限だ。マルチコアが当たり前になった現在のプロセッサでは、もとよりメインメモリへのアクセス集中が大きな問題となっている。このため、大容量のキャッシュメモリを搭載する、メモリコントローラをプロセッサに内蔵するなど、さまざまな対策が採られてきた。しかし統合GPUではメインメモリの一部をGPU用のメモリ(VRAM)として使用するため、さらにメモリ帯域が不足する。
これに対して独立GPUにはGPU専用のメモリが搭載されている。特に、近年の独立GPUは動作速度5~7GHzのGDDR5規格のSDRAMメモリを64~512ビットという広いバス幅で接続することで、メインメモリの5~10倍という極めて高速なメモリアクセス帯域を確保しているのが特長だ。これは独立GPUの実行ユニット(Execution unit)が128~2048個という膨大なマルチコア構成であり、その処理能力を活かすためには広大なメモリアクセス帯域が必要不可欠なためだ。
統合GPUのメモリ帯域はこれに比べて極めて低く、しかもCPUとの共用を強いられる。このため統合GPUの実行ユニット数を大幅に増強しても、メモリアクセスがボトルネックとなってしまい、実際のグラフィックス性能はあまり向上しないという課題がある。
独立GPUと統合GPU比較表
モバイル向けの独立GPUと統合GPUの比較表。GPUコアの動作速度はどちらも1000MHz前後と変わらないが、コアの構成とビデオメモリの動作速度に大きな開きがあることがわかる。
専用メモリの搭載で統合GPUの弱点を克服
インテルはメモリ帯域の問題を解決するために、第4世代コアプロセッサ(Haswell)で初めて「eDRAM」と呼ばれる高速共有メモリをパッケージ上に搭載した。eDRAMの容量は64MBまたは128MBで、従来CPUが内蔵していたキャッシュメモリのサイズ(2~8MB)と比べても非常に大きい。アクセス速度は100GB/秒クラス(メインメモリは12・8~25・6GB/秒)と非常に高速で、かつレイテンシ(遅延)も極めて小さい。プロセッサとメインメモリとの間に挟む形でeDRAMを搭載して、メモリ帯域のボトルネックを低減する仕組みだ。
eDRAMを採用した統合GPUは「インテルIrisグラフィックス」のブランド名を与えられ、従来の「インテルHDグラフィックス」とは差別化された。eDRAMは演算ユニット数が増加した場合に高い効果を発揮し、特に第6世代コア(Skylake)に搭載されている統合GPU「GT3e」「GT4e」などにおいてはその効果を十分に示している。
インテルは今後もIrisグラフィックスを採用するプロセッサの構成比を引き上げる考えだ。また、eDRAMの製造にはプロセッサコアに近いプロセスを採用しているため、将来のプロセッサではeDRAMがダイレベルで統合される可能性もあり、その場合には現在よりさらにアクセス速度やレイテンシの性能が向上すると推測される。
現時点ではまだ独立GPUに差をつけられている統合GPUだが、その差は確実に狭まりつつあるのは確かであり、今後も両者の競争によってグラフィック性能は大幅に伸びていくだろう。
プロセッサに搭載されたeDRAM
インテルのCPU「KabyLake-U」のチップ写真。3つのダイのうち、左がeDRAM、中央がプロセッサダイ(CPU+GPU)、右がPCH(Platform Controller Hub)ダイ。MacBookプロ13インチモデルが採用する「Skylake-U」もほぼ同じ構成だ。
【URL】https://newsroom.intel.com/press-kits/7th-gen-intel-core/
大型化するGPUコア
「KabyLake-U」のダイ写真。最近のインテル製プロセッサは、CPUコアに比べてGPUコアの面積が極めて大きい。写真の統合GPUは「GT2」だが、「GT3」はさらに約2倍の面積を占める。
【URL】https://newsroom.intel.com/press-kits/7th-gen-intel-core/
各GPUの性能比較
モバイル向けの独立GPUと統合GPUの性能をベンチマークソフト「FireStrike」で比較した表。eDRAMを搭載するインテルIrisグラフィックスは、インテルHDグラフィックスよりも1クラス上の性能を示すが、ハイエンド級の独立GPUとはまだ大きな開きがある。
【8・24GC】
1990年3月に発売されたアップル初のQuickDrawアクセラレータカード「Macintosh DisplayCard 8・24GC」には、30MHzで動作するAMDのRISCプロセッサ「Am29000」が採用されていた。当時はこのほかにもRadius、RasterOps、SuperMac、BUGなどのビデオカードベンダーがあった。
【デュアルGPU
MacBookプロ15インチモデルは、グラフィックスの負荷に応じて独立GPUと統合GPU(インテルHDグラフィックス)をダイナミックに切り替え、高いグラフィック性能と低い消費電力を両立する。一方独立GPUを持たない13インチモデルには、インテルIrisグラフィックスが採用されている。
今井 隆
IT機器の設計歴30年を越えるハードウェアエンジニア。1983年にリリースされたLisaの虜になり、ハードウェア解析にのめり込む。