AMDの次世代CPU「Bulldozer」のクラスタベースマルチスレッディング

リソースを部分的に共有化することで、クラスタベースマルチスレッディングに必要なリソースは、CMPデュアルコアよりずっと少なくなる。AMDは、シングルコアに対して50%のリソース増加で、80%のスループットアップが得られるとこれまで説明して来た。つまり、単純計算では、デュアルコアの75%のリソースで、デュアルコアの90%のパフォーマンスが得られることになる。

なかなか心ときめく数値.
関連: 2011年に登場するAMDの8コアデスクトップCPU「Zambezi」

ここで面白いのは、整数演算クラスタが2に対して、浮動小数点演算クラスタが1という比率が、比較的一般的であることだ。例えば、Sun MicrosystemsのNiagara2(UltraSPARC T1/UltraSPARC T2)やRockなども2整数コアと1個の共有浮動小数点コアという比率だ。また、旧DEC/CompaqのAlphaプロセッサの「EV8」も、4- wayのSMT(Simultaneous Multithreading)で8整数演算ユニットのクラスタに対して、4浮動小数点演算ユニットの構成だった。

昔の AMD 自体が Intel 並みの整数演算性能と、劣る浮動小数点演算という割り切りをしていたのを思い出すな.
関連: 整数パフォーマンスを犠牲にする? AMDの「Bulldozer」 / AMDのBulldozerの命令発行の仕組み