CUDA Coreは1基で2つの積和演算(2 OPs)をこなせることから,以下のとおり


 NVIDIAはTesla P100の動作クロックについて,ベース1328MHz,ブースト1480MHzと明らかにしているが,実際,計算結果はブーストクロックと一致している。

 GP100ではもう1つ,「ハーフ精度」とも呼ばれる半精度浮動小数点(FP16)演算性能の高さが,大きな目玉となっている(関連記事)。従来のNVIDIAGPUだと,数値型としてのFP16は利用できたものの,GPU内部における取り扱いはFP32と同等だった。それに対してGP100では,FP32の演算器にFP16をペアで“押し込んで”一括計算できるため,シンプルに2倍,21.2 TFLOPSの演算性能が得られるのだ。