理論算力計算:GPU算力常以FLOPS(Floating-Point Operations Per Second,每秒浮點運算次數(shù))來表示,通常數(shù)量級為T(萬億),也即是大家聽到的TFLOPS。最常見的計算方式為CUDA核心計算法
# CUDA核心計算法
算力(FLOPS)= CUDA核心數(shù) × 加速頻率 × 每核心單個周期浮點計算系數(shù)
# 以A100為例
A100的算力(FP32單精度)= 6912(6912個CUDA核心) × 1.41(1.41GHz頻率) × 2(單周期2個浮點計算) = 19491.84 GFLOPS ≈ 19.5 TFLOPS