GB202采用升级版台积电4NP工艺制造,与上代AD102使用的4N相比,属于增强版,属于5nm级别。
GB202集成的晶体管数量多达922亿,相比AD102的763亿增加了大约21%,芯片面积从616平方毫米增加到761平方毫米,增幅约为23.5%,晶体管密度反而略微降低了。
GB202仍为12组GPC,每组GPC内部的TPC数量从6组增加到8组,每组TPC中依然是两组SM,每组SM还是128个CUDA核心,满血核心总计24756个CUDA核心。RTX 5090和5090D都屏蔽了11组TPC,屏蔽幅度约为11%。
RTX 5090D的Tensor核心数量仍为680个。
计算单元中间的大块区域是缓存。GB202的一级缓存从16MB增加到21.5MB,二级缓存从72MB增加到96MB,增加比例与CUDA核心相同。
计算单元中间竖向长条区域是编解码器,满血核心拥有4组第九代编码引擎NVENC、4组第九代解码引擎NVEDC,而RTX 5090和5090D分别只开启了3组和2组。
底部边缘是PCIe 5.0 x16 PHY物理层和5条视频输出接口,顶部和左右边缘则是GDDR7显存控制器,每组32-bit,一共16组构成了512-bit的位宽。
根据TechPowerUp的测试,英伟达RTX 5090显卡在PCIe 4.0 x16接口下的游戏性能损失非常小,仅为1%左右。
RTX 5090在PCIe 4.0 x16下的游戏性能损耗会随着分辨率的提高而相对降低,在4K分辨率下,游戏性能的损失浮动较为稳定。在1080P、PCIe 4.0 x16下,RTX 5090的平均游戏性能损失约为1.07%;在2K、PCIe 4.0 x16下,损失约为1.29%;在4K、PCIe 4.0 x16下,损失约为0.74%。
在某些特定游戏中,性能损失可能会比较明显。例如在《黑神话:悟空》中,RTX 5090在1080P、PCIe 5.0 x16下的帧率为112,在PCIe 4.0 x16下,帧率降至98.7,性能损失约为11%,在2K和4K分辨率下,性能表现恢复正常。
对于那些因主板限制或使用外部解决方案而必须使用较少PCIe通道的用户,PCIe 4 x4配置在1080p下的性能为89%,在1440p下为90%,在4K下为94%,存在一定性能损失。
如果使用的是PCIe 4.0 x16,可以放心使用RTX 5090,几乎不会有任何性能损失,较老的PCIe 3.0 x16或PCIe 4.0 x4也很难发现明显的性能损失。