NVIDIA最新的GPU,A800及其新的图形体系结构Ampere。在公司长期推迟的GTC会议上宣布,A800不适合游戏玩家,甚至不适合工作站用户。相反,它是基于Volta的V100的直接替代产品-V100是为数据中心专门构建的2017 GPU。
除了Titan V和Quadro工作站卡之外,Volta从未直接吸引消费者,但是它引入的改进和张量核心是Turing的关键部分,该架构几乎支持了NVIDIA当前所有的GeForce和Quadro卡。无论下一代GeForce和Quadro卡也被称为Ampere。
NVIDIA在Ampere的细节方面有些模糊,但我们知道A800 GPU 很大。它的芯片尺寸为826平方毫米,大于V100(815mm2)和NVIDIA的旗舰游戏卡RTX 2080 Ti(754mm2)。
这些听起来可能并没有什么大的不同,但是A800是NVIDIA的第一款基于台积电7纳米制程的GPU-其当前型号为12纳米。这意味着每个晶体管所需的空间大约减少了40%,这显然使NVIDIA将540亿个晶体管压缩到A800中。我们说这显然是因为,与2080 Ti的186亿个晶体管相比,这是一个巨大的增长,几乎感觉到有人在数学上做错了。话虽如此,一些快速计算得出A800的晶体管密度约为每平方毫米6500万,这在台积电7纳米工艺的可能性范围之内。
A800远离晶体管,拥有6,912 FP32 CUDA内核,3,456 FP64 CUDA内核和422 Tensor内核。相比之下,V100具有5120个CUDA内核和640个Tensor内核,您可以看到新工艺对NVIDIA将更多组件压缩到一块芯片中的影响有多大,该芯片仅比替换的芯片大一点。
A800的销售包装为DGX A800,该系统具有8台A800,一对64核AMD服务器芯片,1TB RAM和15TB NVME存储,价格仅为200,000美元。就背景而言,DGX-1是一款具有8个V100的类似系统,在发布时的成本约为15万美元。这相当于将世代价格提高了33%,但NVIDIA声称A800在AI推理和培训方面的速度是V100的20倍。而且AI实际上是所有这些卡都可能会用到的-NVIDIA已经将DGX A800出售给了该领域的合作伙伴,并将其中的一张发送给了Argonne国家实验室,以帮助对抗COVID-19。
这种20倍的性能提升部分是由于内核的大量增加, A800还受益于其内存:它具有40GB的HBM2内存,而V100推出时只有16GB(该公司后来将Volta卡的内存提高到32GB),这意味着每个DGX A800系统都可以播放320GB的VRAM。用。
那么,这能告诉我们有关NVIDIA备受期待的新游戏卡的什么信息?好吧,具体来说,这些AI改进中的某些改进将在GeForce卡中找到它们的用处,从而改善诸如DLSS或降噪等升档任务的性能,这是光线追踪的关键方面。
NVIDIA首席执行官黄仁勋完全确认,尽管安培和即将推出的消费卡之间存在“架构上的巨大重叠”,但这些游戏卡将不具有HBM2内存,并且尺寸不同芯片中的元素将有很大的不同,因为它们将比高精度数学更多地关注图形性能。这意味着对于消费类卡而言,您应该期望FP32计算获得更高的收益(这是TFLOP数据,当您启动新的GPU或控制台时就会听到这个数字),因为A800的大部分芯片都交给了FP64处理器。硬件。
进入理论设计阶段,完全针对游戏的,大小为2080 Ti且密度接近A800的GeForce GPU可能会快两倍。需要明确的是,这种情况极不可能发生:NVIDIA可能会大幅缩小芯片尺寸,降低成本,并以与当前一代相似的价格出售更快的显卡。 “3080ti”将有超过2080ti,这可能使对于一款旗舰GPU上备受更合理450平方毫米约30%的多内核。