NV GTX1080发布 新旗舰到底强在哪里?
北京时间 2016 年 5 月 7 日,NVIDIA 发布了 16nm 制程 Pascal 架构的新卡—— GeForce GTX 1080/1070。原以为 NVIDIA 会像去年那样在 Computex 2016 上发布全新显卡,可能是为了拔得头筹跟老对手 AMD 抢个好彩头,GTX 1080/1070 就这样提前一个月来到了我们面前。经过前一个月"小道消息"的狂轰滥炸,我们其实已经对这块新旗舰很了解了,包括性能、外观等诸多方面。当发布会上老黄举起全新的"便携式核弹"时,我在心里说了句:"还真长这样,够酷!"
GTX 1080 采用了全新设计的涡轮散热器,由原来方中带圆的经典外观换成了现在这个侵略感十足的多边形外壳,我个人觉得还是很帅气的,当然,身边好些同事都说丑爆了,看来要考虑买非公版了 ...... 当然,外观这种东西仁者见仁,对一块显卡来说重要的还是性能,性能的强大相信通过我们之前的报道各位读者都已经很清楚了,作为 GTX 980 的继任者,其性能比两块 GTX 980 SLI 还要强,强大得毋庸置疑。
显 卡 规 格 比 较 表
显卡型号 GTX 1080 Tesla P100
GTX 980
GTX Titan X
首发限价 $599 ? $549 $999
GPU 代号 GP104 GP100 GM204 GM200
GPU 工艺 16nm 16nm 28nm 28nm
GPU 晶体管 7.2B 15.3B 5.2B 8B
着色器数量 2560 3584 2048 3072
单精度浮点 9 T 10.6 T 5 T 7 T
ROPs 数量 64 ? 64 96
纹理单元数量 160 224 128 192
核心频率 1607MHz 1328MHz 1126MHz 1000MHz
boost 频率 1733MHz 1480MHz 1216MHz 1075MHz
架构 Pascal Pascal Maxwell 2 Maxwell 2
显存频率 10 GHz ? 7 GHz 7 GHz
内存位宽 256 bit 4096 bit 256 bit 384 bit
内存带宽 320 GB/s 720 GB/s 224 GB/s 336 GB/s
内存类型 GDDR5X HBM2 GDDR5 GDDR5
内存容量 8 GB 16 GB 4 GB 12 GB
我们对比了 GTX 1080、GTX 980、Tesla P100 及 GTX Titan X 这几款显卡,GTX 1080 显卡的主要取代目标是 GTX 980 显卡,单从参数上看,其各项参数照比 GTX 980 均有所提升,当然,最显著的还是在频率部分,GTX 1080 的默认频率竟然高达 1607MHz,比 GTX 980 足足高了 500MHz,频率提升了 40%!这也正是 GTX 1080 的单精度浮点运算性能高达 9 TFLOPS 的原因。
GeForce GTX 1080
接下来看看显存方面,去年 AMD 率先使用了 HBM 显存,而今年 NVIDIA 则抢先在 GTX 1080 上使用了 GDDR5X 显存,频率高达 10Gbps,这比 GTX 980 的 7Gbps 提高了 43%,因而带宽从 224GB/s 上升至 320GB/s。不过 GDDR5X 再强悍,也比不过 HBM 的超高位宽。显存容量方面终于有了不小的提升,从 4GB 提升至 8GB,翻了一倍,不过在容量上我个人觉得还是不够大方,AMD 这边可是连 Radeon R9 390 都用上 8GB 显存了。
秒自家全家的逆天性能
说到 TDP,GTX 1080 的 TDP 为 180w,采用单 8pin 外接供电,而 GTX 980 的 TDP 为 190w,采用双 6pin 供电。TDP 上前者照比后者有着小幅降低,而供电接口上,单 8pin 和双 6pin 都可以提供 150w 的电力,这点没什么区别。
现场实拍
看起来似乎 GeForce GTX 1080 已经完爆 GTX 980 了,NVIDIA 官方都说了,一块 GTX 1080 大于两块 GTX 980 SLI,单精度浮点运算性能可是提升了 80%,连 GTX Titan X 都可以洗洗睡了,不过事实真的如此?我们现在所说的"性能"都是以单精度浮点运算性能作为考量依据,单精度的影响主要有两方面:一是显卡自身架构,二是显卡的时钟频率。GTX 1080 有着逆天的超高频率,但 CUDA 核心数量提升并不多,只多了四分之一,位宽还是 256bit,因此在实际游戏中可能并不会有如此夸张的性能提升。
GTX 1080 对比 Tesla P100
看过了 GTX 1080 同 GTX 980 的对比,我们再来对比一下 GTX 1080 和 Tesla P100。Tesla P100 是第一块采用 Pascal 的显卡,该卡使用了 GP100 大核心,虽然从架构图上看其并不是完整规格,但也未阉割多少,有点类似于 GTX Titan X 和 GTX 980Ti 之间的关系。首先从晶体管数量上看,GTX 1080 甚至还不足 Tesla P100 的二分之一,这个阉割幅度有够夸张的,要知道 GTX 980 的晶体管数量也就比完整规格的 GTX Titan X 少了 35%。
完整 GP100 核心
接下来看看一些核心参数,CUDA 核心数量由 3584 降至 2560,纹理单元数量由 224 降至 160,均下降近 30%。这个阉割幅度同 GTX 980 之于 GTX Titan X 几乎是一样的,都是少了 1024 个 CUDA 处理器和 64 个纹理单元。由于 Tesla P100 的光栅单元数据并未公布,因此在这里不进行比较。你问我怎么知道 GTX 1080 的光栅和纹理单元数量?我是根据 GP100 核心的 SM 结构以及显存位宽猜测的,估计八九不离十。
GP100 核心 SM 单元结构
然后是频率上,由于 Tesla P100 是一块计算卡,不需要拥有像游戏卡那样高的频率,因此在频率上,Tesla P100 照比 GTX 1080 下降了 280MHz 左右,至于显存频率,两者使用的是不同类型的显存,因此没有可比性。频率高的好处自然是不用多说,GTX 970 也可以通过超频达到 GTX 980 的程度,因此这一代的显卡在游戏中的表现想必会非常不错。
Tesla P100
看一下两张卡的单精度浮点运行算能力,重度阉割后的 GTX 1080 只比几乎是 GP100 全规格的 Tesla P100 低了 1.6 TFLOPS,与之对比的是 GTX 980 比 GTX Titan X 低了 2 TFLOPS,貌似差不多。GTX 1080 的单精度浮点运算性能已达 9 TFLOPS,是目前史上单精度浮点运算性能最高的单芯游戏卡。NVIDIA 并未提及该卡的双精度浮点运算性能,根据这块卡的超低功耗来看,估计还是像上代一样的 1/32 双精度,也就是 0.3 TFLOPS,这个数值跟 Tesla P100 的 5.3 TFLOPS 相比简直可以忽略不计。毕竟 GTX 1080 是一块游戏卡,对双精度没有什么特殊要求,太高的双精度单元反倒会使显卡功耗大幅度攀升,所以阉割了双精度反而是件好事。
GP104 核心及 GDDR5X 显存
接下来看看 TDP,GTX 1080 的 TDP 为 180w,而 Tesla P100 的 TDP 高达 300w,之所以 Tesla 的 TDP 如此之高,正是由于双精度为 1/2 单精度而造成的。GTX 1080 的 180w TDP 真的没什么槽点,新架构新制程确实能极大地提高显卡能耗比。
最后说说显存,由于 GTX 1080 只能勉勉强强算是今年旗舰,真正的旗舰还得是 GTX 1080Ti 和新 Titan,因此 GTX 1080 配备的是 GDDR5X 显存,而没有配备顶级的 HBM2 显存。GDDR5X 的带宽自然比不上 HBM2,但高频是 GDDR5X 的一大优势,10GHz 的高频率也是极大地提升了显卡性能。
GTX 1080 对比 Titan X
最后我们来对比一下 2016 年的旗舰和 2015 年的旗舰。首先需要明确的一点是,根据 NVIDIA 的 PPT 显示,GTX 1080 的游戏性能目测要超出 GTX Titan X 20% 以上,如果根据单精度浮点运算性能来判断,前者要领先后者 28%,这基本相当于 GTX 980 之于 GTX 980Ti 了。
GeForce GTX Titan X
看核心参数,GTX 1080 毕竟定位普通旗舰,和 GTX Titan X 这种至尊旗舰相比还是差距很大,GTX Titan X 的各项硬参数均碾压 GTX 1080。不过如果看频率的话,GTX Titan X 那 1GHz 频率同 GTX 1080 的 1.7GHz 相比简直不忍直视,在实际游戏中,GTX 1080 的高主频必然占据绝对优势。
棱角的分明的新"泰坦皮"
显存方面,尽管 GDDR5X 有着更高的带宽,但 GTX 1080 较小的位宽导致其带宽未能超越 GTX Titan X,当然,这也和 GTX 1080 上的 GDDR5X 显存频率比较保守有关,理论上 GDDR5X 可以达到 12-14Gbps,而 GTX 1080 的显存频率只有 10Gbps。显存数量上,毕竟 GTX Titan X 是偏向专业领域的,因此搭载了 12GB 超大显存,而实际游戏中根本不需要这么高的显存,因此 GTX 1080 的显存容量是 8GB。
功耗方面,GTX 1080 在领先 GTX Titan X 20% 以上的情况下,功耗比 GTX Titan X 少了近 30%,这种惊人的能耗比正是我们想看到的 Pascal 架构应有的表现。相信如果 GTX 1080Ti 在功耗维持 250w 以内的情况下,性能照比 GTX 1080 也会有 30-40% 的提升。
骚年,是时候充值信仰了!
最后总结一下,作为 Pascal 架构的首发游戏卡,称不上顶级的 GTX 1080 已经干翻了 Maxwell 架构全家了,真让人期待后面的 GTX 1080Ti 和新 Titan 会有怎样精彩的表现。还有,除了 GTX 1080 外,次旗舰 GTX 1070 也有着不错的性能,单精度浮点运算性能高达 6.5TFLOPS,已经几乎和 GTX Titan X 相当了,也就是说这一代的显卡真正意义上实现了质的飞跃。根据官方所述,GTX 1080/1070 将在 5 月底和 6 月初正式上市,届时大家就可以买到更快更强的新显卡了,我们 ZOL 也会继续追踪报道新卡的相关信息,敬请关注。