黄仁勋从煤气灶下取出最新GPU:7nm全新安培架构,售价20万美元
深黑的皮衣,苍白的头发。
熟悉的老黄又来了,但是少了宽敞的会场和粉丝的尖叫。
因为美国疫情的原因,英伟达和其他科技公司一样,把今年的GPU技术大会(GTC 2020)改成线上举行。
然而让人意想不到的是,今年的GTC甚至都没有采用直播形式,而是直接一口气放出7段视频,还是黄仁勋在家提前录好的。偷懒程度可能仅次于苹果直接上架新品。
就算Zoom不安全,老黄你好歹用别的软件直播一下啊。
不知道是不是听过玩家圈里2080Ti煤气灶的梗,老黄昨天发了一段预热视频:在自家煤气灶下方取出了一个超大的的设备——一个装有8个GPU的服务器主板,号称全球最大图形卡。
老黄的意思是不是说,这台GPU能热到和烤箱一样的程度呢。
从体积来看,这不可能是一台消费级显卡,难道RTX 3080没有了?
很遗憾,是的。
今年的GTC没有RTX系列游戏显卡的更新。但是已经服役3年的V100迎来了继任者,全新基于安培架构的专业级GPU——A100。在AI训练这件事上,一片顶过去六片。
这台AI运算性能怪兽进一步加强了张量运算能力,加入新的支持稀疏张量运算的张量核心,以后黄教主GPU似乎可以改称TPU了。
至于A100性能参数如何,下面开始详解。
首款安培架构GPU问世
V100的“V”代表Volta架构,A100的“A”则代表Ampere架构。
最新的A100 GPU集成了超过540亿个晶体管,这使它荣获全球最大尺寸的7nm制程处理器的称号。
黄教主解释道,如此高的集成度已经达到了现今半导体工艺的极限,A100是人类有史以来生产过的最大的处理器内核,也是人类有史以来集成度最高的计算机处理器。
英伟达大幅度提升了A100的张量计算核心(Tensor cores)的性能,FP32性能达到19.5万亿次/秒。包含6912个CUDA核心、40GB内存和1.6TB/s的内存带宽。
但集成了如此优秀的性能的GPU,你却不能用它来玩任何3A大作。
A100本身也不是游戏显卡。在单精度和双精度浮点算力上,A100相比V100提升不大,但是张量核心的运算能力有了很大的提高,FP16张量算力几乎是V100的2.5倍。
而且V100还新加入了对32位张量浮点运算(TF32)的支持,能更好地处理AI运算中的稀疏张量。
加入对稀疏张量的优化后,A100在FP16精度上的算力是V100的5倍,而在INT8上则提升了200倍!
这次强大的张量核心,给A100在AI上带来了性能的飞跃。以NLP领域的BERT算法为例,A100 比 V100在训练速度上提升6倍,在推理速度上提升了7倍。
显存带宽的提升也非常可观,多层HBM2内存可提供总计1.6 TB/s的带宽,比前代提升了78%。
英伟达将把A100应用到堆栈AI系统,就是老黄前几天从自家烤箱中拿出来的那个「预热」好的GPU板。这个全新的堆栈AI系统称为DGX A100,集成了8块A100。
DGX A100系统能够达到5千万亿次/s的浮点计算性能。这要归功于这8颗A100,使用了Nvidia的第三代NVLink进行集成。
8个GPU组合在一起,意味着有320GB的GPU内存和12.4TB/s的内存带宽。系统还包括15TB的第4代NVMe内部存储,为AI训练任务提供强大的支持。
这套系统的价格不菲,DGX A100的售价为19.9万美元,堪称史上最贵“烤箱”。
但是黄教主就是刀法娴熟,之前对消费级显卡精准切削,现在对DGX A100精准“切蛋糕”。
这套刀法叫做多实例GPU(MIG),可将单个A100 GPU划分为多达七个独立的GPU。
也就是说,使用DGX A100系统的研究人员和科学家可以将任务拆分成多达56个实例,将众多小规模任务分散在强大的GPU上。
买不起A100没关系,可以再找几个人众筹啊。
DGX A100系统已经开始发售,首先将应用在美国阿贡国家实验室对COVID-19新冠病毒的研究中。
黄仁勋说:“DGX A100系统的算力将帮助研究人员探索治疗方法和疫苗,并研究病毒的传播,使科学家能够在数月或数日内完成数年的AI加速工作。”
除了科研机构外,英伟达表示,微软、亚马逊、谷歌、阿里、百度、腾讯、浪潮、联想等大型云服务提供商计划将A100 整合到自己的产品中。
自动驾驶芯片性能提升6倍
在本次GTC大会主题演讲中,黄仁勋宣布,通过即将推出的Orin系统芯片(SoC)系列和A100 GPU,对现有的英伟达自动驾驶专用平台DRIVEAGX进行扩展。
此次扩展的范围覆盖从ADAS系统到DRIVEAGX PegasusRobotaxi平台。
新DRIVEAGX平台将会搭载一款新型Orin SoC。它的功率仅为5瓦,但性能却可达到10TOPS。
新平台还凭借两个Orin SoC和两块A100 GPU,实现2000TOPS的性能,满足自动驾驶所需的更高分辨率传感器输入,以及更先进的自动驾驶算法。
该架构是英伟达自动驾驶SoC迄今为止最大的性能飞跃,将DRIVE系统的性能提高了6倍。
现在,已经有小马智行、法拉第未来、Canoo等电动汽车和自动驾驶初创公司宣布与英伟达合作,在研发的汽车或自动驾驶产品中使用DRIVEAGX计算平台。
新边缘AI套件
本次线上GTC 2020还发布了两款性能强大的EGX边缘AI平台产品:适用于较大型商业通用服务器上的EGXA100,和适用于微型边缘服务器的Jetson Xavier NX。
这两款产品能够在边缘提供安全、高性能的AI处理能力。
EGX Jetson Xavier NX是全球体积最小、性能最强大的AI算力平台,适用于微型服务器和边缘智能物联网盒。
新主板的外观与Jetson Nano Developer Kit完全相同。在连接方面,它仍然拥有HDMI和DisplayPort接口,4个USB 3.0接口,一个microUSB接口,以及常见的GPIO接口选项。为了将摄像头连接到系统,它还配备了两个MIPI CSI-2端口连接器。
Xavier NX本身不是新东西,但是这次英伟达开始以开发者套件形式出售,价格和单机相同,都是399美元。与Jetson Nano的被动散热方案相比,新的开发套件采用了主动式散热风扇。
平台自带英伟达提供的 “云-native “支持,提供了边缘AI系统部署的解决方案,包括AI模型实例,帮助用户入门AI开发。
其他更新
除了A100、自动驾驶AGX、边缘平台Jetson Xavier NX外,英伟达还推出了:
1、GPU加速应用框架——NVIDIA Jarvis
2、开源社区合作,为Apache Spark 3.0提供端到端GPU加速
3、NIVIDIA医疗平台Clara重大性能拓展
4、25/50 Gb/s智能以太网卡NVIDIA Mellanox ConnectX-6LxSmartNIC
游戏显卡呢?
这次英伟达并未推出游戏显卡,其实也在意料之中。
老黄向来以刀法精准著称,去年才发布了20系的Super显卡,在中端显卡之间插入空位,低端显卡又有1660卡位,实在是没有动力升级啊。
况且在消费级显卡上使用7nm工艺,将比上一代的12nm制程提升太多,此前有传言称,3080Ti的性能比2080Ti提升40%。
果真如此的话,黄仁勋就真的把牙膏挤爆了。
安培架构都来了,RTX 3080还会远吗?更何况安培架构提升还这么大,下一代游戏显卡性能可期啊!
热门推荐
-
华为荣耀4A正式发布售价599元起
IT之家讯 今天下午,华为在北京举行了新品发布会,正式发布了旗下入门新机——... -
华为Mate 10保时捷版售价过万!比Mate 10 Pro贵4637元
【旗龙网讯】华为作为国产机里的扛把子——终于发布下半年旗舰Mate 10、Mate 10 Pro及M... -
魅族全新百元机魅蓝6T发布:性价比很高
魅蓝于5月29日以一个全所未有的方式举行了魅蓝新品的发布会,而这次魅蓝的主角是魅蓝最新的百元机--魅... -
华为mate20系列信息大曝光 令人捉摸不透的外观设计和全新的软件系统
【旗龙网:2018年8月13日消息】此前有业内人士披露即将登场的华为Mate 20系列摄像头配置将会... -
V20亮相:荣耀确认巴黎发布会以及全新旗舰发布时间!
今天就由叶紫小编十一来为大家介绍一下有关于荣耀系列V20的最新消息吧!作为国产品牌的佼佼者荣耀一贯以... -
Opera 发布全新 Opera One 浏览器,拥有更简洁的界面,
Opera 该公司最近发布了一个全新的浏览器 Opera One,这是未来的一种 AI 功能设计的... -
OPPO Reno系列发布,卖爆预警,买它!
万众期待的OPPO Reno系列正式发布。 -
OPPO全新系列手机官网开启预约:10月10日发布
今天OPPO官方突然上架了一款神秘新机。在这国庆七天假期来临之际,OPPO依然没有停止宣传新机的脚步... -
运动奢华两不误 全新立标有台面 全新一代宾利飞驰实拍简评
作为一家拥有百年历史的超豪华品牌,宾利在汽车界的地位与劳斯莱斯旗鼓相当,是身份与地位的象征。 -
响应宽带提速?售价199元的小米路由器4发布
就在5月17日当天便是世界电信日,北京联通对外宣布将从当日起启动免费宽带提速,让宽带提速进入了更高的... -
谷歌G1发布:十月正式上市 售价约1200元
北京时间23日晚间10:30分,美国最大运营商T-Mobile在纽约发布首款谷歌Android操作系... -
Pixel Stand无线充电器,谷歌全新升级
谷歌为Pixel 3和Pixel 3 XL设计了一款特殊的无线充电器——Pixel Stand,它不... -
PS5尚未成型?索尼架构师透露2019年或有消息
据4月18日的消息报道称,就在近日关于索尼PS5的消息被泄露了出来,不过这一次让许多玩家确实是兴奋了... -
我国再次刷新单模多芯光纤传输容量世界纪录
再次刷新了单模多芯光纤传输容量的世界纪录。科研人员通过对光传输系统架构和数字信号处理算法方面优化升级... -
《F1® 车队经理 2023》游戏新预告放出
叶紫网附游戏介绍如下:《F1® 车队经理 2023》的全新赛季将带您走进 Formula 1® 那紧... -
华为Ascend Mate7金属版荣耀 边框更薄
华为将在IFA2014大会上推出自家的重磅新旗舰——Ascend Mate7... -
阿维塔年内将发布全新轿车产品,全力冲刺订单 10 万辆年度目标
38 天的时间内交付量超 2000 辆,刷新高端 SEV 品牌首款车型交付纪录。长安汽车称,随着... -
ARM发全新CPU和 GPU架构,Cortex-A76和Mali-G76。
大多数手机SoC芯片研发都离不开一个名为“ARM”的企业的支持,而ARM的自述是:“我们(ARM)不... -
微信相框登录WeStore 支持微信视频通话 配8英寸屏幕
爱在家里展示照片的人还得挑选照片、导入USB、拿到数码馆印刷,费时费力。为解决这一痛点,微信相框诞生... -
全新八代凯美瑞双擎刷新销量纪录!在广州卖断货
新的一年又开始了而各大汽车厂商也都陆陆续续地披露了自家在一月份的销量数据,有多家企业都实现了“开门红... -
多项黑科技,售价3799起,华为荣耀magic2正式发布。
荣耀在北京发布新款旗舰机荣耀Magic 2。继承了荣耀Magic系列在“科技理想主义&r... -
多亲 F22 Pro 正式发布:4GB+64GB 售价 999 元
叶紫网2022 年7 月 19 日消息,官方宣称“比全面屏更防沉迷,比按键机更方便;专业开发系统,学... -
全屏手机的开拓者推出全新磁力滑屏,有望成为新一代解压神器。
小米作为全屏的开拓者,推出全新推屏设计,使小米MIX3有望成为最新一代解压手机。 -
腾龙适用于尼康 Z 卡口镜头型号 A047 上架,售价 4990 元
腾龙宣布适合尼康 Z 卡口全画幅长焦变焦镜头 ——70-300mm F / 4.5-6.3 Di I... -
售价6999元:三星Note 9国行版6G+128G首销!
就在半个多月之前三星曾经在在国内发布了下半年的重磅旗舰,就是名为Galaxy Note 9的一款新旗...