现场直击GTC大会|黄仁勋与九个人形机器人同台,新一代平台推理能力提升30倍
美国当地时间3月18日下午,全球瞩目的英伟达2024GTC大会在加州圣何塞SAP球场开幕。英伟达创始人CEO黄仁勋在主题演讲开场时风趣地说道:“这不是演唱会,这是开发者大会,我们会谈论很多计算机科学的话题。”
当黄仁勋一身皮衣走向舞台时,观众立刻沸腾。此前,有人把黄仁勋演讲的受关注程度与顶流歌星Taylor Swift的演唱会相提并论。
“我们正在以从未有过的方式来创建软件。”黄仁勋在演讲中强调,“这就需要构建更大的GPU。”
黄仁勋演讲时,英伟达的股价没有太大变化,竞争对手AMD股价大跌超过3%。
在演讲结束时,黄仁勋与正在使用英伟达软硬件平台开发的九款人形机器人共同登台,还与两个该公司正在测试的小型机器人进行互动。
大模型推理性能可提升30倍
在整场发布会上,最受关注的是英伟达基于下一代计算架构Blackwell超级芯片而构建的AI超级计算机。黄仁勋曾在多个场合表示,英伟达已经成为了一家平台公司。
黄仁勋率先发布了一款搭载英伟达GB200 Grace Blackwell超级芯片的DGX SuperPOD计算机,可以用于处理万亿参数模型,保证超大规模生成式AI训练和推理工作负载的持续运行。
这款新型的AI超级计算机采用新型高效液冷机架级扩展架构,在FP4精度下可提供11.5exaflops的AI超级计算性能和240TB的快速显存,且可通过增加机架来扩展性能。
据介绍,每个DGX GB200系统搭载36个NVIDIA GB200超级芯片,共包含36颗NVIDIA Grace CPU和72颗NVIDIA Blackwell GPU,这些超级芯片通过第五代NVIDIA NVLink连接成一台超级计算机。与上一代NVIDIA H100 Tensor Core GPU相比,GB200超级芯片在大语言模型推理工作负载方面的性能提升了高达30倍。
基于Grace Blackwell架构的DGX SuperPOD由8个或以上DGX GB200系统构建而成,这些系统通过NVIDIA Quantum InfiniBand网络连接,可扩展到数万个GB200超级芯片。用户可通过NVLink连接8个DGX GB200系统中的576颗 Blackwell GPU,从而获得海量共享显存空间,赋能下一代AI模型。
黄仁勋表示: “NVIDIA DGX AI超级计算机是推进AI产业变革的工厂。新一代DGX SuperPOD集英伟达加速计算、网络和软件方面的最新进展于一体,能够帮助每一个企业、行业和国家完善并生成自己的AI。”
与此同时,英伟达还发布了用于AI模型训练、微调和推理的通用AI超级计算平台NVIDIA DGX B200系统。该系统同样基于全新的Blackwell架构系统,包含8颗NVIDIA B200 Tensor Core GPU和2颗英特尔处理器。DGX B200系统在FP4精度下可提供高达144petaflops的 AI 性能、1.4TB的GPU显存和64TB/s的显存带宽,该系统的万亿参数模型实时推理速度比上一代产品提升了15倍。
英伟达表示,全球合作伙伴预计将在今年晚些时候提供基于DGX GB200 和DGX B200系统构建而成的NVIDIA DGX SuperPOD。
构建更友好软件生态,降低GPU使用门槛
英伟达同时还宣布了多个软件方面的更新布局。其中最重要的一项更新是推出生成式AI微服务NVIDIA NIM,供开发者在已安装NVIDIA CUDA GPU的系统中创建和部署生成式AI助手。
据介绍,由GPU加速NVIDIA NIM微服务和云端端点目录,适用于经过优化的预训练的AI模型,可以在云、数据中心、工作站和PC等支持CUDA的数亿设备的GPU上运行。
一位国内芯片公司技术负责人对第一财经记者表示:“英伟达的软件进行了重要的功能升级,把以前开发者要干的事情都便利化了,提供更友好的算力环境,使得开发者更加依赖。”
上述人士表示,构建更友好的软件生态是英伟达的重要战略。“也就是以后使用GPU的门槛会越来越低,英伟达生态的粘性越来越高。”他说道。
英伟达还宣布将以API的形式提供Omniverse Cloud,从而使开发者能够更方便地将Omniverse的核心技术直接集成到现有的数字孪生设计与自动化软件应用中,或是集成到用于测试和验证机器人或自动驾驶汽车等自主机器的仿真工作流中。
一些全球大型工业软件制造商正在将Omniverse Cloud API加入到其软件组合中,包括Ansys、Cadence、达索系统旗下3DEXCITE品牌、Hexagon、微软、罗克韦尔自动化、西门子和Trimble等。
黄仁勋表示:“所有制造出来的产品都将拥有数字孪生。Omniverse是一个可以构建并操作物理真实的数字孪生的操作系统。Omniverse和生成式AI都是将价值高达50万亿美元的重工业市场进行数字化所需的基础技术。”
Omniverse Cloud API将于今年晚些时候在微软云Azure上以NVIDIA A10 GPU上的自托管API,或是部署在NVIDIA OVX上的托管服务的形式提供。
英伟达还宣布推出一个硬件和软件平台,用于构建包含生成人工智能功能的类人机器人。据黄仁勋介绍,新平台将包括一个为机器人和人工智能提供动力的计算机系统,以及包括生成式AI和其他工具在内的一套软件,以构建能与人进行交互的人形机器人。
2023年羽毛球年度盛典圆满收官!赖茅与世界羽联携手同心再续合作情缘
5月20日,2023年苏迪曼杯世界羽毛球混合团体锦标赛决赛前夜,由贵州赖茅酒业有限公司主办的2023赖茅羽毛球年度盛典在苏州希尔顿酒店盛大举行。作为世界羽联的官方合作伙伴,赖茅携手羽毛球奥运冠军张宁、张楠,羽毛球世界冠军王晓理、陈金,以及民间羽毛球运动精英和“真赖粉”们,在苏州星湾学校体育馆举行2023赖茅羽毛球年度盛典全明星赛,并于当晚进行了颁奖典礼。获多方认可,赖茅与世界羽联再续情缘锤子财富2023-05-21 12:15:240000比亚迪高管深夜“喊话”马斯克!小米汽车6月交付?最新回应;腾讯出手!64亿拿地|大公司动态
第一财经每日精选最热门大公司动态,点击「听新闻」,一键收听。【汽车圈】小米公司发言人:小米汽车正式发布、交付时间均以官方信息为准据小米公司发言人官博称,近日有传闻“小米汽车预计六月份开始交付”,相关信息纯属捏造,完全子虚乌有,再次申明,小米汽车正式发布、交付时间均以官方信息为准。比亚迪赵长江深夜“喊话”马斯克锤子财富2024-01-23 20:31:300001宝丽迪:子公司量产的COFs材料尚未形成批量销售
宝丽迪表示,公司的子公司耀科新材料(苏州)有限公司量产的COFs材料正在产业化和商业化实践中,尚未形成批量销售。4月16日晚间,宝丽迪披露股票交易异动公告称,公司的子公司耀科新材料(苏州)有限公司(以下简称“耀科”)量产的COFs材料正在产业化和商业化实践中,尚未形成批量销售。未来耀科将加大研发和生产投入,丰富COFs的产品类型和应用场景,并进一步扩大产能,满足日益增长的市场需求。锤子财富2024-04-16 18:57:520000荣耀“借壳”传闻下概念股拉升,董事长万飚回应离职传闻
荣耀内部人士表示,不会以借壳方式上市。从华为剥离后,关于荣耀上市的消息就从未间断,近期又有消息称荣耀终端有限公司董事长万飚已离职,相关董事长一职由原深圳市水务集团有限公司董事长吴晖接任,目的是推进上市进程。锤子财富2023-11-22 14:11:280000中融信托被建信、中信信托托管,14家上市公司披露近8亿产品“踩雷”
首次正面回应。9月15日深夜,中融信托发布公告称,受内外部多重因素影响,公司部分信托产品无法按期兑付。为提升公司经营管理效能,经股东会授权、董事会审议通过,公司与建信信托、中信信托签订了《委托管理服务协议》,聘请上述两家公司为公司经营管理提供专业服务。锤子财富2023-09-16 14:25:320000