CES 2026 英伟达CEO黄仁勋发表演讲
文章语言:
简
繁
EN
分享
纪要
原文
会议摘要
Nvidia正引领着从传统计算到以人工智能为中心范式的转变,这一转变的亮点包括人工智能超级计算、开源模型以及跨行业的人工智能整合。Nvidia发布的维拉·鲁宾人工智能超级计算机展示了其致力于开拓人工智能技术的承诺,强调未来行业的能源效率、安全性和可扩展性。
会议速览
这段对话概述了英伟达对由人工智能驱动的计算变革的观点,突出了自主系统的出现以及涌入人工智能驱动创新的重大投资,标志着计算行业的根本重塑。
NVIDIA率先推出开源人工智能模型,提升全球创新,在物理人工智能方面取得成功,影响生物学、机器人技术和天气预测等领域,制定新的行业标准。
这段对话突出了公司世界一流的人工智能模型,包括PDF检索器、语音识别和语义搜索功能,这些功能对理解多模态文档和构建人工智能代理至关重要,使其在行业领先榜上占据最高位置。
这段对话探讨了人工智能模型的进步,着重于它们的推理、适应和整合多个模型以增强问题解决能力。它突出了人工智能应用的可定制性、多模态功能以及使用基于意图的模型路由以实现优化性能。例如,建立一个可以管理电子邮件、与物理世界互动并利用特定任务的专门模型的个人助手,同时确保隐私和效率。
任务包括购买必需品的杂货和在一天结束前发送剧本更新,强调团队合作和截止日期。
一项草图被转化为一份建筑渲染图,接着是对房间的虚拟游览。访问权限被共享用于协作,突出显示开源工具在创意项目中的进展。
对话突显了将预训练的语言模型整合到主动框架中对快速人工智能应用创建的转变影响。它强调了通过看不见的数据进行推理和高效解决问题的能力,展示了在短短几年内从难以想象到平凡的演变。
像Palantir、ServiceNow和Snowflake这样的领先企业平台正在通过人工智能集成进行转变,特别是与Nvidia技术的结合,实现了一种更类似人类的、多模式用户界面,简化了互动,并革新了应用开发和平台可用性。
对话探讨了物理人工智能的发展,强调通过模拟、数据生成和基础模型的创建,使AI能够有效地学习和与现实互动。
英伟达宇宙,这是一种开创性的基础模型,利用合成数据对物理人工智能进行训练,实现逼真的视频生成、连贯的运动模拟和预测分析。这种开放的边缘世界模型是从互联网规模的数据、真实驾驶、机器人和3D模拟中学习的,为开发人员提供与之交互的闭环环境,以探索边缘案例并推理复杂情景。
宇宙,一个开创性的基础模型,已经在研发世界首款推理自主驾驶车辆AI Alpha Mayo 中发挥了关键作用。通过使用人类示范和宇宙生成的数据进行训练,Alpha Mayo 不仅可以自然地驾驶车辆,还可以对自己的行为进行推理,通过将复杂的驾驶情景分解成可管理的部分来应对驾驶情景的长尾。这一进步极大地增强了自主驾驶车辆处理多样化驾驶情况的能力。
抵达后,会发出提醒系好安全带的警告,强调对即将到来的事情做好准备。
探索英伟达在自动驾驶汽车全套解决方案上的开创性工作,包括先进的人工智能模型、专用处理器以及与汽车巨头的战略合作伙伴关系。该举措旨在革新交通运输领域,确保未来移动解决方案的安全性和效率。
这段对话突出了自动驾驶汽车技术的开拓性方法,其中包括为冗余和安全而设计的双安全认证软件堆栈。第一个堆栈Alpha Mile是端到端训练的,而第二个古典的Av堆栈则作为备用措施。这种垂直一体化系统开放于生态系统合作,旨在确保自动驾驶的安全性和可靠性,展望未来所有汽车和卡车都实现自主驾驶。这项技术已经成为一个重要的商业领域,支持培训数据处理、合成数据生成和芯片开发,并为公司提供参与各个集成层次的机会。
该对话突出了即将到来的自动驾驶车辆和机器人系统的转变,强调了合成数据和模拟技术的使用。它展望了一个未来,其中以各种形式和大小存在的机器人将发挥重要作用,暗示着一个由人工智能驱动的机器人进步所主导的时代即将到来。
关于将人工智能和仿真技术(如Isaac Sim和Nvidia的工具)整合到机器人和半导体设计中的讨论。重点包括在机器人创建、使用Cadence和Synopsys进行芯片设计以及西门子整合这些技术方面的进展。未来设想中,智能设计师将在机器人和系统的创建中发挥作用,强调在实际生产之前进行计算设计和测试。
英伟达和西门子合作,将人工智能技术整合到实体产业中,应对全球劳动力短缺,推动通过实体人工智能和机器人技术实现自动化,标志着工业创新的重大转变。
英伟达和西门子正在开创一个新的工业时代,通过将物理人工智能整合到工业生命周期中,从设计到运营,为各行业迎来了一个变革时代。
OpenAI 目前在代币生成领域处于领先地位,但随着时间推移,开源模型的多样化研究和领域预计会在规模上超越。
一台开创性的超级计算机维拉·鲁宾已经被开发出来,以应对人工智能不断增长的计算需求,与人工智能进步竞赛的揭幕同时发生。
叙述了Vera Rubin AI超级计算机的创造过程,突出了它的核心组件,包括Vera CPU,Rubin GPU,Bluefield 4 DPU和Mv link switch。强调了系统的先进联合设计,实现了100 petaflops的AI性能,增强了数据连接性,并且可以扩展到数千个机架,标志着人工智能技术的重大进步。
一家公司设计了六款新芯片,强调极端协同设计,以跟上科技的快速发展和摩尔定律的放缓。Vera CPU拥有88个多线程核心,每瓦性能是全球最先进CPU的两倍,而连接到CPU的Ruben GPU具有令人难以置信的单线程性能和内存容量。这种方法涉及重新设计每个芯片,以处理更大模型和代币生成的不断增加需求,确保行业可以继续前进。
讨论GPU技术的进展,强调极端协同设计和MVFP4张量核心的引入,实现了通过有限的晶体管增加来提高性能的动态精度调整。
英伟达的Spectrum X以太网、Bluefield 4处理器和NVLink 6交换机正在通过提升网络效率、实现虚拟化和加速数据处理来改变数据中心运营。这些创新技术,包括可编程的RM DMA和数据路径加速器,显著提高了在大规模人工智能数据中心中的吞吐量和安全性,提供了无与伦比的性能和灵活性。
这段对话突出了一款具有创新意义的超级计算系统,它采用了每秒400Gb的交换机,使得GPU能够以最佳性能进行通信。对话讨论了该系统的组件,包括两英里长的铜电缆和一种使用热水的创新冷却机制,实现了在主要计算机制造商之间的能效和标准化。
英伟达推出了Spectrum X 以太网交换机,利用台积电的新Coupe工艺进行集成硅光学,实现了200Gb/s的512个端口。这一创新将激光器直接连接到芯片,提升了数据中心的效率。借助Spectrum XX的成功,Spectrum X旨在通过将低延迟性能与以太网的可管理性结合起来,重新定义网络,使英伟达在人工智能驱动的计算进步中成为网络行业的领导者。
AI对上下文内存存储需求的增长,NVIDIA的Blue Field Fort和Grace Blackwell提供了解决方案,通过将快速上下文内存集成到机架中,有效处理不断增加的数据需求,减少网络拥塞,并增强数据中心的能效。
一个保密计算系统已经开发出来,确保了数据在传输、休息和计算过程中的安全性,每台总线都被加密以确保无与伦比的安全性。该系统还引入了功率平滑技术,大大减少能量浪费,使整个功率预算得以有效利用。在性能方面,它在训练AI模型、工厂吞吐量和代币生成成本效益方面展示了显著的改进,推动了AI效率和技术领导力的边界。
讨论了英伟达在从芯片到应用创建整个人工智能堆栈中的作用,并强调他们致力于帮助他人构建有影响力的人工智能应用。
讨论了为任务选择合适的人工智能模型的重要性,强调并非每个问题都需要最大或最聪明的模型。突出了人工智能超级计算机平台的发展,并解决了实际问题,比如处理意外干扰,如松鼠,同时保持对有效人工智能部署的关注。
要点回答
Q:演讲中描述的AI系统有哪些能力?
A:AI系统是完全可定制的,允许用户教授特定于其公司和领域的技能。它还始终站在技术的前沿,将深入的领域专业知识与现代人工智能技术结合。
Q:用什么框架来构建应用程序,它如何集成到企业平台中?
A:用于构建应用程序的框架称为蓝图,它已集成到全球企业SaaS平台中,使用户能够轻松构建和利用人工智能系统。
Q:人工智能系统是如何设计来管理不同任务的?
A:AI系统使用基于意图的模型路由器来确定每个应用程序或问题的最佳模型,确保诸如电子邮件等任务保持私密并在本地处理,而其他工作可以调用更广泛的模型。
Q:这些物理人工智能进步的意义是什么?
A:物理人工智能的进步是重要的,因为它涉及将与屏幕和扬声器互动的智能应用到物理世界,理解常识、对象永恒性、因果关系和物理定律。它使人工智能能够更自然、更智能地与现实世界互动。
Q:在开发物理智能人工智能方面的挑战是什么,又是如何解决的?
A:在开发物理人工智能方面的挑战包括数据稀缺、需要模拟来评估人工智能的行动,以及现实世界的多样性和不可预测性。通过使用基于物理定律的合成数据生成、使用诸如Nvidia的宇宙模型这样的基础模型,并创建能够推理其行动及其后果的人工智能,这些挑战得到了解决。
Q:英伟达基金会模型Cosmos在物理人工智能中的作用是什么?
A:Nvidia基金会模型Cosmos在物理人工智能中的作用是作为世界的一个统一表示,能够对齐语言、图像、3D和行动。它接受了互联网规模的视频、真实驾驶和机器人数据以及3D模拟的训练,使其能够执行物理人工智能技能并为人工智能培训生成逼真的场景。
Q:自动驾驶汽车宣布的新功能是什么,它与以前的方法有什么不同?
A:自动驾驶汽车宣布的新功能是Alpha Mayo,这是世界上第一个具有思维、推理功能的自主车辆AI。与以往的方法不同的是,它通过从摄像头输入到执行输出的端到端训练,推理其行为并提供解释这些行为的方式,所有这些都直接与特定的训练数据相结合。
Q:Alpha Mayo如何有助于处理复杂的驾驶场景?
A:Alpha Mayo通过将复杂的驾驶场景分解为更小、更正常的情况,使汽车能够理解。它会推理每种情况,确定适当的行动,并解释其理由,这有助于管理难以用传统方法覆盖的驾驶场景的长尾部分。
Q:演讲中提到的人工智能技术五层是什么?
A:人工智能技术的五个层次包括地、电、壳作为最底层,其次是像GPU和像CPU这样的芯片。第三层是基础设施,特别提到了像Omniverse和Cosmos这样的物理AI环境。第四层是模型,第五层是应用,如奔驰车辆。
Q:演讲者对机器人行业和自动驾驶汽车的未来做出了什么预测?
A:演讲者预测未来将会出现自动驾驶汽车的激增,未来几年内可能有十亿辆汽车实现自动驾驶。演讲者相信这些车辆可能是机器人出租车,由个人拥有和驾驶,或者由车辆自己驾驶,但所有这些车辆都将具备自主运行的能力,并由人工智能驱动。这被预期将成为最大的机器人产业之一。
Q:在演讲中提到的第一辆英伟达自动驾驶汽车的重要性是什么?
A:第一辆Nvidia AV汽车的意义在于它是自动驾驶车辆发展的里程碑,计划在第一季度上路,然后在第二季度到欧洲,第三季度和第四季度到美国。它标志着人工智能融入日常车辆,是Nvidia不断努力推进自动驾驶技术的一部分。
Q:最近的NCAP评级对梅赛德斯奔驰CLA有什么影响?
A:梅赛德斯奔驰CLA最近获得的NCAP评分表明这款车是世界上最安全的汽车,这也意味着这辆车,以及通过推断的Nvidia技术,已经达到了高安全标准。这一评分非常重要,因为它证明了这款车型系统的可靠性和稳健性,它基于多样且冗余的传感器以及通过每一行代码认证的自动驾驶汽车堆栈。
Q:提到的第二个软件栈的功能是什么,为什么它很重要?
A:第二个软件堆栈被设计为完全可追踪,并在确保自动驾驶车辆安全方面发挥关键作用。它反映了主要软件堆栈,并旨在在不确定情况下提供一个安全网,系统在需要时可以切换到更简单、更安全的模式。这第二个堆栈很重要,因为它有助于减轻风险,并为自动驾驶车辆系统的整体安全做出贡献。
Q:整個Nvidia硬體架構在垂直整合方面如何描述?
A:整个Nvidia软件架构被描述为垂直整合,意味着Nvidia与其合作伙伴一起构建了这个软件架构,比如在CLA车型中与梅赛德斯-奔驰合作。Nvidia计划部署汽车、操作软件架构,并在必要时进行维护。然而,这个软件架构对生态系统开放,允许合作伙伴共同开发4级自动驾驶车辆和无人出租车。
Q:演讲者强调了人工智能和机器人技术的哪些进展?
A:演讲者强调了人工智能和机器人技术的几个进步,包括使用NVIDIA的Isaac模拟软件来训练机器人,不同公司开发各种类型的机器人,以及将人工智能整合到机器人系统中。演讲者强调这些发展是机器人系统下一个时代的一部分,并预计将彻底改变芯片设计和制造等行业。
Q:在物理人工智能和机器人技术生态系统中提到了哪些合作伙伴关系?
A:合作伙伴包括与Ola、奔驰、西门子和Cadence等公司合作。这些合作伙伴关系涉及将英伟达技术整合到各种应用中,如汽车和芯片设计工具,从设计到生产和运营,通过引入物理AI,从而彻底改变产业。
Q:Nvidia GPU的需求随时间如何变化?
A:Nvidia GPU的需求呈指数级增长,每年的型号增加一个数量级。这种需求是由于人工智能的日益增长的计算需求和强化学习的出现所引起的。
Q:Vera Rubin的生产状态对人工智能进步有何意义?
A:韦拉·鲁宾能够全面投产的意义在于,这使得我们能够及时推进AI的下一个领域。 AI技术的迅速发展需要不断提升计算能力,韦拉·鲁宾的及时生产对于保持在技术竞赛的前沿至关重要。
Q:在维拉·鲁宾的建筑中进行了哪些技术创新?
A:Vera Rubin的建筑创新包括一套由六个芯片构建而成的系统,这些芯片被设计成一个整体,拥有一个名为Vera的定制CPU,性能是上一代产品的两倍,还有一个Rubin GPU。Vera和Rubin共同设计,可以双向、协调地更快地共享数据,延迟更低。 计算托盘完全重新设计,没有电缆、软管或风扇,集成了Bluefield 4 DPU、Vera CPU 和 Rubin GPU。此外,MVL 72机架,配备了6个突破性芯片,18个计算托盘和其他组件,代表了人工智能迈向下一阶段的重大飞跃。
Q:Vera Rubin 的 MVF P 4 张量核心的重要性是什么?
A:维拉·鲁宾的MVF P 4张量核心很重要,因为它是芯片中的整个处理单元,可以动态调整其精度和结构,以处理变压器不同级别的需求。这使得在智能管理精度需求的同时实现更高的吞吐量成为可能,这对于达到否则凭借可用晶体管数量无法实现的性能水平至关重要。
Q:Vera Rubin 节点的组装过程如何简化了?
A:维拉·鲁宾节点的组装过程已经通过消除电缆来简化,从而降低了组装所需的复杂性和时间。这些节点仅由两根管子组成,组装时间为两小时,与之前设计形成鲜明对比。这项创新大大减少了错误发生的可能性,同时也降低了系统设置所需的时间。
Q:什么让Spectrum X网络技术在人工智能领域具有革命性的影响?
A:光谱X网络技术对人工智能而言是一项革命性的技术,因为它专门设计用来处理人工智能的高流量和低延迟要求。通过提供卓越性能,特别是在大型数据中心中,Spectrum X能够显著增加吞吐量,而无需额外昂贵的硬件。这使得它备受追捧,并成为高性能计算的行业标准。
Q:计算系统中nvlink脊椎的特点是什么?
A:Nvlink脊梁由两英里长的铜缆组成,铜缆是人类已知的最好的导体,被构建为全球计算系统中最广泛使用的铜缆。这些电缆进行屏蔽,允许以每秒400Gb的速度进行数据传输。
Q:什么让计算机行业发生了革命?为什么在组件标准化方面至关重要?
A:工业标准系统的发展彻底改变了计算机行业。对于组件的标准化至关重要,因为 Mx 系统由约 80,000 种不同的组件组成,频繁更改会导致大量浪费和低效。
Q:新的计算系统在性能、能效和水的使用方面如何与以前的系统相比?
A:新的计算系统在保持相同的空气流量和水温(45摄氏度)的同时,比如Grace Blackwell之类的先前系统在性能和功率上提高了一倍,更加节能。这使得新系统高效且环保。
Q:Vera Rubin是什么,它的重要特点和性能优势是什么?
A:维拉·鲁宾是一种高效的计算系统,拥有1.7倍的晶体管数量,5倍的峰值推理性能和3.5倍的峰值训练性能。它采用了集成硅光子技术,并具有能效优势,是能效是原先的两倍,可以节省全球数据中心电力的6%。
Q:使用TSMC的N5P工艺引入的新芯片有哪些好处?
A:采用台积电N5P工艺的新芯片直接集成硅光子技术到芯片上,实现了每秒200Gb的512个端口,并显著提升了性能和效率。
Q:新以太网人工智能交换机的目的是什么,它如何与其他数据中心组件集成?
A:新Ethernet AI交换机的目的是在数据中心内提供高速连接。通过具有硅光子技术直接连接的大型芯片,它与数据中心的其余部分集成,可以有效地利用激光连接到网络的其他部分。
Q:引入Spectrum X的动机是什么,它对公司的市场地位有何影响?
A:谱宽X是为了重新定义网络并利用以太网的简单性和可管理性而引入的,以太网在数据中心被广泛理解和使用。这一举动使该公司成为世界上最大的网络公司。
Q:人工智能如何改变存储管理的方式?
A:人工智能正在改变存储管理,摆脱传统的SQL,转而使用语义信息和临时内存称为Kv缓存。这在管理和存储与AI模型相关的数据量逐渐增加时带来挑战,从而需要更高效的内存解决方案。
Q:格蕾丝·布莱克韦尔(Grace Blackwell)致力于解决什么挑战,并与霍珀有何联系?
A:Grace Blackwell的目标是解决HBM内存在存储人工智能应用所需的快速增长的上下文存储方面的局限。为了扩展上下文存储,Grace Blackwell直接连接到Hopper,为与人工智能相关的数据处理提供了快速高效的解决方案。
Q:蓝田堡是什么,它如何帮助管理人工智能运营中的Kv缓存?
A:布鲁菲尔德堡是一种新的存储系统类别,旨在在机架中提供快速的Kv缓存上下文内存存储。该解决方案解决了人工智能操作中数据移动引起的网络拥塞问题,实现了临时人工智能记忆的更有效处理。
Q:Vera Rubin的重要绩效指标是什么?
A:维拉·鲁宾的关键绩效指标包括更快地训练AI模型,实现技术领导力和定价权的更快交付。它还拥有更高的工厂吞吐量,直接影响数据中心收入,以及成本效益的代币生成。
Q:Nvidia在其产品中对人工智能的方法是什么?
A:NVIDIA的人工智能方法跨越芯片、基础设施、模型和应用程序,旨在重新定义人工智能,为开发者构建令人难以置信的应用程序提供完整的技术栈。公司的任务是为推进人工智能创新提供全方位的工具和资源。

英伟达公司
关注





