黄仁勋宣布 Rubin 全面投产,4万名工程师参与构建!史上最强CPU同步亮相

小新 正三品 (侍郎) 2026-06-03 03:20 5 0 返回 科技前沿
小新 正三品 (侍郎) 楼主
2026-06-03 03:20
第1楼

AI摘要:换句话说:AI公司生产的不是传统意义上的软件产品,而是持续生成的Token。正因为现在可以盈利,AI公司想要建造更多的Token,生成更多的Token,建设更多的AI工厂,这就是为什么中国台湾的算力需求猛增的原因。这些云中的每一家都拥有令人难以置信的客户:Cursor(软件编码公司)、Black Mountain Labs(图像生成)、World Labs(世界基础模型)、Revolut(领先的金融服务AI公司)以及Shopify。


昨天,在中国台北英伟达 GTC 大会上,英伟达 CEO 黄仁勋再次将话题聚焦于AI产业的发展方向。

与两年前重点讨论生成式AI浪潮不同,这一次黄仁勋给出了一个新的判断:

“生成式AI已经到来,实用AI已经到来。”

实用AI时代已经到来

在他看来,过去几年AI行业最大的变化,不是模型参数规模继续增长,而是AI已经开始成为真正的生产工具,并直接影响经济活动。

为了说明这一变化,黄仁勋首先展示了一组来自代码托管平台 GitHub 的数据。他指出,软件开发是生成式AI最早落地的领域之一,也是全球最庞大的知识工作者群体之一。目前全球约有3000万至400万名专业软件工程师依靠编程工作,此外还有数亿学生和业余开发者参与其中。

在他的演讲中,GitHub代码提交量被作为衡量AI生产力变化的重要指标:

2023年,代码提交量约为3亿次;2024年增长至4亿次;2025年达到5亿次;而2026年前几个月的数据已经接近此前水平的数倍增长。

黄仁勋认为,这些数字反映出AI辅助编程工具正在显著提升软件开发效率。

“全世界的软件工程师创造着大约3万亿美元的薪酬价值。”他说,“而这些软件又进一步支撑着全球接近100万亿美元规模的经济活动。”

按照他的推算,如果AI能够将软件开发者的生产效率提升数倍,那么由此释放出的经济价值也将远远超出软件行业本身。

近年来,随着代码生成工具快速发展,“程序员是否会被AI取代”一直是行业争论的焦点。对此,黄仁勋在演讲中给出了明确回应。

他认为,AI的发展并不会减少软件工程师数量,反而会刺激企业招聘更多开发者。逻辑很简单:如果一名工程师在AI辅助下能够创造更高的产出,那么企业更倾向于扩大研发投入,而不是削减研发团队规模。

“有人说AI会减少就业,那完全是胡说八道。”黄仁勋表示。

在他看来,真正决定就业规模的不是单位劳动力成本,而是单位劳动力创造价值的能力。当软件工程师能够借助AI完成更多工作时,市场对软件和数字化能力的需求也会进一步扩大。

黄仁勋随后把话题转向AI基础设施。他指出,随着AI从实验室走向实际生产环境,行业关注点已经从模型能力转向Token产出能力。

过去,Token只是模型运行过程中的技术指标;而现在,Token已经成为能够直接创造收入的单位。换句话说:AI公司生产的不是传统意义上的软件产品,而是持续生成的Token。

谁能够以更低成本、更高效率生成更多Token,谁就拥有更强的商业竞争力。

“因为Token现在已成为盈利单位——Token现在是能够带来收入的盈利单位。正因为现在可以盈利,AI公司想要建造更多的Token,生成更多的Token,建设更多的AI工厂,这就是为什么中国台湾的算力需求猛增的原因。也正因如此,你们所有人都如此忙碌,你们的业务都做得这么好。事实上,看看你们的一些股价就知道了。”黄仁勋说。

这也是为什么全球范围内的数据中心建设持续升温,以及中国台湾地区AI算力需求快速增长的重要原因。

在他的描述中,AI工厂(AI Factory)正逐渐取代传统数据中心,成为新一轮计算基础设施建设的核心。

从应用程序时代进入智能体时代

不过,在黄仁勋看来,更大的变化并不只是模型性能提升,而是计算范式本身正在发生改变。

过去几十年里,计算机遵循的是:应用程序 → 代码 → 操作系统,用户通过点击界面、输入命令完成任务。

而在AI时代,新的架构正在形成:智能体(Agent) → 大语言模型 → 工具系统。

黄仁勋展示了一张典型Agent系统架构图。

在这一架构中,大语言模型负责理解问题、推理和规划;外围框架则负责管理上下文、调用工具、协调任务执行,并管理长期和短期记忆。为了完成任务,智能体可以调用:浏览器、数据库、表格工具、数据分析引擎、CAD设计软件以及各类企业系统。

整个过程更像是一个数字员工,而非传统软件。“过去我们启动应用程序、点击按钮、输入内容。”黄仁勋说,“未来我们只需要向AI解释自己的意图。”然后由AI自动编写代码、调用工具并完成任务。

智能体的兴起也引发了另一个争议:如果AI能够完成工作,软件公司是否会被淘汰?

黄仁勋的答案恰恰相反。

他认为,Agent时代将催生数量远超今天的软件系统。原因在于,数字智能体的数量不再受人口规模限制。未来每一个企业流程、每一个业务环节、甚至每一个个人任务,都可能拥有专属智能体。而这些智能体需要大量调用外部工具和服务才能完成工作。

因此,软件不会消失,而是需要以“AI可调用”的形式重新存在。

“这是软件行业最好的时代之一。”黄仁勋表示。

在这一背景下,NVIDIA长期积累的CUDA生态也将迎来新的机会。

过去,CUDA库主要面向开发者;如今这些能力可以直接被智能体调用,成为Agent执行任务时的工具集。从某种意义上说,黄仁勋试图传递的信息十分明确:生成式AI时代讨论的是模型会什么,而实用AI时代讨论的是模型能完成什么工作。

当AI开始创造收入、推动GDP增长,并能够通过智能体调用工具执行复杂任务时,它就不再只是一个聊天机器人,而正在成为新的计算平台。

“NVIDIA首先是一家软件公司”

在谈完Agent带来的计算范式变革后,黄仁勋再次强调了一个他近年来反复提及的观点:

NVIDIA本质上是一家软件公司。

随后,黄仁勋阐释了AI智能体的核心架构与运行逻辑。

他表示,智能体是终极的解耦与分布式计算模型,需要调动海量不同算力单元协同运行。完整的AI智能体由模型、框架、工具、技能及运行时五大核心部分构成,各组件分散运行在数据中心不同节点。他将其形象类比为工作个体:模型是智能体的“大脑”,负责思考决策;框架是“身体”,承载整体运行;运行时则如同专属工作室,支撑各类工具落地运作,整套体系以超大规模模式完成算力调度与任务执行。

据其介绍,智能体的每一项工作流程,均拆分至计算机不同模块分步完成。其中,大型语言模型承担思考、上下文处理、环境感知、逻辑推理、方案规划与行动执行等核心智能任务,该过程会批量激活Grace Blackwell NVLink 72算力集群。而在智能体调用工具的环节,则由CPU承接运算工作,可适配C编译器、Python、JavaScript及各类加速计算工具。

黄仁勋认为,当前AI智能体的工具应用能力仍处于初级阶段,未来将实现专业化、熟练化升级。为此,英伟达CUDA X库迎来重要升级,全系库产品将配套专属AI技能手册,可供AI智能体自主学习、掌握工具使用方法,大幅提升智能体解决各类核心行业难题的能力,未来智能体调用CUDA X工具的算力价值与应用潜力将得到极大释放。

在整套智能体算力体系中,各类硬件与功能模块分工明确。工具运算任务依托CPU、GPU、大模型协同完成;安全防护框架部署在CPU与英伟达BlueField DPU安全处理器之上,全方位保障运行安全;整体任务的调度编排工作则统一由CPU主导落地,形成层级清晰、分工明确的异构计算体系。

演讲中,黄仁勋重点提及AI计算的核心痛点——内存系统。他表示,智能体的工作记忆依托KV缓存实现,涵盖记忆留存、数据压缩、信息检索、结构化与非结构化数据匹配,以及各类数据的逻辑关系梳理、本体关联分析等复杂操作,整体处理流程难度极高、复杂度空前。他预判,AI专属内存系统的迭代升级,将推动全球存储体系迎来颠覆性革命。

对比传统软件运行模式,黄仁勋强调,AI智能体代表的全新计算范式具备本质差异。过往软件多为单一二进制文件适配单一操作系统的集中式运行模式,而智能体采用解耦、分布式、异构的全新计算逻辑,这也是英伟达倾力研发下一代Vera Rubin平台的核心动因。

针对全新的Vera Rubin平台,黄仁勋着重澄清,其绝非单一芯片或普通GPU产品,而是一套端到端的完整革命性系统。该平台以GPU为核心起点,整合GPU、Vera、NVLink 72核心硬件,依托多颗CPU完成全局任务编排,搭配迭代升级的革命性存储系统,构建全链路算力底座。同时,平台集成CX-9硬件、DOCA软件栈及内置安全处理器,可实现数据静态、传输、使用全流程加密,依托机密计算架构全方位保护高价值AI模型数据安全。

黄仁勋直言,Vera Rubin是英伟达发展史上野心最大的研发项目,公司全体四万名工程师全员参与项目攻坚,同时汇聚行业合作伙伴力量共同落地,是一套经过全方位打磨、从零重构的极致复杂系统。他坦言,英伟达早已完成从单一GPU厂商向全栈系统厂商的战略转型,当前推出的Vera Rubin系统,是行业迄今为止设计最复杂、体系最完整的AI算力系统。

谈及产业终极需求与企业转型方向,黄仁勋表示,客户与合作伙伴的核心诉求并非单纯获取计算机硬件,而是搭建成熟高效的AI工厂。基于这一行业趋势,英伟达正在开启新一轮战略转型。目前英伟达核心技术已全面落地基础设施级应用场景,同时联动发电厂、冷却系统、电网供应商等各类工业生态伙伴,构建完整AI产业生态。

未来英伟达将持续打造全栈式算力系统,为全球客户搭建规模化、高性能的AI基础设施提供核心支撑。

值得注意的是,在此次演讲中,黄仁勋详细地阐释了英伟达全新的产业定位,正式提出“AI工厂生态新范式”,明确英伟达的发展重心已从传统计算生态,全面升级为服务千亿级AI基建的工厂化生态体系。

黄仁勋区分了英伟达新旧两大生态形态。过往英伟达以计算生态为核心,将自身计算层、软件及计算栈深度集成至各类企业平台与第三方库中,广泛赋能各行各业的数字化算力需求。

而当下全新打造的AI工厂生态,形成了清晰的上下游产业闭环:行业合作伙伴是英伟达的上游基础支撑,英伟达则依托自身全栈技术能力,向下游输出完整AI工厂生态体系,核心目标不再是单纯输出GPU芯片或算力系统,而是助力客户搭建超复杂、超大规模的AI工厂基础设施。

他直言,AI工厂已进入超高投入、超高门槛的规模化落地阶段。当前单座1吉瓦(GW)级别的AI工厂,建设成本持续攀升,从最初的200亿至400亿美元,现已上涨至500亿至600亿美元,未来很快将突破800亿甚至1000亿美元。千亿级别的单项目投入,意味着AI工厂对落地稳定性、运行可靠性有着极致要求,必须实现一次建成、即刻正常投产,其资本投入成本与系统构建复杂度均达到行业前所未有的水平。

针对超高复杂度的AI工厂建设难题,英伟达依托Omniverse数字仿真能力实现全流程革新。不同于传统计算机研发模式——先设计芯片、再在设备内模拟系统运行,如今英伟达所有AI工厂基础设施,均可在Omniverse数字平台中提前完成搭建、仿真、测试与优化。通过数字模拟器与数字架构赋能,行业可在破土动工、投入巨额资金前,完成超大规模AI系统的全流程推演,彻底规避落地风险,实现行业多年以来的技术落地愿景。

黄仁勋重点介绍了支撑AI工厂生态落地的核心体系DSX,形成与英伟达现有产品矩阵对应的完整基础设施布局。其中,RTX系列对应GPU硬件、DGX对应一体化算力系统,而全新的DSX平台则精准对标AI基础设施全场景。依托覆盖系统、软件、全技术栈的核心能力,英伟达能够赋能中小型企业快速搭建世界级AI云服务能力。

他以行业案例佐证DSX生态的赋能价值,不少曾经的中小型科技企业,在接入英伟达AI工厂生态、依托DSX体系升级后,实现跨越式增长,典型代表CoreWeave估值已攀升至500亿至700亿美元区间,且依旧保持高速增长态势,充分印证英伟达AI工厂新范式的产业赋能潜力。

最近英伟达与Nebius合作,它们的增长也同样惊人。这些云中的每一家都拥有令人难以置信的客户:Cursor(软件编码公司)、Black Mountain Labs(图像生成)、World Labs(世界基础模型)、Revolut(领先的金融服务AI公司)以及Shopify。

这里还有另一个例子:Nscale,他们的客户是英国电信(British Telecom)和谷歌(Google)。谷歌正在使用其中一个人工智能云——Thinking Machines,这是一家前沿实验室公司。

这里是韩国的Naver Cloud,客户包括韩国银行(Bank of Korea)、Hyundai等众多优秀公司。

在中国台湾,还有GMI。

然而,以上所有的公司,它们都需要计算栈。黄仁勋表示,下面的这整个技术栈,正是让NVIDIA闻名的原因。

他介绍道:“所有的硬件、软件和库,以及我们连接全球第三方开发者生态系统的能力,使得任何人都能建立起一个AI云。然而,现在的AI云极其复杂。这个是软件版本,这个是计算机科学版本。而资金版本、资产版本就是我之前展示的——它是一个巨大的工厂。仅拥有这种能力是不够的,这正是NVIDIA成为一家AI基础设施公司的原因。”

Vera Rubin 架构全面投产

在谈及下一代AI基础设施建设时,英伟达CEO黄仁勋宣布,基于新一代GPU平台的Vera Rubin架构已经进入全面量产阶段。

黄仁勋表示,当前全球对AI算力的需求正以前所未有的速度增长。从数据中心运营商到云服务提供商,再到各类企业客户,整个产业链都在全力提升产能,以满足市场需求。

“实用AI已经到来,可盈利的AI已经到来。”黄仁勋说。他认为,越来越多企业已经认识到,人工智能不再只是技术展示,而是能够创造实际商业价值的生产工具。在这一背景下,算力正成为限制AI发展的关键瓶颈。

为了满足全球激增的需求,英伟达正在推动新一代AI基础设施的大规模部署,并协同合作伙伴在世界各地建设AI工厂。黄仁勋表示,这也是当前整个产业生态最重要的任务之一。

在供应链建设方面,黄仁勋透露,Vera Rubin平台所对应的供应链规模已经达到上一代Grace Blackwell平台的两倍。与此同时,生产效率也获得显著提升。过去组装一套 Grace Blackwell机架需要约两个小时,而如今这一过程已经缩短至五分钟。

“这不仅意味着更高的产能,也意味着更快的交付速度。”黄仁勋表示,面对持续增长的市场需求,供应链各环节都在不断扩大生产规模、提高制造效率。

他介绍,为支持Grace Blackwell平台量产,产业链此前已经投入数百万平方英尺的生产设施。而目前,这些合作伙伴正在进一步扩充产能,为Vera Rubin的大规模部署做好准备。

演讲最后,黄仁勋特别向供应链合作伙伴表达感谢。他表示,Vera Rubin能够顺利进入全面量产阶段,离不开整个产业生态系统的共同努力。

“我要感谢你们所有人。”黄仁勋说,“Vera Rubin现已全面投产。”

在介绍Vera Rubin架构时,黄仁勋将其定义为一套面向智能体(Agent)时代打造的计算系统,而不仅仅是一台运行AI模型的超级计算机。

他表示,随着AI从模型训练、推理逐步迈向智能体阶段,计算需求正在发生根本变化。智能体需要频繁调用工具、访问数据库、与外部系统实时交互,因此对延迟、带宽和系统协同能力提出了更高要求。为此,Vera Rubin采用了全新的系统设计,将CPU、GPU、网络、存储和安全模块深度整合,形成面向智能体工作负载的完整基础设施平台。

黄仁勋特别展示了Vera Rubin NVLink 72系统。他介绍,相比上一代产品主要面向预训练和推理场景,Vera Rubin进一步针对智能体推理进行了优化。通过NVLink 72互连架构以及全新的系统设计,设备内部不再需要大量线缆和复杂连接结构,不仅提升了可靠性,也显著降低了部署和维护成本。

Vera CPU重磅登场

除了GPU系统外,英伟达还同步推出了专为AI时代设计的Vera CPU。黄仁勋认为,传统CPU主要服务于人类用户,而未来将出现数十亿个智能体,它们对响应速度几乎没有容忍空间。因此,新的CPU架构必须在单线程性能、带宽、数据传输效率以及能效方面进行全面优化。

按照英伟达的规划,Vera CPU将承担智能体编排、模型调度、工具调用、数据库访问以及存储管理等任务,与GPU共同构成未来AI工厂的核心基础设施。黄仁勋表示,随着智能体成为下一阶段AI发展的重要方向,计算系统也正在从“为模型设计”转向“为智能体设计”。

在谈到新一代Vera CPU时,黄仁勋表示,英伟达已经顺利完成了从传统x86 CPU架构向Grace架构的过渡,这为Vera的推广奠定了基础。

他指出,目前全球主要数据中心、云服务商以及与英伟达合作的AI企业,都已经完成了对Grace平台的认证,相关软件栈、安全体系和开发环境也已完成适配。在此基础上,Vera的部署门槛将大幅降低。

黄仁勋认为,Vera有望成为针对智能体(Agent)工作负载优化程度最高的CPU之一。原因在于,它从设计之初便与Vera Rubin系统协同开发,面向智能体推理、工具调用、数据库访问和实时交互等新型AI任务进行了针对性优化。

为了展示性能提升,黄仁勋公布了多个实际工作负载测试结果。其中,在企业广泛使用的SQL数据库处理场景中,Vera CPU的性能达到现有平台的约3倍。

在实时流处理场景下,例如金融交易系统、工业遥测监控等需要持续处理海量数据流的应用中,性能提升最高可达6倍。

黄仁勋表示,CPU领域通常以个位数百分比的性能提升作为重要突破,而在真实业务负载中实现数倍级增长并不常见。这些提升主要来自更高的单线程性能、更大的内存和I/O带宽,以及更快的核心间数据传输能力。

在他看来,智能体正在成为继云计算、移动互联网之后的新一代计算负载,而现有CPU大多是围绕人类用户设计的。未来,随着智能体数量持续增长,对低延迟和高响应速度的需求也将进一步提升。

“过去我们为人类构建CPU,现在我们开始为智能体构建CPU。”黄仁勋表示。围绕Vera展开的新生态正在形成,包括ODM厂商、服务器制造商和企业客户在内的产业链伙伴已经开始布局这一市场。英伟达希望借此推动一个全新的计算平台时代——面向智能体的CPU市场。

开源 Nemotron 3 Ultra,全球首个SSM与MoE相结合的混合架构

在介绍企业级智能体生态时,黄仁勋宣布,英伟达正式推出新一代开源大模型Nemotron 3 Ultra,并将其定位为企业构建专属智能体的重要基础模型。

黄仁勋表示,未来企业将雇用大量智能体协助完成研发、验证、仿真和运营等工作。以EDA软件厂商 Cadence Design Systems 为例,其正在利用英伟达技术打造面向芯片设计流程的专属超级智能体,通过调用仿真器、验证器和形式验证工具,加速芯片开发周期。

作为这一生态的底座,Nemotron 3 Ultra采用了全球首个SSM(状态空间模型)与MoE(混合专家)相结合的混合架构。黄仁勋透露,相比现有主流开源模型,Nemotron 3 Ultra推理速度提升5倍,同时总体运行成本降低30%。

除了模型本身,英伟达还同步开放训练数据、训练脚本以及相关工具链。黄仁勋表示,Nemotron系列基于大规模长程推理、复杂任务求解和工具调用数据集训练而成,开发者不仅可以使用模型,还能够在此基础上继续训练、微调并构建专属智能体系统。

目前,英伟达已经与 CrowdStrike、Salesforce、Palantir Technologies、SAP、ServiceNow 等企业展开合作,推动智能体在企业软件、网络安全、数据分析和业务流程管理等场景中的落地应用。

黄仁勋同时透露,Nemotron 3 Ultra已经发布,而下一代Nemotron 4模型也正在研发之中。

与微软联手重新定义PC

在演讲的后半程,黄仁勋宣布,英伟达正与 Microsoft 联手重新定义个人电脑(PC)。

黄仁勋回顾了过去40年的PC发展历程。他表示,从Windows 3.1到Windows 95,微软建立起了现代PC产业的基础架构,通过开放硬件生态、驱动程序体系以及统一的软件接口,让PC从企业设备走向大众消费市场,并成为全球最普及的计算平台之一。

如今,随着AI时代到来,英伟达和微软希望推动新一轮PC架构变革。黄仁勋透露,双方已经为此合作了三年,对PC的底层工作方式进行了重新设计,以适应智能体(Agent)时代的计算需求。

按照他的设想,未来的PC不再只是运行应用程序的终端设备,而将内置能够理解用户、与用户对话并自主完成任务的AI智能体。例如,智能体可以帮助用户整理文件、检索资料、完成研究工作,甚至根据用户需求主动执行复杂任务。

黄仁勋认为,这种变化将带来PC软件架构的重构。过去由应用程序承担的大量功能,未来将逐步由智能体完成。与此同时,大语言模型将成为新一代PC的重要基础组件,承担语言理解、视觉识别、音视频生成以及任务执行等能力,成为连接用户与计算资源的核心入口。

他透露,自己将与 Satya Nadella 共同介绍双方过去三年的合作成果,并进一步展示面向智能体时代的新一代PC平台。

暂无回复,快来抢沙发吧!

  • 1 / 1 页
敬请注意:文中内容观点和各种评论不代表本网立场!若有违规侵权,请联系我们