运达平台算力即收入:黄仁勋2026台北GTC演讲,完整版来了
![]()
运达平台6月1日,在2026年的英伟达GTC台北大会上,黄仁勋用一句话定调了AI行业的新范式:AI已经从单纯回答问题的大语言模型阶段,正式跨入能够自主观察、推理、规划并调用工具的Agentic AI时代。
在黄仁勋看来,智能体正在彻底改变传统的计算模式。过去我们习惯于运行传统操作系统中的软件,而现在的应用形态已经变成了由大模型、控制外壳、工具和运行时共同构成的分布式系统。
这种全新计算模式的出现,意味着从底层的云端数据中心,到用户每天面对的PC电脑,再到企业级软件和物理世界的机器人,整个科技行业的软硬件架构都需要迎来一场深度重构。
这场发布会中,英伟达的所有新品,都在为一个目标服务:让海量的智能体在云端、个人电脑、企业服务器以及机器人体内,以更低的延迟、更低的成本高效运行。
因为在智能体时代,算力即收入(Compute is Revenue)。
(我们整理了本次发布会四大核心产品矩阵的关键信息,以下是重点内容)
1. RTX Spark平台与N1X芯片:重构PC,开启端侧智能体时代
在端侧,英伟达与微软联手打造RTX Spark平台,重构PC形态。
RTX Spark是兼容Windows与CUDA的全新产品线,涵盖笔记本、台式机以及工作站。对于普通用户,它将成为一台24小时在线、免调用费的私人智能中枢,随时接管人们的数字生活。
驱动这一平台的是英伟达与联发科合作打造的N1X芯片。它采用台积电3nm工艺,单芯片封装了具备6144个CUDA核心的Blackwell RTX GPU(AI算力达1 Petaflop),集成了20核定制版Grace CPU,并配备了高达128GB的统一内存。
RTX Spark与N1X芯片打通了高负载端侧AI的最后一公里。无论是高帧率完美支撑快节奏的FPS与重度开放世界生存游戏,还是在游戏后台以毫秒级响应本地Agent的推理请求(如实时自动代码检查、自动三维建模渲染等),它都能轻松胜任。
未来的PC不再是点击运行软件的机器,而是私人专属的数字机器人,在保护用户隐私的前提下,深度整合跨应用的数据和工作流程。
2. Vera CPU:为智能体打造的超算工厂大脑
传统的CPU是为人类的指令习惯设计的,而Vera CPU则是首款专为缺乏耐心、要求极低延迟的智能体打造的处理核心。
Vera CPU配备了88个Olympus核心,单核具备惊人的10条指令提取性能。搭配LPDDR5X内存(1.2 TB/s带宽),且芯片内部实现了3.6 TB/s的无损互联网络,彻底解决了AI数据中心里GPU高频闲置等待CPU处理逻辑的严重瓶颈。
包含Vera CPU的Vera Rubin多机架级(pod-scale)智能体超算平台目前已全面进入量产阶段。
极低延迟换来的极高吞吐量,直接拉高了单瓦特能够生成的Token数量。在真实业务中,Vera CPU的智能体沙盒性能是传统x86的1.8倍,SQL数据库查询速度提升3倍。这不仅是技术的胜利,更是为云厂商和AI企业构建的最低Token生产成本的护城河。正如黄仁勋所强调的,在未来,数据中心将成为生产Token的AI工厂。
3. Neotron 3 Ultra模型与NVIDIA Agent Toolkit工具包:企业级AI的操作系统
为了让企业能够安全、高效地部署智能体,英伟达发布了全新开源基础模型Neotron 3 Ultra。
Neotron 3 Ultra在业内率先采用了SSM(状态空间模型)与MoE(混合专家模型)的复合架构。在性能上,运行速度相比传统大模型直接飙升5倍,推理成本大幅压缩30%。
同时,英伟达还推出了企业级AI工具包NVIDIA Agent Toolkit。这套工具包是英伟达向企业端抛出的商业变现杀手锏。高度依赖内容分发、精准广告产运以及复杂业务流自动化的企业,现在可以在保护核心商业数据的前提下,低成本私有化部署完全懂内部业务的超级智能体矩阵。AI将真正下沉到每天的商业流水线中干活。
4. Cosmos 3模型与Isaac Groot机器人:物理AI的新突破
Cosmos 3世界模型是一款混合Transformer架构模型,能够将计算机合成的视频、动作和语言转化为机器人能直接学习的第一人称物理规律。
Isaac Groot参考设计由Jetson Thor平台驱动,拥有31个躯干自由度和双侧各25个自由度的高精度Sharpa机械手,为研究人员提供了一个开箱即用的强大平台。
通过Cosmos 3和虚拟孪生平台的大规模合成数据喂养实体躯干,人形机器人走出实验室,进入大规模应用的理论与工程基石正式成型。这将改变工业制造、物流甚至家庭服务等领域的未来图景。
从底层的Vera CPU,到端侧的N1X芯片,再到企业级的Agent Toolkit和物理世界的Cosmos 3,英伟达的2026年全线产品发布,清晰地勾勒出了一幅以Agentic AI为核心的未来蓝图。在这场算力与智能的革命中,那些能够最高效地生成和利用Token的企业,将掌握通向未来的钥匙。
![]()
以下是黄仁勋2026台北GTC演讲实录:
1. 实用AI时代开启,智能体AI重塑生产力
欢迎来到GTC Taiwan。很高兴见到大家,回家真好。我这次把父母也接回了家,请大家为我的父母,以及我们赛前表演的台湾超级巨星们鼓掌。今天现场座无虚席,我们同时正向全台湾其他70个观影派对同步直播这场主题演讲。
今天有许多内容要与大家分享,也有许多合作伙伴需要感谢。我们在台湾的生态系统规模已经发展得极其庞大,令人难以置信。人们通常认为生态系统就是我们的软件栈,或是构建在NVIDIA计算系统之上的开发者生态系统。但NVIDIA的生态系统其实向上延伸到了我们在台湾的所有供应链,那是万物起始之地,向下则一直延伸到数据中心并最终触达终端用户。
今天我们将讨论这整个生态系统。台湾拥有世界上最丰富、最顶尖的供应链生态系统。这里有非常多优秀的公司和我最喜欢的生态合作伙伴,有太多人需要感谢。非常感谢大家的光临。
今年我们的业务正在以惊人的速度共同增长,据说台湾的年度GDP也将增长近10%,这简直不可思议。两年前我在这里谈到AI将从生成式AI演进到其他形态。如今下一波浪潮智能体AI(Agentic AI)已经到来,这也标志着实用AI时代的正式开启。
这意味着什么?以GitHub为例,软件编程是智能体AI首批落地的应用领域之一。这是一个极具价值的职业,全球有三四千万名专业软件开发人员以此谋生。在GitHub上,开发者下载软件并进行修改,然后将代码推送回去(commit)。2023年的commit数量是3亿次,2024年是4亿次,2025年是5亿次。而在2026年的前几个月里,这个数字几乎增长了三倍。
这三千万软件开发人员每年约有3万亿美元的薪资支出,支撑起了全球100万亿美元规模的产业。如今这3万亿美元的薪资创造了近三倍的产出,相当于实现了9万亿美元的生产力,这种差距是惊人的,这正是AI的潜力与承诺。
有人说AI会减少工作岗位,这完全是一派胡言。实际上软件工程师的数量正在增加。原因很简单,如果聘请一名软件工程师能产生价值9万亿美元的生产力,企业当然会想要雇佣更多人。这种惊人的产出很快就会在经济中体现出来。从行业角度来看,实用AI的到来意味着当前对Token的需求量极大。因为Token现在已经成为了盈利和收入的单位,AI公司渴望生成更多的Token并建设更多的AI工厂。这正是台湾算力需求飙升的原因,也是各位业务繁荣、股价上涨的动力。
计算模式已经彻底改变。实用的AI已经到来,它现在是利润与GDP的生成器。其背后是一种全新的计算模式,不再仅仅是大语言模型,更是智能体(Agent)。
传统意义上我们在操作系统中运行应用程序和代码。而今天的新模式是运行在容器框架(Harness)中的智能体,它由一个或多个大语言模型组成。这个框架机制负责引导和编排AI开展高效的工作。
当接收到输入时,智能体必须进行理解、观察、推理和行动,并调用诸如电子表格、Web浏览器或数据处理引擎等工具。整个过程是受软件编排的,框架负责路由信息,处理上下文,理解现状,进行推理并制定执行计划。本质上这就是智能体的工作原理。它像人类一样处理短期工作记忆和长期记忆,因此内存管理系统变得极其重要。在这个新模型中,大语言模型负责思考,而外壳程序则像操作系统一样将一切连接起来。
这是一个重大的突破,大语言模型现在已经能够非常出色地进行思考、推理、规划和使用工具。结合内存管理框架和工具编排,我们现在可以成就非凡。例如给出一句提示词,AI就能生成完整的代码。我们现在使用的是Claude Code,但Codex的表现也同样出色。再比如输入“创建一个GIF在黑色散点图上显示NVIDIA绿色的点从台北101大楼变形为GTC Taipei 2026再变形为NVIDIA眼睛图标然后散射重复”,AI就能直接生成动态图。甚至当你弄丢遥控器电池盖时,只需提供图片并让AI创建一个准备好进行3D打印的CAD文件,它就能调用工具完成制作。这就是全新的计算模式。
过去我们需要启动应用程序进行点击和输入,现在只需向AI解释我们的意图和需求,AI就会自动生成代码或使用工具产生必要的输出。这是未来计算机的工作方式,即智能体AI。我们为此努力了两年,如今它终于化为现实。
现在的重大突破之一在于工具的使用。有人认为AI时代和智能体AI的到来会让所有软件公司倒闭,但事实恰恰相反。未来世界将充满智能体,不再受限于人口数量,这些智能体将比以往任何时候都更频繁地使用工具。对软件公司而言这其实是一个绝佳的时代,前提是软件必须以智能体能够调用的方式呈现。
作为NVIDIA的瑰宝,CUDA-X库正经历着属于它的美好时代。今天我们能够将这些库提供给智能体,它们的使用效率甚至超越了人类。20年前我们构建了用于加速计算的单一架构CUDA,重新发明了计算。如今上千个CUDA-X库已经成为智能体的工具,助力科学和工程领域的突破。比如用于计算光刻的cuLitho、用于决策优化的cuOpt、用于直接稀疏求解器的cuDSS、用于跨结构化和非结构化文档深度研究的AIQ、用于AI RAN的Aerial、用于可微物理的Warp,以及用于基因组学的Parabricks。这些精妙算法的基石是美丽的数学。
![]()
2. 全新计算模式:大语言模型与工具的协同编排
软件的计算模式即将改变,智能体代表着终极的解耦式分布式计算模型。为了运行智能体,数据中心内各个位置的众多计算机将被激活。智能体由模型、框架、工具、技能和运行时组成。你可以把模型想象成大脑,把框架和运行时的工具想象成身体和工作车间。这是一个在车间里熟练使用工具的工人,这一切都在极大规模下进行,分布在计算机的不同部分。大语言模型负责思考、处理上下文、观察环境、推理并制定执行计划。每当模型进行思考时,整架Grace Blackwell NVLink-72就会被激活。而每当它使用诸如C编译器、Python、JavaScript或加速计算等工具时,就会消耗CPU资源。
今天的智能体还是简单的工具使用者,但明天它们将变得非常成熟。这正是CUDA-X库备受智能体青睐的原因。我们的所有CUDA-X库现在都具备了AI可以学习并使用的技能手册。AI阅读后便能领会使用方法,其操作这些库的能力将令人惊叹。这些工具运行在CPU、GPU和大语言模型之上,而安全框架则运行在CPU和NVIDIA BlueField DPU等安全处理器上。整个工作流程的编排都由CPU完成。
其中最困难的环节之一是内存管理。工作记忆可以被简单理解为KV缓存(KV Caching)。系统不仅需要进行数据压缩,还要解决复杂的检索问题,即如何检索结构化和非结构化数据,以及如何梳理不同数据间的本体关系。这个处理过程极其复杂,AI的内存系统必将引发存储系统的彻底变革。
这种全新的智能体应用和计算模式与传统的应用程序运行方式截然不同。过去软件通常封装在单一二进制文件中并运行于操作系统内。而现在面对这种解耦的、分布式的异构计算需求,我们构建了下一代产品Vera Rubin。
Vera Rubin不仅是一颗芯片或一个GPU,它是一个令人惊叹的端到端系统。它配备了GPU和Vera Rubin NVLink-72,由Vera CPU进行编排,并拥有革命性的存储系统。结合CX9和DOCA软件栈,系统内置的安全处理器确保所有静态、传输中及使用中的数据都经过加密。由于AI模型极其珍贵,整个系统严格遵循机密计算(Confidential Computing)的标准。
Vera Rubin是我们公司历史上最宏大的事业,全公司众多部门的工程师都为此倾注了心血,在座的许多合作伙伴也参与了整个系统的创建。Vera Rubin是一个超越芯片概念的奇迹。NVIDIA早已从一家GPU公司演变成一家系统公司,设计出了史上最复杂、最彻底的系统。
但归根结底,我们的客户不仅想购买计算机,他们更想要建造AI工厂,这也是NVIDIA再次自我转型的核心原因。如今我们的技术和合作伙伴都已扩展到了基础设施层面。发电机、冷却系统和电网供应商等众多工业公司成为了我们生态系统的一部分。我们正在构建一个全栈系统,助力客户打造卓越的AI基础设施。
当前全球正竞相建设AI工厂,这是人类历史上规模最大的基础设施建设。AI工厂的每一层包括芯片、机架、网络、电力、冷却和电网,都必须进行端到端的协同设计,因为在这里算力就等于营收。
NVIDIA DSX正是用于高效、盈利地构建和运营AI工厂的蓝图与参考设计。一切从DSX SIM开始。借助DSX SIM Omniverse蓝图,合作伙伴在首个机架落地前,就能在数字孪生中规划布局、模拟电力与冷却系统、设计网络并验证所有变更,从而完成Vera Rubin AI工厂的设计与验证。
工厂启动后,DSX OS将接管并负责配置、运行、监控和修复基础设施,将硬件转化为可信、弹性且AI就绪的多租户算力资源。当前的AI工厂在电力配置上往往过度预留高达40%,而DSX Max LPS让运营商能够在同等电力预算内安全部署更多GPU,每年可增加数十亿美元的收入。突破性的45摄氏度高温液冷技术降低了水电消耗,将更多电力用于产生收入的计算。动态功率分配技术在机架间调度电力,回收闲置功率并输送至高负载区域,同时平滑技术能有效抑制峰值电流尖峰和功率浪涌。
在整个工厂中,AI智能体团队与DSX Max LPS协同工作,实时平衡冷却与功耗。此外,DSX AI工厂是能够与电网协同运行的灵活能源资产,DSX Flex可以读取实时电网信号,在电网承压时动态调整工厂功率。未来十年内,将有数百吉瓦(GW)规模的AI工厂投入运行,NVIDIA DSX AI工厂将以最高效率生成成本极低的Token,同时增强电网的稳定性。
过去的计算生态系统中,NVIDIA的软硬件计算层被集成到第三方平台中服务终端市场。但如今我们面对的是一个AI工厂生态系统。NVIDIA的业务向下游延伸到了整个基础设施生态,不仅制造GPU和系统,更致力于帮助客户建设极其复杂的AI基础设施。
一座一吉瓦(GW)规模的AI工厂,造价曾是两三百亿美元,现在已达五六百亿美元,很快就会攀升至一千亿美元。上千亿美元投入的工厂必须在初次运行就取得成功并立即见效。
面对如此高昂的资本成本和极端的复杂性,我们利用Omniverse完成了这一切。过去我们是在计算机里设计芯片和模拟系统,而现在在破土动工投入真金白银之前,我们就能在Omniverse的数字世界里构建任意规模的庞大系统。
这就是我们被称为DSX的生态系统,RTX代表GPU,DGX代表系统,而DSX则代表基础设施。凭借涵盖软硬件的全栈技术能力,我们帮助许多曾经的小公司成长为了世界级的AI云。
例如CoreWeave现在的估值已高达数百亿美元且增长迅猛,Nebius也同样保持着惊人的增速。这些云服务商拥有许多杰出的客户,如编程工具Cursor、图像生成公司Black Mountain Labs、World Labs、Revolut以及Shopify。其他区域如英国的Nscale正在服务英国电信和Google,韩国的Naver Cloud在服务韩国银行和现代汽车,印度的Yotta、新加坡的AI Singapore、印尼的Indosat,以及台湾的GMI都在为区域乃至全球客户提供卓越的AI服务。
AI将无处不在,每个地区、每家公司都将由其驱动。建立AI云不仅需要NVIDIA底层的硬件、软件、库以及全球开发者生态,更需要应对AI工厂基础设施在资金和资产层面的庞大复杂性。正因如此,NVIDIA成功转型为AI基础设施公司。