黄仁勋说 CPU 要给 Agent 用，AI 行业真正的转折可能在这里

我看到 GTC Taipei 这场发布会里最有意思的一句话，不是某个参数涨了多少，也不是某个机柜又多厉害。
是黄仁勋讲 Vera CPU 的时候，说过去 CPU 是给人用的，未来会有 billions of agents，Agent 会非常没耐心地使用 CPU。
这句话听起来像舞台金句，但你仔细想想，有点吓人。
以前我们讨论 AI，大部分时候默认使用者是人。一个人打开 ChatGPT，问一句，等几秒，复制结果，走人。哪怕是企业里的 AI 助手，本质上还是人在发起动作。人是节奏的主人，AI 是被叫来的帮手。
但 Agent 不是这样。
Agent 一旦真的进入工作流，它不是问一句答一句。它会拆任务，会查资料，会调用工具，会跑代码，会反复检查结果，会在一个流程里等待、重试、修正、提交。它的动作不是一次请求，而是一串请求。它不是偶尔用一下算力，而是持续吃算力。
这才是 GTC Taipei 这场会最值得行业认真看的地方。
英伟达想讲的不是 AI 又聪明了。
它想讲的是，AI 有了新的使用者。
过去十年，互联网的核心用户是人，所以产品设计围绕人的注意力展开。谁能让人多停留一分钟，谁就更有价值。移动互联网最疯狂的时候，本质上是在争夺人的眼睛、手指和时间。
到了 Agent 时代，新的用户不只有人，还有一批自动运行的软件劳动力。它们不刷短视频，不看广告，不会因为界面漂亮多留一会儿。它们只关心一件事，任务能不能跑完，工具能不能调通，结果能不能验收。
所以整个 AI 行业的底层指标会变。
以前模型公司喜欢比谁更聪明，谁的 benchmark 更高，谁的多模态更炸。这个当然重要，但如果 Agent 成为真实使用者，问题会变成另一个样子，谁能让一万个 Agent 同时低成本运行，谁能让它们少等待，谁能让工具调用和数据处理不卡住，谁能让失败重试的成本降下来。
这也是为什么 NVIDIA 会把 Vera 称作给 Agent 的 CPU。
很多人看 AI 基建，只盯 GPU。因为大模型训练和推理最亮眼的部分都在 GPU 上。但 Agent 工作流里，有大量事情并不只是 GPU 的事。Python 运行时、沙盒代码执行、数据库处理、文件检索、工具编排、网络和安全，这些都在吃 CPU、内存、存储、网络。
你想想一个很朴素的场景。
一个企业让 Agent 帮销售团队整理客户线索。它要读 CRM，查邮件，生成拜访摘要，调用公司知识库，检查合规词，最后把结果写回系统。这里最贵的那一步可能不是模型输出，而是它在很多系统之间来回搬数据、调接口、等返回。
如果有一百个销售还好。
如果有十万个销售，如果每个人背后都有几个 Agent，如果这些 Agent 每天跑几轮任务，那整个公司就不是买了一个聊天机器人。
它是在养一批数字员工。
数字员工和真人员工有一个很大的区别，真人会下班，Agent 理论上不会。真人一天有效工作几个小时，Agent 可以一晚上跑掉几万个小任务。以前企业买软件，是买座席数。以后企业买 AI，可能更像买吞吐量、买延迟、买可靠性。
这时候 AI 行业的竞争就从模型层往系统层下沉。
我知道这句话听起来不如模型发布刺激，但它可能更重要。
因为模型能力一旦进入相对趋同阶段，真正决定商业化速度的，往往是运行成本和流程嵌入。一个 Agent 如果每次调用都很贵，每次跑流程都卡，每次出错都需要人擦屁股，那它就只能停留在演示视频里。演示视频很好看，老板也会点头，但到了财务那里，账就过不去。
反过来，如果 Agent 能稳定、低延迟、可审计地跑起来，哪怕它不是全世界最聪明的模型，也可能先进入企业预算。
这就是英伟达真正想抓住的地方。
它不是只卖芯片。它是在提前定义 Agent 时代的计算形态。模型公司负责让 Agent 更聪明，应用公司负责让 Agent 更好用，英伟达想负责让 Agent 能大规模活着。
活着这个词，我觉得很准确。
因为 Agent 不再是一次性回答，它是一种长期运行的状态。它要有运行时，要有安全边界，要有工具权限，要有数据通道，要有失败恢复。它像一个住在企业系统里的新物种。
说到这里，有人可能会觉得，这跟普通人有什么关系呢？我们又不买数据中心。
关系其实很大。
当 Agent 成为新的算力消费者，AI 应用的商业模式会跟着变。过去你买一个 AI 工具，可能按月付费，底层成本还可以用订阅摊掉。以后如果一个工具背后有很多 Agent 持续执行任务，厂商就必须重新设计价格。按人头收费可能不够，按任务收费可能更合理，按结果收费又会带来新的验收问题。
也就是说，AI 产品经理要开始懂成本曲线了。
你不能只问，用户想要什么功能。你还要问，这个功能背后会触发多少次模型调用，多少次工具调用，多少次数据读写，多少次失败重试。功能越自动化，成本越不再透明。
这也是很多 AI 应用今天看起来很热闹，但商业上迟迟不舒服的原因。
不是用户不需要。
是单位经济账还没有完全跑顺。
GTC Taipei 把这件事摆到了台面上。Vera CPU、Vera Rubin、AI factory、Agent runtime，这些词放在一起，其实是在讲同一个判断，AI 的下一阶段不是把一个模型接进网页，而是让一批 Agent 在企业、个人电脑和机器人系统里长期运行。
如果这个判断成立，整个行业会出现三类新机会。
一类是基础设施机会，围绕 Agent 的 CPU、网络、存储、安全、调度、可观测性都会变重要。以前大家觉得这些是后端工程的苦活，未来可能会变成 AI 时代的关键入口。
一类是应用机会，谁能把 Agent 放进真实流程，而不是做一个漂亮的聊天框，谁就更可能留下来。因为 Agent 真正的价值不是会说话，而是能把一件事从开始推到结束。
还有一类是组织机会，企业会重新设计岗位。不是所有人都要学写提示词，但很多人要学会把任务拆成 Agent 能执行、能验收、能纠错的流程。
这件事挺现实的。
AI 不会因为发布会说得漂亮就自动改变世界。Agent 也不会因为叫 Agent 就能干活。中间有大量脏活，权限、数据、流程、成本、责任，每一项都能把一个演示级产品拖回地面。
但我觉得 GTC Taipei 的价值就在这里。
它让我们看到，AI 行业正在从聪明的模型，走向能工作的系统。
如果说过去两年，大家都在问模型会不会替代人。
那么接下来更值得问的是，谁能让 Agent 真正进入工作流，谁能承担它运行时的成本和责任，谁能让它每天都能稳定地打开。
这才是新一轮 AI 竞争的起点。