我看到 GTC Taipei 这场发布会里最有意思的一句话,不是某个参数涨了多少,也不是某个机柜又多厉害。
是黄仁勋讲 Vera CPU 的时候,说过去 CPU 是给人用的,未来会有 billions of agents,Agent 会非常没耐心地使用 CPU。
这句话听起来像舞台金句,但你仔细想想,有点吓人。
以前我们讨论 AI,大部分时候默认使用者是人。一个人打开 ChatGPT,问一句,等几秒,复制结果,走人。哪怕是企业里的 AI 助手,本质上还是人在发起动作。人是节奏的主人,AI 是被叫来的帮手。
但 Agent 不是这样。
Agent 一旦真的进入工作流,它不是问一句答一句。它会拆任务,会查资料,会调用工具,会跑代码,会反复检查结果,会在一个流程里等待、重试、修正、提交。它的动作不是一次请求,而是一串请求。它不是偶尔用一下算力,而是持续吃算力。

这才是 GTC Taipei 这场会最值得行业认真看的地方。
英伟达想讲的不是 AI 又聪明了。
它想讲的是,AI 有了新的使用者。
过去十年,互联网的核心用户是人,所以产品设计围绕人的注意力展开。谁能让人多停留一分钟,谁就更有价值。移动互联网最疯狂的时候,本质上是在争夺人的眼睛、手指和时间。
到了 Agent 时代,新的用户不只有人,还有一批自动运行的软件劳动力。它们不刷短视频,不看广告,不会因为界面漂亮多留一会儿。它们只关心一件事,任务能不能跑完,工具能不能调通,结果能不能验收。
所以整个 AI 行业的底层指标会变。
以前模型公司喜欢比谁更聪明,谁的 benchmark 更高,谁的多模态更炸。这个当然重要,但如果 Agent 成为真实使用者,问题会变成另一个样子,谁能让一万个 Agent 同时低成本运行,谁能让它们少等待,谁能让工具调用和数据处理不卡住,谁能让失败重试的成本降下来。
这也是为什么 NVIDIA 会把 Vera 称作给 Agent 的 CPU。
很多人看 AI 基建,只盯 GPU。因为大模型训练和推理最亮眼的部分都在 GPU 上。但 Agent 工作流里,有大量事情并不只是 GPU 的事。Python 运行时、沙盒代码执行、数据库处理、文件检索、工具编排、网络和安全,这些都在吃 CPU、内存、存储、网络。
你想想一个很朴素的场景。
一个企业让 Agent 帮销售团队整理客户线索。它要读 CRM,查邮件,生成拜访摘要,调用公司知识库,检查合规词,最后把结果写回系统。这里最贵的那一步可能不是模型输出,而是它在很多系统之间来回搬数据、调接口、等返回。
如果有一百个销售还好。
如果有十万个销售,如果每个人背后都有几个 Agent,如果这些 Agent 每天跑几轮任务,那整个公司就不是买了一个聊天机器人。
它是在养一批数字员工。
数字员工和真人员工有一个很大的区别,真人会下班,Agent 理论上不会。真人一天有效工作几个小时,Agent 可以一晚上跑掉几万个小任务。以前企业买软件,是买座席数。以后企业买 AI,可能更像买吞吐量、买延迟、买可靠性。
这时候 AI 行业的竞争就从模型层往系统层下沉。
我知道这句话听起来不如模型发布刺激,但它可能更重要。
因为模型能力一旦进入相对趋同阶段,真正决定商业化速度的,往往是运行成本和流程嵌入。一个 Agent 如果每次调用都很贵,每次跑流程都卡,每次出错都需要人擦屁股,那它就只能停留在演示视频里。演示视频很好看,老板也会点头,但到了财务那里,账就过不去。
反过来,如果 Agent 能稳定、低延迟、可审计地跑起来,哪怕它不是全世界最聪明的模型,也可能先进入企业预算。
这就是英伟达真正想抓住的地方。
它不是只卖芯片。它是在提前定义 Agent 时代的计算形态。模型公司负责让 Agent 更聪明,应用公司负责让 Agent 更好用,英伟达想负责让 Agent 能大规模活着。
活着这个词,我觉得很准确。
因为 Agent 不再是一次性回答,它是一种长期运行的状态。它要有运行时,要有安全边界,要有工具权限,要有数据通道,要有失败恢复。它像一个住在企业系统里的新物种。
说到这里,有人可能会觉得,这跟普通人有什么关系呢?我们又不买数据中心。
关系其实很大。
当 Agent 成为新的算力消费者,AI 应用的商业模式会跟着变。过去你买一个 AI 工具,可能按月付费,底层成本还可以用订阅摊掉。以后如果一个工具背后有很多 Agent 持续执行任务,厂商就必须重新设计价格。按人头收费可能不够,按任务收费可能更合理,按结果收费又会带来新的验收问题。
也就是说,AI 产品经理要开始懂成本曲线了。
你不能只问,用户想要什么功能。你还要问,这个功能背后会触发多少次模型调用,多少次工具调用,多少次数据读写,多少次失败重试。功能越自动化,成本越不再透明。
这也是很多 AI 应用今天看起来很热闹,但商业上迟迟不舒服的原因。
不是用户不需要。
是单位经济账还没有完全跑顺。
GTC Taipei 把这件事摆到了台面上。Vera CPU、Vera Rubin、AI factory、Agent runtime,这些词放在一起,其实是在讲同一个判断,AI 的下一阶段不是把一个模型接进网页,而是让一批 Agent 在企业、个人电脑和机器人系统里长期运行。
如果这个判断成立,整个行业会出现三类新机会。
一类是基础设施机会,围绕 Agent 的 CPU、网络、存储、安全、调度、可观测性都会变重要。以前大家觉得这些是后端工程的苦活,未来可能会变成 AI 时代的关键入口。
一类是应用机会,谁能把 Agent 放进真实流程,而不是做一个漂亮的聊天框,谁就更可能留下来。因为 Agent 真正的价值不是会说话,而是能把一件事从开始推到结束。
还有一类是组织机会,企业会重新设计岗位。不是所有人都要学写提示词,但很多人要学会把任务拆成 Agent 能执行、能验收、能纠错的流程。
这件事挺现实的。
AI 不会因为发布会说得漂亮就自动改变世界。Agent 也不会因为叫 Agent 就能干活。中间有大量脏活,权限、数据、流程、成本、责任,每一项都能把一个演示级产品拖回地面。
但我觉得 GTC Taipei 的价值就在这里。
它让我们看到,AI 行业正在从聪明的模型,走向能工作的系统。
如果说过去两年,大家都在问模型会不会替代人。
那么接下来更值得问的是,谁能让 Agent 真正进入工作流,谁能承担它运行时的成本和责任,谁能让它每天都能稳定地打开。
这才是新一轮 AI 竞争的起点。
