2026 年 GTC 大会,英伟达正式发布88 核 Vera CPU,这款专为 AI Agent、强化学习(RL)量身打造的全新处理器,彻底打破 “CPU 仅做 AI 辅助、GPU 主导计算” 的传统格局,以自研 Olympus 核心、1.2TB/s 内存带宽、NVLink-C2C 1.8TB/s 一致性互联三大核心突破,实现性能对标 GPU、CPU 与 GPU 深度融合的算力架构重构,标志着数据中心 AI 计算正式进入 “智能体主导、异构统一” 的新纪元。
Vera 并非传统服务器 CPU 的迭代,而是面向万亿 Token、多智能体并发、强化学习迭代的 “AI 工厂专用芯片”。它搭载 88 个英伟达自研 Olympus 核心(基于 Armv9.2-A 定制,非公版 Arm),支持空间多线程(Spatial Multithreading),单芯片 176 线程,相比前代 Grace(72 核)核心数提升 22%、线程数提升 25%,在 Agent 沙盒、工具调用、编排调度等核心场景,性能较传统 x86 CPU 提升 50%、能效翻倍。其核心设计直击 AI Agent 的三大痛点:海量上下文调度、高频工具调用、强化学习快速迭代 —— 这些恰恰是传统 CPU 带宽不足、延迟高、并发弱的致命短板。
底层架构上,Vera 实现三大技术跃迁,支撑 AI Agent 的极致需求。首先是自研 Olympus 核心 + 空间多线程,每个核心物理分区资源而非时间切片,同时运行两个任务,避免传统超线程的资源争抢,在多智能体、多租户 AI 工厂中保持稳定低延迟,完美适配 Agent 频繁切换工具、调用模型、处理上下文的高并发场景。其次是第二代低功耗内存子系统,采用 LPDDR5X,单芯片内存带宽达 1.2TB/s,是主流服务器 CPU 的 2 倍,内存功耗仅为一半,单芯片最大支持 1.5TB 内存,解决 KV 缓存、大模型上下文、强化学习经验池的内存瓶颈,让 Agent 处理百万级 Token 上下文不再卡顿。最后是NVLink-C2C 与 SCF 一致性互联,Vera 与 Rubin GPU 通过 NVLink-C2C 实现 1.8TB/s 的芯片间一致性带宽(是 PCIe 6.0 的 7 倍),配合第二代 SCF 片上互联(3.4TB/s 双向带宽),构建 CPU-GPU 统一内存空间,彻底消除数据拷贝瓶颈,让 CPU 负责 Agent 决策、工具调度、逻辑控制,GPU 专注张量计算,二者无缝协同,形成 “大脑 + 引擎” 的一体化算力单元。
Vera 的核心价值,在于重新定义 CPU 在 AI 计算中的定位 —— 从 “配角” 升级为 “智能体大脑”。传统 AI 架构中,CPU 仅承担数据预处理、模型调度、系统控制,GPU 包揽所有张量计算;但 AI Agent 需要高频调用搜索、代码、数据库、API 等工具,频繁做逻辑判断、分支决策、上下文管理,这些轻量但高并发、低延迟的任务,GPU 并不擅长,而传统 CPU 又因带宽、核心、线程不足成为瓶颈。Vera 正是为填补这一空白而生:它既能高效执行 Agent 的控制流、工具链、强化学习的奖励函数与策略迭代,又能以超高带宽与 GPU 联动,让整个 AI 系统的端到端延迟降低 40%、吞吐量提升 60%,尤其在多智能体集群、强化学习大规模训练、实时推理场景,优势无可替代。
从产业格局看,Vera 的发布,既是英伟达完善全栈 AI 算力的关键一步,也重塑了数据中心 CPU 的竞争赛道。此前服务器 CPU 被 Intel x86、AMD EPYC 垄断,英伟达 Grace 以 Arm 架构切入,主打高能效;而 Vera 直接聚焦 AI Agent 这一未来核心场景,以专用化、全栈协同构建差异化壁垒,不再与 x86 拼通用性能,而是在 AI 专用赛道建立绝对领先。同时,Vera 与 Rubin GPU、BlueField-4 DPU、MGX 液冷机架组成完整的 Vera Rubin NVL72 平台,单液冷机架可集成 256 颗 Vera,支撑 4.5 万线程并行、400TB 内存,构建百万级智能体并发的超级 AI 工厂,为自动驾驶、数字孪生、工业自动化、具身智能等场景提供底层算力底座。
当然,Vera 的普及仍面临挑战:一是生态适配,Arm 架构的软件迁移、AI 框架(PyTorch、TensorFlow)对 Vera 专用指令集的优化需要时间;二是成本与交付,专用化芯片的量产与定价,以及与现有 x86 服务器的兼容方案;三是竞争压力,Intel、AMD 也在加速推出 AI 优化 CPU,华为昇腾、国产算力厂商也在布局异构融合方案,全球数据中心算力进入 “专用化、一体化” 的军备竞赛。
但不可否认,Vera 88 核 CPU 的发布,是 AI 算力架构的里程碑事件。它证明:AI 进入 Agent 与强化学习时代,单一 GPU 已无法满足需求,CPU 与 GPU 的深度融合、专用化设计、统一内存互联,才是数据中心 AI 计算的终极方向。
