Nvidia Vera CPU de 88 núcleos: Reestruturando a computação AI nos centros de dados

Cryptodata · 2026-04-17T05:37:34.000Z

O evento GTC de 2026 vai ser o palco para a Nvidia lançar oficialmente o processador Vera CPU com 88 núcleos. Este chip foi feito sob medida para Agentes de IA e aprendizado de reforço (RL), quebrando de vez o paradigma de que 'CPU só auxilia IA, enquanto GPU domina a computação'. Com os núcleos Olympus desenvolvidos internamente, uma largura de banda de memória de 1.2TB/s e interconexão NVLink-C2C de 1.8TB/s, os caras redefiniram a arquitetura de computação, fazendo frente aos GPUs e integrando profundamente CPU e GPU. Estamos entrando em uma nova era de computação em centros de dados, onde 'agentes vão dominar e a heterogeneidade vai ser unificada'. O Vera não é apenas uma atualização das CPUs tradicionais de servidor, mas sim um 'chip especializado para fábricas de IA', focado em trilhões de tokens, múltiplos agentes em paralelo e iterações rápidas de aprendizado de reforço. Ele vem equipado com 88 núcleos Olympus da Nvidia (baseados em Armv9.2-A customizado, não versão pública da Arm), suporta multithreading espacial, com 176 threads por chip, o que é um aumento de 22% no número de núcleos e 25% nas threads em comparação com a geração anterior, Grace (72 núcleos). Em cenários-chave como sandbox de agentes, chamadas de ferramentas e orquestração, seu desempenho supera em 50% as CPUs x86 tradicionais, além de dobrar a eficiência energética. O design central aborda três grandes dores dos Agentes de IA: agendamento de contextos massivos, chamadas de ferramentas em alta frequência e iterações rápidas de aprendizado de reforço — questões que as CPUs tradicionais não conseguem resolver por conta da largura de banda limitada, latência alta e baixa concorrência.

2026 年 GTC 大会，英伟达正式发布88 核 Vera CPU，这款专为 AI Agent、强化学习（RL）量身打造的全新处理器，彻底打破 “CPU 仅做 AI 辅助、GPU 主导计算” 的传统格局，以自研 Olympus 核心、1.2TB/s 内存带宽、NVLink-C2C 1.8TB/s 一致性互联三大核心突破，实现性能对标 GPU、CPU 与 GPU 深度融合的算力架构重构，标志着数据中心 AI 计算正式进入 “智能体主导、异构统一” 的新纪元。
Vera 并非传统服务器 CPU 的迭代，而是面向万亿 Token、多智能体并发、强化学习迭代的 “AI 工厂专用芯片”。它搭载 88 个英伟达自研 Olympus 核心（基于 Armv9.2-A 定制，非公版 Arm），支持空间多线程（Spatial Multithreading），单芯片 176 线程，相比前代 Grace（72 核）核心数提升 22%、线程数提升 25%，在 Agent 沙盒、工具调用、编排调度等核心场景，性能较传统 x86 CPU 提升 50%、能效翻倍。其核心设计直击 AI Agent 的三大痛点：海量上下文调度、高频工具调用、强化学习快速迭代 —— 这些恰恰是传统 CPU 带宽不足、延迟高、并发弱的致命短板。
底层架构上，Vera 实现三大技术跃迁，支撑 AI Agent 的极致需求。首先是自研 Olympus 核心 + 空间多线程，每个核心物理分区资源而非时间切片，同时运行两个任务，避免传统超线程的资源争抢，在多智能体、多租户 AI 工厂中保持稳定低延迟，完美适配 Agent 频繁切换工具、调用模型、处理上下文的高并发场景。其次是第二代低功耗内存子系统，采用 LPDDR5X，单芯片内存带宽达 1.2TB/s，是主流服务器 CPU 的 2 倍，内存功耗仅为一半，单芯片最大支持 1.5TB 内存，解决 KV 缓存、大模型上下文、强化学习经验池的内存瓶颈，让 Agent 处理百万级 Token 上下文不再卡顿。最后是NVLink-C2C 与 SCF 一致性互联，Vera 与 Rubin GPU 通过 NVLink-C2C 实现 1.8TB/s 的芯片间一致性带宽（是 PCIe 6.0 的 7 倍），配合第二代 SCF 片上互联（3.4TB/s 双向带宽），构建 CPU-GPU 统一内存空间，彻底消除数据拷贝瓶颈，让 CPU 负责 Agent 决策、工具调度、逻辑控制，GPU 专注张量计算，二者无缝协同，形成 “大脑 + 引擎” 的一体化算力单元。
Vera 的核心价值，在于重新定义 CPU 在 AI 计算中的定位 —— 从 “配角” 升级为 “智能体大脑”。传统 AI 架构中，CPU 仅承担数据预处理、模型调度、系统控制，GPU 包揽所有张量计算；但 AI Agent 需要高频调用搜索、代码、数据库、API 等工具，频繁做逻辑判断、分支决策、上下文管理，这些轻量但高并发、低延迟的任务，GPU 并不擅长，而传统 CPU 又因带宽、核心、线程不足成为瓶颈。Vera 正是为填补这一空白而生：它既能高效执行 Agent 的控制流、工具链、强化学习的奖励函数与策略迭代，又能以超高带宽与 GPU 联动，让整个 AI 系统的端到端延迟降低 40%、吞吐量提升 60%，尤其在多智能体集群、强化学习大规模训练、实时推理场景，优势无可替代。
从产业格局看，Vera 的发布，既是英伟达完善全栈 AI 算力的关键一步，也重塑了数据中心 CPU 的竞争赛道。此前服务器 CPU 被 Intel x86、AMD EPYC 垄断，英伟达 Grace 以 Arm 架构切入，主打高能效；而 Vera 直接聚焦 AI Agent 这一未来核心场景，以专用化、全栈协同构建差异化壁垒，不再与 x86 拼通用性能，而是在 AI 专用赛道建立绝对领先。同时，Vera 与 Rubin GPU、BlueField-4 DPU、MGX 液冷机架组成完整的 Vera Rubin NVL72 平台，单液冷机架可集成 256 颗 Vera，支撑 4.5 万线程并行、400TB 内存，构建百万级智能体并发的超级 AI 工厂，为自动驾驶、数字孪生、工业自动化、具身智能等场景提供底层算力底座。
当然，Vera 的普及仍面临挑战：一是生态适配，Arm 架构的软件迁移、AI 框架（PyTorch、TensorFlow）对 Vera 专用指令集的优化需要时间；二是成本与交付，专用化芯片的量产与定价，以及与现有 x86 服务器的兼容方案；三是竞争压力，Intel、AMD 也在加速推出 AI 优化 CPU，华为昇腾、国产算力厂商也在布局异构融合方案，全球数据中心算力进入 “专用化、一体化” 的军备竞赛。
但不可否认，Vera 88 核 CPU 的发布，是 AI 算力架构的里程碑事件。它证明：AI 进入 Agent 与强化学习时代，单一 GPU 已无法满足需求，CPU 与 GPU 的深度融合、专用化设计、统一内存互联，才是数据中心 AI 计算的终极方向。