英伟达Vera入场:开始正面挑战英特尔与AMD服务器生态
数据中心芯片市场过去十年几乎是被“CPU传统秩序”定义的。
英特尔的至强(Xeon)长期扮演默认选项,AMD的EPYC在云计算浪潮中逐步切走高端份额,而亚马逊则通过Graviton尝试在自研芯片上建立另一套成本体系。各家在同一条赛道上竞争,但底层逻辑其实一致——围绕x86架构延展算力边界。
英伟达这次的切入方式有点不一样。
Vera,这款即将在第三季度全面投产的数据中心微处理器,被明确定位为“独立CPU”,而不是传统意义上的GPU补充角色。更直接一点说,它试图进入CPU主导的服务器核心层。
首批客户名单也颇具象征意味:Anthropic、OpenAI、SpaceX。三家分别代表大模型应用、基础模型研发以及高强度工程计算场景,几乎覆盖了当前AI基础设施最活跃的几个方向。英伟达显然不只是卖芯片,而是在提前绑定下一代算力需求的入口。
黄仁勋在发布时给出的对比也很直接——在与AI相关的基础工作负载中,Vera速度达到基于英特尔x86芯片的1.8倍。
这个数字放在今天的服务器市场里,意味着一件事:CPU性能对比不再只是“优化空间讨论”,而是直接进入替代关系的语境。
过去很长一段时间,英伟达在数据中心里的角色是“加速器”,GPU负责训练和推理,CPU则由英特尔或AMD承担基础调度与通用计算。但随着AI工作负载逐渐向“端到端并行计算”演进,CPU与GPU之间的边界正在变得模糊。
Vera的出现,本质上是在试图重新定义这个分工。
如果说H100、H200代表的是AI算力的“爆发点”,那么Vera更像是把这种爆发延伸到系统底层,让CPU也具备面向AI优化的架构逻辑。换句话说,英伟达不是在补短板,而是在把整套AI数据中心架构重新写一遍。
这种策略并不陌生。
历史上,AWS通过Graviton一步步降低对x86的依赖,用“自研CPU+云服务绑定”重构成本结构;苹果用M系列芯片完成Mac生态的垂直整合。不同的是,英伟达面对的是一个已经高度固化的企业级服务器市场,英特尔在这个领域积累了几十年的软件兼容、硬件认证和客户迁移壁垒。
但AI改变了某些规则。
大模型训练和推理正在成为数据中心最昂贵、也是增长最快的负载类型。在这种结构下,传统通用计算的优化逻辑开始失效,客户更关心的是“单位token成本”和“整体系统吞吐效率”,而不是CPU是否符合某一代x86标准。
Vera正是踩在这个转折点上。
从战略角度看,英伟达的动作其实是一次典型的“向上延伸”。过去它提供GPU,现在试图提供CPU+GPU+系统级方案。数据中心不再只是芯片销售市场,而是逐渐变成整套AI基础设施平台竞争。
这也解释了为什么首批客户名单里会出现OpenAI和Anthropic。
这些公司本身就是AI算力的最大消耗方,他们不再满足于单一硬件性能,而是希望从底层架构上优化成本结构。英伟达与其说是在卖芯片,不如说是在提前锁定下一代AI工厂的“基础设施标准”。
不过,挑战也并不轻松。
英特尔和AMD在企业级市场的护城河,并不是单一性能指标,而是几十年构建的生态体系:操作系统优化、虚拟化支持、企业级认证以及全球数据中心部署经验。这些都不会因为一次1.8倍性能对比就发生瞬间转移。
更现实的问题在于,数据中心采购周期极长,一旦架构确定,替换成本极高。Vera要真正进入主流市场,可能需要的不只是性能优势,而是一整套系统级迁移方案。
但英伟达显然已经不满足于“GPU供应商”的身份。
Vera更像是一次试探,也是一次宣告——当AI成为数据中心的核心负载之后,CPU不再是一个稳定的既定变量,而是可以被重新设计的计算层。
如果这一趋势成立,未来的数据中心可能不再按照“CPU+GPU”的传统结构划分,而是变成围绕AI任务优化的统一计算栈。
而英伟达正在试图成为这个新栈的定义者。
