黄仁勋谈Vera CPU:当芯片开始为AI代理而非人类设计
过去几十年,CPU产业有一个几乎默认的前提:计算机最终是服务人的。
无论是个人电脑时代的办公软件,还是移动互联网时代的应用程序,芯片设计始终围绕人的操作逻辑展开。键盘输入、鼠标点击、界面响应,这些需求塑造了现代处理器的发展方向。
如今,Jensen Huang试图给这个行业提出一个新的命题。
在谈及英伟达最新Vera CPU时,他用了一个颇具象征意义的表述:“过去所有CPU都是为人类设计的,而这款CPU是为代理(Agent)设计的。”
表面看,这只是一次产品宣传。但如果放在AI产业演进的背景下观察,会发现其中隐藏着一个更大的变化——计算世界的主要使用者,正在从人类逐步扩展到AI系统。
过去两年,大模型的发展改变了很多事情。最初的ChatGPT、Claude以及Gemini更像问答工具,人类提出问题,模型给出答案。计算需求虽然暴涨,但本质上仍然属于“人机交互”模式。
Agent时代则不同。
越来越多AI系统开始拥有持续执行任务的能力。它们会主动搜索信息、调用工具、管理任务流程,甚至协调多个模型共同完成工作。用户只需要下达目标,而不再参与每一个步骤。
这意味着未来的数据中心里,最频繁发起计算请求的可能不再是人,而是AI。
芯片设计逻辑自然会跟着变化。
传统CPU强调通用性和交互响应能力,需要适应各种软件和不可预测的人类行为。而Agent系统的运行模式更加固定,它们会频繁调用API、访问数据库、处理上下文记忆,并与GPU持续交换数据。
换句话说,Agent并不需要“像人一样使用电脑”,而是在机器之间直接协作。
这也是Vera背后最值得关注的部分。黄仁勋强调的并非单个CPU性能提升,而是计算架构开始围绕AI工作流重新设计。
事实上,这种转变已经在数据中心领域出现。
过去十年,服务器架构的核心是CPU,GPU更多承担加速角色。随着生成式AI爆发,GPU逐渐成为计算中心,而CPU开始承担调度、数据传输和任务协调工作。
如今Agent数量持续增加,CPU的角色再次被重新定义。
它需要管理大量并发任务,快速调度推理请求,并在不同模型之间完成资源分配。未来衡量CPU价值的指标,可能不再只是单线程性能,而是其协调数百万AI代理协同工作的能力。
这与互联网时代的演化路径有些相似。
早期服务器主要服务网页浏览用户,后来云计算兴起,服务器开始服务应用程序。今天,大模型正在推动下一次变化——服务器开始服务AI。
从商业角度看,英伟达的动作也并不难理解。
GPU市场已经建立起强大的竞争优势,但随着AI基础设施规模扩大,仅依靠加速卡并不足以构建完整生态。掌握CPU、网络、存储以及软件栈,才能真正控制未来数据中心的话语权。
Vera因此不仅是一颗CPU,更是英伟达向完整AI计算平台迈进的一部分。
行业里一个越来越明显的趋势是,芯片厂商不再只销售硬件,而是在定义未来计算方式。微软讨论Agent操作系统,OpenAI探索AI执行层,谷歌构建智能体生态,而英伟达则试图从底层硬件开始重构。
黄仁勋那句“为代理设计”的背后,其实是在传递一个判断:未来最大的计算需求,不是来自几十亿用户敲击键盘,而是来自数以亿计的AI代理彼此协作。
如果这一趋势成立,那么CPU产业将迎来一次比移动互联网时代更深刻的转向。
因为这一次,芯片服务的对象不再是人类,而是机器本身。届时,计算机架构的设计语言、性能指标甚至产业链分工,都可能被重新书写。
