不只卖GPU!英伟达向OpenAI、Anthropic、SpaceX与甲骨文交付首批Vera CPU

来源:钜亨网 #英伟达# #AI# #CPU#
718

英伟达宣布,旗下首款专为代理式 AI(Agentic AI) 设计的 Vera CPU 已完成首批交付,客户包括 Anthropic、OpenAI、SpaceX AI 以及甲骨文 (ORCL-US) 云端基础设施 (OCI)。这也意味着英伟达执行长黄仁勋先前所称的”下一个数十亿美元级业务“,已从产品展示阶段进入实际商业部署。

根据英伟达公布资讯,负责超大规模运算与高效能运算业务的副总裁 Ian Buck 亲自将首批 Vera 系统送往各家公司。首站为 Anthropic 位于旧金山的办公室,其后交付至 OpenAI、SpaceX AI 及 OCI。

市场分析认为,Vera 的重要性不在于推出另一款 CPU,而是代表 AI 产业需求正从单纯模型训练,进一步转向能执行复杂任务的代理式 AI 架构。与传统生成式 AI 主要负责回答问题、生成内容不同,代理式 AI 需要自主规划流程、呼叫外部工具、执行代码、搜索资料并完成多步骤工作,因此对 CPU 运算、存储芯片管理及资料调度能力提出更高要求。

英伟达表示,Vera 是首款完全由公司自行设计的 CPU,搭载 88 个自研 Olympus 核心,存储芯片带宽达 1.2TB/s,单核心效能较传统 CPU 提升 50%,整体效率则提高至两倍。Vera 主要作为 AI 系统中的主机 CPU,负责资料搬移、存储芯片管理与系统控制,使 GPU 可维持高速运作。

Vera 的设计也反映 AI 基础设施架构正在改变。过去市场焦点集中于 GPU 运算能力,但在代理式 AI 时代,CPU 重新成为关键元件。英伟达指出,长上下文推理、工具呼叫、强化学习沙盒以及多层代理流程,大量工作实际上发生在 CPU 层。

在首批客户中,甲骨文态度尤其积极。OCI 资深副总裁 Karan Batta 表示,OCI 预计自 2026 年起部署数十万块 Vera CPU,以支援企业级 AI 工作负载。OCI 指出,代理式 AI 需要长时间高负载推理能力,而 Vera 在效率、密度及空间利用率方面符合需求。

分析人士指出,甲骨文的大规模采购承诺显示市场需求已不只是技术展示,而是开始转化为实际订单与资本支出。尤其目前超大型云端厂商正加速扩建 AI 数据中心,市场对 AI 基础设施的投资规模持续攀升。部分产业研究预估,美国五大云端与 AI 基础设施厂商 2026 年资本支出可能接近 7000 亿美元。

值得注意的是,Vera 并非单独运作产品,而是英伟达新一代 AI 工厂架构的重要一环。未来 Vera 将与 Rubin GPU、BlueField 4 DPU、Spectrum-X 以太网平台以及 MGX 机架系统共同构成完整架构。

在 Vera Rubin NVL72 系统中,Vera 可透过第二代 NVLink-C2C 直接连接 Rubin GPU,形成统一存储芯片架构,大幅提升资料供应效率与整体运算能力。

此外,先前公布的合作名单显示,除甲骨文外,包括 Meta Platforms (META-US)、阿里巴巴 (BABA-US)、CoreWeave(CRWV-US) 及其他大型云端厂商也正规划导入 Vera 平台。制造伙伴则涵盖戴尔科技 (DELL-US)、慧与科技 (HPE-US)、联想、美超微 (SMCI-US)、鸿海、广达、和硕及纬创等供应链厂商。

市场观察人士认为,Vera 正式进入商业部署,代表英伟达 AI 战略已从 GPU 进一步扩展至 CPU、网络与机架系统层级。随着 AI 数据中心建设热潮延续,英伟达在生成式 AI 与代理式 AI 基础设施市场的主导地位,可能进一步巩固。

责编: 李梅
来源:钜亨网 #英伟达# #AI# #CPU#
THE END
关闭
加载

PDF 加载中...