AI工厂席卷六大洲:NVIDIA联手合作伙伴加速agentic AI基础设施落地

当谈论agentic AI时,多数目光聚焦在框架与智能体设计上,但一个鲜被公开讨论却更为核心的前提是:没有一个分布在全球各地、具备高效推理与训练能力的计算网络,智能体AI将始终停留在实验室演示阶段。NVIDIA近期宣布的AI Cloud生态系统全球扩张,恰恰提供了这一底层逻辑的实践注解。

根据NVIDIA官方披露,其AI Cloud生态正在通过CoreWeave、Firmus、IREN、Nscale等十余家合作伙伴,在北美、欧洲、亚太、非洲、南美及中东等六大洲同步推进AI工厂基础设施建设。这些工厂并非传统意义上的数据中心,而是专为加速计算设计的集群——融合NVIDIA的Hopper、Blackwell架构GPU,配合其Spectrum-X网络与AI Enterprise软件栈,输出面向模型训练、微调、推理以及新兴的agentic AI工作负载。

这种扩张的底层逻辑在于:AI算力需求正在发生结构性迁移。早期的AI基础设施主要服务于模型预训练,但伴随GPT-3、Llama等大模型的涌现,推理需求已经超越训练成为算力消耗的主体,而agentic AI则进一步催生了对低延迟、高并发推理以及多智能体协同计算的刚性要求。单纯依赖少数区域的集中式云服务,很难满足企业AI、电信网络以及国家AI计划对于数据主权和响应速度的诉求。这正是NVIDIA将设施铺到亚太、美洲和非洲等区域的直接原因——Firmus在澳大利亚,IREN在非洲,Nscale在欧洲,每一处都承载着“主权AI”或“区域性计算”的特定使命。

值得行业关注的是,这一生态并未采用NVIDIA自建云的模式,而是选择与具备能源、土地或本地化运营能力的伙伴合作。CoreWeave在美国已建成多个万卡级集群,Firmus则利用澳洲的廉价可再生能源构建可持续AI工厂。这种“核心芯片+开放生态+本地化合作”的方式,降低了NVIDIA的资产负担,同时加速了全球AI基础设施的落地周期——相较于自建数据中心,合作模式可将部署时间缩短至6-9个月。

对于AI基础设施从业者而言,需要意识到:agentic AI从概念到落地的真正瓶颈不在算法,而在算力分布的广度与弹性。当前各大云厂商的GPU资源仍集中在少数区域,而智能体AI应用(如客服、自动化决策、实时推荐)要求推理节点尽可能靠近用户和数据源。NVIDIA推动的六大洲布局,实际在预示一个趋势:未来的AI计算将像电力网一样呈现“分布式+主干网”形态,而AI工厂就是其中的变电站。建议基础设施团队尽早评估自身业务对区域化推理的需求,并关注CoreWeave、Firmus等合作伙伴在特定区域的资源开放窗口——这可能是比直接采购公有云GPU更具性价比的路径。