当生成式AI在图像、语言和视频领域掀起风暴时,一个更具野心的技术方向正悄然逼近:物理世界模型。Runway与NVIDIA联合宣布组建Cosmos Coalition,并邀请多家顶尖AI实验室加盟,旨在共同开发并开源一个面向物理智能的基础模型。此举如同在AI研发的封闭高墙下投入一枚开源炸弹,但其最终能否改变游戏规则,仍取决于后续生态建设能否跟上。
这则新闻的核心价值不在“合作”,而在“开源”。当前,世界模型的研究高度集中于少数巨头——谷歌的DeepMind、Meta的FAIR实验室虽然偶有重量级成果,如Genie或Noam Brown提出的博弈世界模型,但大多选择闭源或受限发布。而Cosmos Coalition的打破常规,直接指向了技术扩散的瓶颈:若连探索物理规律的基础模型都被公司或实验室垄断,物理AI将沦为少数玩家的专利,而非推动行业前进的公共基础设施。
首阶段项目由Runway与NVIDIA联合定义并构建基础模型。选材恰逢其时:Runway在视频生成领域的积累——如对连续帧、物理运动、光影变化的建模——无缝对接世界模型对时序与物理规律的感知需求。而NVIDIA则从硬件与计算框架层面提供支撑,其Omniverse平台和底层CUDA生态在世界模型训练中天生具备优势。这种“生成式AI公司+硬件巨头”的组合,意在从底层打到应用端,统一世界模型的基座。
但挑战不可忽视:“开源世界模型”的承诺是否真能兑现?我们必须追问:该模型开源到什么程度?权重全开放,还是部分训练代码?训练数据是否开源?如果不公开核心数据与训练流程,开源就等于“空壳”。参考Hugging Face等开源模型社区的现状——大多数只是“开放权重+论文”,而非真正可复现和可迭代的开源生态——若Cosmos Coalition无法超越这一局限,其开源愿景恐沦为空谈。
另一个关键变量是后续生态建设。如果联盟能围绕开源模型建立起开发者社区、提供入门教程、设立评估基准、开放微调工具,推动行业从检测模型向世界模型迁移,才算真正完成“共建”。否则,仅靠一场新闻发布会在AI蓬勃发展中留下印记。
对于AI从业者而言,这一动向提供了双重信号:一方面,物理AI的赛道已经正式解锁,世界模型不再是空中楼阁,而是可触摸的研究方向;另一方面,开源承诺的落地仍需持续观察。建议科研机构和产业应用公司紧密关注Cosmos Coalition的首个模型版本与许可证条款,一旦确认真正开放,应迅速介入生态构建,将这次的“试验性”开源转化为实际生产力。
世界模型的开源运动才刚刚开始。Runway与NVIDIA投下的这颗石子,或许会激起永久改变物理AI格局的涟漪——但不是每个涟漪都能成为浪潮。判断其成败,不在今日,而在未来6到12个月生态的积累与裂变。