大规模部署生成式AI已近两年,企业端一个明显的转向正在发生:挥金如土的“尝鲜期”宣告结束,取而代之的是对每一分钱算力消耗的精打细算。一批美国大型企业开始对内部AI工具实施配给制,通过限制使用频次、设置调用配额、引入层层审批等手段,强行挤出成本泡沫。这并非某个特定行业的一时之举,而是一种行业性的理性回调。
此前,受到“落后就要挨打”的焦虑驱使,大量企业以近乎不计成本的方式铺开Copilot、代码助手、内部知识库问答等AI应用,采购策略往往以覆盖全员为目标。但进入2024年下半年,当财务部门开始逐项核查IT支出时,才发现AI服务的账单膨胀速度远远超出了生产力提升的曲线。模型推理的边际成本并不像传统软件许可那样可以无限摊薄,每一次问答、每一次代码生成都对应着实实在在的GPU消耗。当一个月动辄数十万美元的AI账单摆在桌前,CIO们不得不从“我们能做什么”转向冷冰冰的追问:“我们到底该为哪些场景付费?”
这场从“全量放开”到“配额管控”的转变,背后是两条成本曲线的交叉点。一条是快速上涨的模型使用成本,大型语言模型虽然单位token价格在竞赛中不断降低,但企业规模化调用的频次和上下文长度却呈指数级上升,总成本不降反升。另一条是难以同步提升的业务收益曲线,许多通用性AI能力的边际效益在经历早期提升后迅速衰减——最先被替代的往往是低价值或边缘任务,而高价值场景的落地远比想象中复杂。当两条曲线不再匹配时,配额管理就成为了唯一理性选择。
这种配给制并非简单地一刀切,而是呈现出鲜明的分层特征。核心业务团队和高频产出岗位拥有更充裕的额度与优先调度权,非关键场景的查询则被引导至轻量化模型或干脆延迟处理;部分企业甚至设置了“AI呼叫”的审批流,超出日常限额的请求需要经过业务负责人核准。这套机制让人想起云计算早期的预算告警和资源标签管理,只不过如今管控的对象是更加分散且难以量化的“智能调用”。
对AI产品提供商而言,这无疑是一声警钟。过去靠铺量抢客户的玩法正在失效,客户不再为空洞的“全员赋能”买单,而是要求供应商拿出可验证的投资回报模型。从技术架构上看,这也将推动推理成本的精细化透明化,混合推理、本地化部署、小模型路由等方案会加速进入企业采购清单。能将单位智能产出的成本压至最低,并帮客户建立起可视化的成本控制体系的厂商,才更有机会穿越接下来的企业级严选周期。
趋势已相当清晰:生成式AI在企业端的比拼,已从模型能力的“军备竞赛”下沉到工程化与总拥有成本的“绣花功”。当智能不再是稀缺品,如何证明自己值回票价,就成了每个AI项目必须回答的生存题。