突破算力边界：面壁智能开源首个昇腾原生训练1.58-bit端侧大模型，8B参数塞进手机

AIHOT小编

2026-05-25 14:37

国产算力长期被诟病“只能跑小模型”，这一印象正在被打破。面壁智能联合清华大学正式开源了BitCPM-CANN，这是中国首个基于华为昇腾平台原生训练的1.58-bit端侧大模型。该模型不仅将8B参数规模成功塞入旗舰手机，更开源了从训练到推理的全套底座，直接触动了当前AI产业链中“算力卡脖子”与“终端部署难”两大核心命题。

BitCPM-CANN的核心突破在于其1.58-bit量化机制。与传统模型量化（如4-bit、8-bit）不同，1.58-bit并非简单的精度压缩，而是在训练阶段即采用极低比特权重设计，通过三元值（-1、0、+1）或近似结构大幅压缩模型体积。面壁团队选择在昇腾芯片上原生训练，而非先训练后迁移，这意味着模型从头至尾适配国产算力指令集与算子库，避免了跨平台部署的性能损失。实测表明，该技术在保持任务准确率接近原版8B模型的同时，将内存占用削减至不足原来的1/5，使得旗舰手机NPU可以实时运行。

更值得关注的是，该项目同时开源了完整的训练基线、数据管道和推理引擎，基于CANN（华为昇腾计算语言接口）封装。这意味着开发者无需繁琐的跨平台适配，即可在昇腾服务器上自行训练端侧模型并直接部署至手机。与苹果Apple Intelligence的闭源路线、高通AI Engine的封闭生态相比，面壁的开源策略为国内端侧AI提供了真正的“自主板机”：开发者可以基于国产算力构建差异化的端侧智能应用，而无需受制于海外芯片或私有协议。

从行业视角看，BitCPM-CANN的落地标志着两个趋势的合流：一是端侧大模型的“可压缩性”远超预期，1.58-bit技术的成熟让百亿参数模型上手机不再是纸上谈兵；二是国产算力生态从“能跑”向“能训”跨越，昇腾平台不仅在推理侧追赶英伟达，更在训练侧打开了低比特端侧模型的原生土壤。对于正在押注端侧AI的手机厂商、IoT设备商及边缘计算玩家，这一开源底座提供了一个低门槛的切入点——直接将8B级别的能力注入终端，而无需等待云端推理的时延或依赖海外芯片的供应安全。

展望未来，随着1.58-bit等超低比特训练技术的普及，“国产芯片+开源端侧模型”的组合可能重塑AI终端格局。面壁的开源动作不仅是技术演示，更是生态杠杆：谁能率先基于这套底座孵化出高粘性的端侧应用，谁就能在下一波端侧AI浪潮中卡住身位。对于开发者，现在就去拉取BitCPM-CANN代码、在昇腾开发板上跑通一个Demo，或许是今年最有性价比的技术投资。