国产算力新突破：昇腾原生训练的1.58-bit端侧大模型开源，8B参数塞进手机

AIHOT小编

2026-05-25 23:08

当行业还在争论国产算力能否承载大模型训练时，面壁智能联合清华大学给出了一个颇具颠覆性的答案：基于华为昇腾原生训练的1.58-bit端侧大模型BitCPM-CANN正式开源。这不仅是中国首个此类模型，更关键的是，它证明了国产芯片不仅能跑“大参数”，还能以极低比特精度实现高效的端侧部署。

1.58-bit是什么概念？传统大模型量化通常落在4-bit或8-bit，而BitCPM-CANN将每个权重参数压缩至仅1.58比特——即每个参数用不到2位二进制数表示。这使得原本需要大量显存的8B参数模型，首次能被完整塞入旗舰手机的计算空间。与常见的后训练量化不同，面壁团队从训练阶段就基于华为昇腾硬件的CANN算子库进行原生训练优化，避免了后量化带来的性能损失，同时保持了模型在端侧推理时的精度与速度平衡。

这一进展的行业意义需要放在更广阔的背景中审视。长期以来，端侧大模型的主力部署硬件以高通、联发科等海外芯片为核心，国产算力在移动端AI生态中的存在感十分薄弱。面壁选择华为昇腾作为训练基底，不仅验证了昇腾在低比特训练场景下的算子效率，更向开发者传递了一个信号：国产芯片有能力支撑从训练到推理的全栈端侧AI流程。配合开源的全套训练底座（包括损失函数、混合精度策略和量化感知训练框架），第三方团队可以直接在昇腾环境上复现、微调甚至部署同类模型，极大降低了国产算力生态的开发门槛。

从应用角度看，1.58-bit模型的价值在于“端侧原生智能”的普及可能。传统上，云端大模型需要网络传输、存在延迟与隐私问题；而本地部署的8B模型虽然能力更强，却受限于手机存储和算力。BitCPM-CANN通过极致的比特压缩，使得离线语音助手、实时图片理解、隐私敏感的场景（如医疗诊断、金融风控）能在手机本地运行高参数模型，且功耗可控。这直接对标了苹果、三星等厂商正在推进的端侧生成式AI路线，但使用自主可控的算力底座。

当然，挑战依然存在。1.58-bit压缩会带来一定程度的能力折损，面壁团队尚未公开在主要基准（如MMLU、C-Eval）上的完整对比数据；此外，昇腾在移动端推理侧的生态绑定（如华为手机）是否会限制其跨平台扩展性，也需进一步观察。但无论如何，BitCPM-CANN的开源为端侧AI研究提供了一个实实在在的国产方案支点——开发者不必再等待海外芯片更新，就能着手实验极低比特模型在真实手机上的表现。可以预见，未来1-2年内，“昇腾原生训练 + 端侧极低比特推理”将成为国产AI芯片抢占移动端市场的重要技术路径，而面壁这次的“1.58-bit”示范，或将成为整个生态启动的引信。