苹果AI升级内幕:Siri端侧模型蒸馏自Gemini,隐私计算转向谷歌云

当苹果反复强调“隐私”和“本地智能”时,它的底层技术栈正前所未有地依赖竞争对手。即将在WWDC上亮相的Siri升级,背后是一套由Google模型蒸馏、Google Cloud推理和Nvidia机密计算拼凑而成的方案。这不仅是一则供应链消息,更标志着移动端AI竞争逻辑的深层转变:硬件厂商的端侧模型,越来越难以摆脱云侧巨头的技术供给。

端侧模型实为Gemini“瘦身版”

据多方信息源透露,苹果将在iPhone芯片上直接运行一个更小的生成式模型,以实现更低延迟、避免云端token成本并强化隐私叙事。但该模型并非苹果完全自研,而是对Google Gemini进行知识蒸馏的产物。蒸馏技术可让大模型“教”小模型,在损失部分能力的前提下大幅压缩参数规模,使端侧运行成为可能。选择蒸馏Gemini,说明苹果在追求快速落地的过程中,放弃了从零训练自家基座模型的路线,转而站在Google的肩膀上。

这一策略并非没有代价。蒸馏模型的能力天花板受限于原模型,且在知识更新、多模态复杂推理等方面会打折扣。苹果正在寻求收购小型设备端AI初创公司,试图通过外部人才加速模型压缩和调优,侧面反映出其内部团队在缩减大模型上的紧迫感。

“离开iPhone”的查询流向Google Cloud

更令业界关注的,是那些本地模型无法处理的查询将如何消化。答案直白:它们会路由到Google Cloud进行处理,而且采用了Nvidia的机密计算技术来加密数据。机密计算可在硬件层面创建隔离环境,保证数据在处理时不可见,但底层基础设施归属谷歌,意味着苹果用户最敏感的请求实际上运行在竞争对手的云上。

这与苹果2024年高调承诺的Private Cloud Compute方案形成微妙反差。原计划中,苹果设想利用自家Apple Silicon搭建一套专有云,从根本上确保数据不离开苹果掌控的硬件边界。然而,现实是Apple Silicon集群无法以合理的成本和效率承载完整的Gemini模型规模。知情人士指出,该方案已部分转向谷歌云,但“Private Cloud Compute”的品牌名称仍会被保留。名字未变,内涵已变——这更像是一个营销框架,而非技术实现上的纯粹私有云。

端侧AI竞争风向变了

苹果的取舍折射出当前端侧AI落地的三大现实困境:第一,在旗舰模型参数动辄万亿级别的时代,纯本地运行全功能模型几乎不可能,蒸馏只能解决“能用”的问题,距离“好用”仍有距离;第二,即使强如苹果,也不得不在成本和能力之间妥协,转向拥有超大规模基础设施的外部伙伴;第三,隐私保护叙事正从“物理隔离”向“密码学证明”演进,机密计算成为平衡功能与隐私的关键技术,但信任锚点已从自有硬件转向云服务商的审计流程。

对于关注端侧推理和隐私计算的同行而言,苹果这次的选择是一个清晰信号:硬件厂商在端侧大模型上可能不会追求“纯粹自研”,而是更多采用“蒸馏外脑+云端兜底”的混合架构。隐私竞争力不再取决于芯片是否印着自家Logo,而在于是否能构建一套可验证的安全计算逻辑,并让用户相信,数据不管是跑在本地还是跑在他人的云上,都同样安全。

最终,当用户对着升级后的Siri说出指令时,响应或许更快、更智能,但背后的技术版图已悄然重画。苹果的AI救命稻草,确确实实握在Google手中。