苹果在语音助手领域的战略正迎来一番罕见的大幅调整。据资深爆料人古尔曼披露,苹果内部将新版Siri标记为“Beta”状态,不会在宣传中以“完成品”身份示人,且可能设置等待清单供用户先行体验。与此同时,一条更令人意外的技术路径浮出水面:部分Siri查询将通过Google Cloud调用授权版Gemini模型,并依赖谷歌部署的英伟达Blackwell B200 GPU集群完成推理。
这一安排标志着苹果在AI基础设施上首次明确采纳外部供应商。长期以来,苹果以“端侧隐私”和“自研芯片封闭生态”为卖点,拒绝依赖第三方云端AI能力。然而,在竞争对手纷纷借助大模型实现对话式交互升级的压力下,苹果自研大语言模型的成熟度显然未达内部预期。将Siri的部分推理任务外包给谷歌,意味着苹果承认在基础模型训练和云端加速层面尚需借力——尽管它可能通过私有计算云等加密技术试图弥合隐私断层。
新版Siri的“Beta”标签本身也透露了苹果的谨慎心态。即便在iOS 27中,通知中心和“查找”应用均迎来视觉重设计,照片“清理”工具亦有所增强,但核心对话体验——即用户最关心的准确性与多轮能力——仍被内部视为不成熟。这与2024年WWDC上承诺的“更具个人情境感知的Siri”形成时间差:用户期待的“智能体”并未如期交付完整版本。等待清单模式可能用于分级测试,以便在隐私合规与模型稳定性之间取得平衡。
从工程角度看,谷歌Cloud与英伟达B200的介入暗示了苹果对推理延迟和吞吐量的严苛把控。B200是英伟达最新的Blackwell架构GPU,专门针对万亿参数级模型优化,而Gemini授权版则极可能经过剪枝或量化处理以适配苹果的隐私策略。这意味着苹果并非简单套用Gemini原版,而是定制了专属推理管道。即便如此,部分敏感的语音查询仍可能被路由至苹果自有硬件——这一“混合架构”既保证了核心隐私词条的本地处理,也让用户日常对话流畅度受外部供应商算力波动影响。
对用户而言,这一变化短期带来的启示有三:其一,不要对Siri的对话能力抱有过高期待,“Beta”标签意味着可能出现明显误判或功能缺失;其二,若你已身处苹果生态系统,开启等待清单后建议主动反馈问题,以帮助苹果校准模型输出;其三,隐私敏感用户需关注苹果后续披露的“云端查询”数据流审计报告——一旦查询不可避地经过谷歌底层,原有的“端到端加密”承诺将面临更复杂的履行环境。
放眼全局,这场“借力打力”的AI部署实验,是苹果在生成式AI竞赛中的务实之举,但也折射出其自研大模型路线图的滞后。当行业玩家纷纷以“全栈自主”为荣时,苹果选择开放部分供应链,用英伟达芯片和谷歌模型换取时间窗口。Siri能否在“Beta”中涅槃,取决于其底层安全改进与Gemini系统的融合深度。对于技术观察者而言,2025年秋的iOS 27正式版发布,将是检验该混合架构是否具备实际落地价值的关键节点。