DeepMind开源Science Skills：科学智能体的Token效率革命

AIHOT小编

2026-06-03 09:26

在AI for Science的浪潮中，一个核心矛盾日益凸显：通用语言模型虽能处理科学文献，但在执行多步实验设计、数据验证等复杂任务时，往往因缺乏科学基础而导致token浪费和幻觉频发。DeepMind最新开源的Science Skills工具包，正是针对这一痛点提供的系统级解决方案。

这套工具包的核心突破在于：它并非简单地将LLM调用于科学场景，而是构建了一套“科学嵌入”式的agent框架。具体来看，Science Skills包含了三个关键层级：底层是经过领域适配的Prompt模板库，覆盖分子模拟、晶体结构预测、量子化学计算等常见科学任务；中间层是验证层，能自动检测agent输出的逻辑一致性（如对称性检查、能量守恒验证）；顶层则是任务编排层，支持将复杂科学问题拆解为可并行的子任务流。

相比此前AutoGPT等通用agent方案，Science Skills在token效率上实现了质的提升。根据开源文档披露的基准测试，在蛋白质折叠优化任务中，该工具包比通用agent减少37%的模型调用次数——这得益于其内建的科学先验知识直接过滤了大量无效推理路径。更关键的是，其验证层能实时纠正模型输出中的科学错误，避免了传统”试错-反馈”模式中反复重新推理的成本。

从行业视角看，DeepMind此举再次印证了一个趋势：AI for Science正从”模型竞赛”转向”工具链竞赛”。此前，Google Research的”AI Co-Scientist”系统关注科学家与模型的协作界面，微软的”Accelerate Science”平台侧重算力调度，而Science Skills则补全了中间层——让agent在科学逻辑的约束下自主进化。值得关注的是，该工具包已实现与Colab、Vertex AI的即插即用，对科研团队的技术门槛大幅降低。

对于希望构建”AI lab assistant”的团队，以下是实操建议：优先关注其Raman光谱分析和DFT计算参数优化两个现成技能模块，它们被验证可减少50%以上的无效计算；若处理专属数据，应重点理解其”触发-验证-修正”循环的闭环机制，这是提升token效率的核心所在。毕竟在科学场景中，算力节省意味着更多实验假设可以被同时验证。