商汤开源AI办公技能套件，Agent开发迎来“乐高式”组件时代

AIHOT小编

2026-06-03 00:20

当多数AI公司还在卷模型参数与API调用权限时，商汤选择了一条更务实的路：将大模型能力封装成可复用的办公技能套件，并完全开源。SenseNova-Skills的发布，意味着开发者不再需要从零训练或编写复杂工作流，就能快速为聊天机器人或智能体注入图像分析、数据处理、文档生成等高频能力。

这套开源技能集合聚焦四个核心场景：图像信息图表生成支持参考风格镜像，用户只需提供原始数据与风格图，模型即可输出格式一致的图表；数据分析模块整合了多表解析、数据清洗与可视化链路，可处理Excel/CSV等常见格式；PPT创建从大纲生成到智能排版一步到位，输出.pptx文件；深度研究则跨学术论文、技术博客、社交媒体等多源搜索，自动撰写结构化报告。每个技能都以标准化接口暴露，兼容OpenClaw、HermesAgent等主流Agent框架，真正实现“即插即用”。

这一动作的行业价值在于：它把Agent开发的碎片化问题转化为了组件化问题。此前，即使有GPT-4或Claude等强模型，开发者仍需手工编排提示词、调用外部工具、处理多轮对话状态。SenseNova-Skills直接将“如何将一张表格变成PPT”这类高频需求封装为可运行代码，且全部托管在GitHub上。对比AutoGPT、LangGraph等更偏底层的框架，商汤这套套件更像是“预装的应用商店”——你无需理解背后复杂的函数调用，只需告诉Agent需要完成什么任务，技能包就会自动加载对应逻辑。

从生态角度看，商汤延续了其开源路线：此前已贡献InternLM系列模型、SenseParrots训练框架，如今又在应用层开放技能仓库。这既降低了企业部署AI办公助手的成本，也为个人开发者提供了一手学习样本——想理解“图表生成”如何从图像理解到渲染输出？直接读源码即可。值得注意的是，该套件并非商汤自有Agent的专属配件，而是遵循通用接口设计，理论上可被任何技能兼容Agent接入。这种开放性或将吸引更多社区贡献者为其添加新技能，形成正向飞轮。

对开发者而言，直接fork仓库并组合现有技能，比等待闭源API升级要高效得多。建议有Agent产品规划的技术团队优先评估其数据分析和PPT生成能力——这两类需求在企业内部最为泛滥。而深度研究模块，结合RAG（检索增强生成）思路，可快速搭建内部知识搜索助手。短期看，商汤通过开源抢占Agent中间件生态；长期看，当足够多的技能被积累复用，AI办公将从“模型对话”真正转向“任务自动化”。这或许是SenseNova-Skills埋下的最大彩蛋。