WebShaper - 阿里通义开源的AI训练数据合成系统

WebShaper 是阿里巴巴通义实验室推出的 AI 训练数据合成系统,基于形式化建模和智能体扩展机制,生成高质量、可扩展的训练数据,助力 AI 智能体提升复杂信息检索能力。系统引入“知识投影”概念,用集合操作构造复杂问题结构,精准控制任务复杂度。其中 Expander 智能体能简单“种子问题”出发,逐步扩展为复杂推理任务,生成的训练数据可控且可解释。WebShaper 结合监督微调与强化学习策略,让模型在复杂任务中表现出色,适用文献整理、市场调研、智能学习助手、生活决策和医疗信息查询等场景。WebShaper - 阿里通义开源的AI训练数据合成系统

>>展开阅读