9 月 17 日消息,阿里通义实验室今日宣布,为了让 ai 真正具备“做研究”的能力,针对通义 deepresearch 的数据、agent 范式、训练、基础设施(infra)、test time scaling 进行了系统性创新,并宣布所有技术方案均已开源。
根据介绍,通义 deepresearch“不是简单的资料堆叠”,而是围绕一个问题完成一个完整的“研究闭环”,通过深度搜寻-多源交叉-结构化归纳-报告生成来产出有引用、可复现的调研报告与决策建议。
在 humanity's last exam、browsecomp、gaia、xbench-deepsearch、webwalkerqa 五个权威 benchmark 上,通义 deepresearch agent 30b-a3b 轻量级达到了 sota 效果。官方表示,团队对深度研究型智能体的推理范式进行了广泛的探索,因此最终模型支持多种推理形式,包括原生的 react 模式和上下文管理的深度模式。
目前,通义 deepresearch 已经赋能多个阿里巴巴内部应用,真实落地案例包括高德地图、通义法睿两款应用。
通义 deepresearch 与高德地图深度共建,联合推出全球首个 ai 原生出行 agent。
该 agent 为高德预置了专属地图 api、实时天气查询、交通状况监测等工具,可结合当下情况为用户提供更准确的行动建议。例如,在即将晚高峰的时候导航去机场,高德地图可制定绕开一条避开拥堵路线的方案。
在对专业性、准确性要求极高的法律领域,通义 deepresearch 同样表现出色。我们将其能力注入“通义法睿”,打造了专为法律研究优化的智能体。它能自动检索法条、类案和裁判文书,并进行深度归纳分析。在与 openai、claude 等国际顶尖模型的同台竞技中,通义法睿在“法条引用相关性”和“案例引用相关性”两项关键指标上全面领先,综合表现最优。这不仅验证了通义大模型在复杂推理场景的硬实力,更为法律从业者提供了强大的生产力工具。