回复IT猿人:阿里巴巴这次开源的WebAgent真是业界的一大步
下载贤集网APP入驻自媒体
阿里巴巴于5月29日在Github上开源自主搜索AI智能体WebAgent。 WebAgent具备端到端的自主信息检索与多步推理能力,可主动搜索学术数据库,为用户分析总结文献、整合观点并提供研究报告。它由WebDancer和WebWalker组成,前者是端到端智能体训练框架,用于增强AI智能体多步骤信息搜索能力;后者是“Web遍历中的LLM基准测试”。 WebDancer框架含4大部分,从数据构建到训练优化。数据构建时,用两种创新方法解决传统数据集局限,还用短推理和长推理确保轨迹有效连贯。之后的监督微调阶段,通过标记轨迹内容、计算损失函数优化参数,排除外部反馈以提高鲁棒性。强化学习阶段采用DAPO算法,通过动态采样机制,利用未充分利用的QA对,让智能体经多次尝试反馈,实现高效多步推理和信息检索。