中文标题:SALT:通过轨迹图为长程智能体进行步级优势分配
作者机构:Jiazheng Li, et al. University of Connecticut, Amazon
论文地址:https://arxiv.org/pdf/2510.20022v1
论文贡献:
1)提出SALT,一个用于长程智能体强化学习中步级优势分配的新颖框架,通过构建轨迹图来区分共享和独特的步骤,无需额外监督或奖励模型即可生成细粒度优势。
2)SALT是一个轻量级、即插即用的模块,可以轻松集成到现有的基于群体的强化学习管道中,始终能提升性能,同时引入的计算成本可以忽略不计。
3)通过在ALFWorld、WebShop和AppWorld上的大量实验,证明了SALT在各种任务和模型规模上的一致优越性,详细的分析和案例研究进一步验证了该方法的有效性和可解释性。

