当前位置: 首页 > news >正文

[PaperReading] Mind Search: Mimicking Human Minds Elicits Deep AI Searcher

目录
  • MindSearch: Mimicking Human Minds Elicits Deep AI Searcher
  • TL;DR
  • Method
    • Overall Framework
    • WebPlanner
    • WebSearcher
    • 关键步骤
  • Experiment
  • 总结与思考
  • 相关链接

MindSearch: Mimicking Human Minds Elicits Deep AI Searcher

link
时间:24.07
单位:USTC, 上海AI Lab
相关领域:Search, LLM
作者相关工作:
Zehui Chen 之前有 InternLM
被引次数:46
项目主页:https://github.com/InternLM/MindSearch

TL;DR

之前基于LLM的搜索引擎存在三个问题:a. 复杂的需求通过一次性检索无法得到准确完全的结果;b. 多网页整合信息时存在噪声;c. 很多网页内容太长会超过LLM的context上限。本工作基于人类解决问题的过程,通过WebPlanner与WebSearcher两个关键模块来解决该问题。WebPlanner将用户Query分解为多个子问题,WebSearcher使用搜索引擎针对子问题进行层级检索。通过多agents的设计使得这些步骤可以在3分钟内并行操作,这相当于人类3小时的工作量。效果上提升了搜索的宽度与深度。

Method

Overall Framework

image

WebPlanner

image

WebSearcher

image

关键步骤

  • 问题分解(Query Decomposition): 使用WebPlanner将用户查询分解为多个可以并行解决的原子子问题。
  • 动态图构建(Dynamic Graph Construction): WebPlanner将复杂问题解决过程建模为一个有向无环图(DAG),通过添加节点和边来逐步细化问题。
  • 分层信息检索(Hierarchical Information Retrieval): WebSearcher执行分层检索过程,从大量网页中提取有价值的数据。
  • 多智能体设计(Multi-Agent Design): 通过在不同的智能体之间分配检索和推理任务,减少单个智能体的负载,提高处理长上下文任务的能力。
  • 上下文管理(Context Management): 通过在多智能体之间明确的角色分配和上下文状态转移,有效管理整个过程中所需的上下文。
  • 代码生成与执行(Code Generation and Execution): WebPlanner通过生成代码与图交互,利用LLM在代码任务上的优势。
  • 响应生成(Response Generation): 在收集到所有相关信息后,WebPlanner生成最终的响应。
  • 评估与优化(Evaluation and Optimization): 通过在闭集和开集问答任务上的广泛评估,验证MindSearch的有效性,并通过比较分析进一步优化。

Experiment

image

image

总结与思考

感觉Agent的工作整体都偏向于Framework,即设计一个Framework能够更经济、更高质量地满足用户需求。

相关链接

https://zhuanlan.zhihu.com/p/711958651
https://zhuanlan.zhihu.com/p/713774006

http://www.hskmm.com/?act=detail&tid=13767

相关文章:

  • 穷举法(c语言版)
  • ZYNQ PS 端 UART 接收数据素材帧(初学者友好版)嵌入式编程 C语言 c++ 软件开发
  • 详细介绍:深入理解Kafka事务
  • 能碳园区 / 工厂系统 - 智慧园区
  • 代码随想录算法训练营第五天 |242.有效的字母异位词、349. 两个数组的交集、第202题. 快乐数、1. 两数之和
  • Photoshop 2025 v26.0(PS2025)下载安装教程(含一键安装包下载)
  • 网络加速原理
  • 循环依赖问题
  • 无意中在应用层瞥见了一个微内核的操作系统调度器
  • 数据结构思维题选做(长期更新)
  • 政治笔记/错题
  • 9.22模拟赛总结
  • 莫队 n的序列,多次查询一段区间内的数字的个数
  • 【mysql】mysql客户端中文显示乱码
  • 揭秘“牛牛透视”
  • k8s系列--控制器yml(15)
  • 学生管理系统案例初步分析报告
  • 【mysql】mysql5.6 版本修改用户的登录
  • AT_abc200_e [ABC200E] Patisserie ABC 2 题解
  • 日总结 5
  • Linux驱动开发(1)概念、环境与代码框架 - 实践
  • Diffutoon下载介绍:真人视频转动漫工具,轻松获得上千点赞
  • 9月22号
  • 0.5*8 边形 != 式
  • 题解:AT_agc052_c [AGC052C] Nondivisible Prefix Sums
  • 寻路算法
  • 2025年9月22日 - 20243867孙堃2405
  • day 1
  • [Paper Reading] METAGPT: META PROGRAMMING FOR A MULTI-AGENT COLLABORATIVE FRAMEWORK
  • 二进制 - 20243867孙堃2405