当前位置: 首页 > news >正文

如何构建高效 AI 智能体 - 详解

传送锚点

    • 智能体?就是1.什么
    • 2.何时(以及何时不该)启用智能体
    • 3.如何以及何时使用框架
    • 4.构建块、工作流与智能体
      • 4.1 构建块:增强型 LLM
      • 4.2 工作流:提示链
      • 4.3 工作流:路由
      • 4.4 工作流:并行化
      • 4.5 工作流:编排器-工作者
      • 4.6 工作流:评估器-优化器
      • 4.7 智能体
    • 5.组合与定制这些模式
    • 6.总结
    • 附录 1:实践中的智能体
    • 附录 2:为你的工具进行提示工程

在过去一年里,我们与数十个来自不同行业的团队合作,共同构建大型语言模型(LLM)智能体。我们发现一个普遍现象:最成功的项目,往往不是依赖于复杂的框架或专门的库,而是采用简便、可组合的设计模式。

这篇文章将分享我们从服务客户和自研智能体过程中总结的经验,为开发者提供构建高效智能体的实用建议。

1.什么是智能体?

"智能体"可以有多种定义。有些客户将其定义为能够长时间独立运行、使用各种程序完成复杂任务的完全自主系统。另一些客户则用这个词来描述遵循预定义工作流程、更具规范性的实现。我们将这些变体都归类为智能体系统,但在架构上对工作流和智能体做重要区分:

  • 工作流:在这类系统中,LLM和工具借助预定义的代码路径被编排执行。

  • 智能体:在这类系统中,LLM动态地指导自身流程和工具的使用,并始终保持对任务做完方式的控制权。

下文中,我们将详细探讨这两种智能体平台。在附录1(“实践中的智能体”)中,我们描述了客户在使用这类环境中发现特别有价值的两个领域。

2.何时(以及何时不该)使用智能体

否值得。就是在用 LLM 构建应用时,我们建议先寻找最简单的解决方案,仅在必要时再增加复杂性。这甚至可能意味着根本不构建智能体平台。智能体系统通常以延迟和成本为代价,换取更好的任务性能,你需要仔细权衡此种交换

当确实需要更高的复杂性时:对于定义明确的任务,工作流能提供更好的可预测性和一致性。

当需大规模的灵活性和模型驱动决策时,智能体是更好的选择。

然而,对许多应用来说,依据检索和上下文示例来优化单次 LLM 调用通常就足够了。

3.如何以及何时运用框架

市面上有很多框架可以简化智能体平台的实现,例如:

  • LangChain 的 LangGraph;

  • Amazon Bedrock 的 AI Agent 框架;

  • Dify,一个开源的 LLM 应用开发平台,可用于快速构建 AI 应用;

  • Coze(扣子),一个用于开发和调试AI聊天机器人的应用编辑平台。

这些框架借助简化调用 LLM、定义和解析应用、将调用链接在一起等标准的底层任务,让你能轻松上手。但是,它们也常常制造出额外的抽象层,可能会掩盖底层的提示和响应,使调试变得更加困难。它们还可能诱使你在一个更简单的设置就足够的情况下,不必要地增加复杂性。

我们建议开发者从直接采用 LLM API 开始:许多模式只需几行代码即可实现。假设你确实要使用框架,请确保你理解其底层代码。对底层机制的错误假设是导致出错的常见原因。

4.构建块、工作流与智能体

在本节中,大家将探讨在生产环境中观察到的常见智能体架构模式。我们将从最基础的构建块——增强型 LLM——开始,逐步增加复杂性,从简便的组合式工作流到自主智能体。

4.1 构建块:增强型 LLM

智能体架构的基础构建块是一个通过检索、工具和记忆等能力得到强化的 LLM。我们目前的模型能够主动运用这些能力——生成自己的搜索查询、选择合适的工具,以及决定保留哪些信息。

我们建议在实现中关注两个关键方面:根据你的具体用例定制这些能力,并确保它们为你的 LLM 提供一个简单、文档完善的接口。

4.2 工作流:提示链

提示链将一个任务分解为一系列步骤,其中每个 LLM 调用处理前一个调用的输出。你能够在任何中间步骤添加程序化检查(如下图中的"关卡"),以确保流程仍在正轨上。

何时使用:当任务可以被轻松、清晰地分解为固定的子任务时,这个工作流很理想。其主要目标是通过让每次LLM 调用都成为一个更简单的任务,来换取更高的准确性。

4.3 工作流:路由

路由对输入进行分类,并将其引导至一个专门的后续任务。该工作流允许关注点分离,并构建更专业的提示。否则,为一种输入进行的优化可能会损害在其他输入上的性能。

何时利用:当一个困难任务有明显不同的类别,且这些类别分开处理效果更好,并且分类可以被 LLM 或传统分类模型准确处理时,路由模式相当有效。

4.4 工作流:并行化

LLM 有时可以同时处理一个任务的不同部分,然后通过应用将它们的输出聚合起来。这种并行化工作流主要有两种形式:

分片:将任务分解为并行运行的独立子任务。

投票:多次运行同一个任务以获得多样化的输出。

有效的。对于具有多个考量的复杂任务,如果每个考量都由一个单独的 LLM 调用来处理,LLM 通常表现得更好。就是何时运用:当分割的子任务可以并行化以提高速度,或者当需要多个视角或尝试以获得更高置信度的结果时,并行化

4.5 工作流:编排器-工作者

在编排器-工作者工作流中,一个中心的"编排器" LLM 动态地分解任务,将其委托给"工作者" LLM,并综合它们的结果。

由编排器根据具体输入决定的。就是何时应用:此工作流非常适合那些你无法预测所需子任务的复杂任务(例如,在编码中,需更改的文件数量以及每个文件中更改的性质很可能取决于具体任务)。与并行化的关键区别在于其灵活性——子任务不是预定义的,而

4.6 工作流:评估器-优化器

在评估器-优化器工作流中,一个 LLM 调用生成响应,而另一个在循环中提供评估和反馈。

何时使用:当存在清晰的评估标准,并且迭代改进能提供可衡量价值时,此工作流特别有效。一个好的应用场景通常有两个迹象:首先,当人类阐明他们的反馈时,LLM 的响应可以得到明显改善;其次,LLM 本身也能够提供此类反馈。

4.7 智能体

随着 LLM 在理解复杂输入、进行推理和规划、可靠地使用器具以及从错误中恢复等关键能力上的成熟,智能体正在生产环境中崭露头角。

智能体的工作始于人类用户的命令或互动式讨论。任务明确后,智能体便独立进行规划和管理,并可能返回向人类寻求更多信息或判断。在执行过程中,至关重要的是,智能体在每一步都要从环境中获得"地面实况"(如应用调用结果或代码执行结果)来评估其进展。

智能体的实现通常很简单:它们通常只是一个在循环中根据环境反馈使用器具的 LLM。因此,清晰而周到地设计工具集及其文档至关重要。

何时运用智能体:智能体可用于开放式问题,这些挑战的步骤数量难以或不可能预测,也无法硬编码固定路径。LLM 可能会运行多轮,你必须对其决策有一定程度的信任。智能体的自主性使其成为在受信任环境中扩展任务的理想选择。

智能体的自主性意味着更高的成本和潜在的复合错误。我们建议在沙盒环境中进行广泛测试,并配备适当的防护机制。

5.组合与定制这些模式

这些构建块并非一成不变的处方。它们是开发者可以根据不同用例进行塑造和组合的常见模式。成功的关键在于衡量性能并迭代实现。再次强调:只有在能明确改善结果时,才应考虑增加复杂性。

6.总结

在 LLM 领域取得成功,关键不在于构建最困难的架构,而在于为你的需求构建正确的框架。从简单的提示开始,利用全面的评估来优化它们,只有在更简单的解决方案力不从心时,才添加多步智能体体系。

在实施智能体时,我们努力遵循三个核心原则:

  1. 保持智能体设计的简洁性。

  2. 依据明确展示智能体的规划步骤来优先考虑透明度。

  3. 通过详尽的应用文档和测试,精心打造你的智能体-计算机接口(ACI)。

框架可以帮你快速入门,但在转向生产环境时,不要犹豫,减少抽象层,用基本组件进行构建。遵循这些原则,你就能创造出不仅强大,而且可靠、可维护并受用户信任的智能体。


附录 1:实践中的智能体

我们与客户的合作揭示了 AI 智能体在两个特别有前景的应用场景。

A. 客户支持

客户拥护将熟悉的聊天机器人界面与经过工具集成增强的功能相结合。这是一个天然适合更开放式智能体的领域,因为:

B. 编码智能体

软件开发领域已展示出 LLM 功能的巨大潜力,其能力从代码补全发展到自主解决问题。智能体在这里特殊有效,因为:

附录 2:为你的软件进行提示工程

无论你构建哪种智能体系统,工具都可能是其重要组成部分。精心设计的工具定义和规范,应该得到与你的整体提示同等程度的关注。

我们的工具格式建议如下:

  • 给模型足够的"思考"空间,在它把自己写进死胡同之前。

  • 保持格式接近于模型在互联网上自然看到的文本。

  • 确保没有格式"开销",例如必须精确计算数千行代码,或对它写的任何代码进行字符串转义。

一个经验法则是:思考一下我们在人机交互界面上投入了多少精力,然后计划在创建好的智能体-计算机接口时投入同样多的精力。以下是一些如何做到这一点的想法:

  • 如此。一个好的工具定义通常包括用法示例、边界情况、输入格式要求以及与其他工具的清晰界限。就是设身处地为模型着想:根据描述和参数,应用这个工具是否显而易见?如果需要你仔细思考,那么对模型来说可能也

  • 优化参数名称和描述:把这看作是为团队中的初级开发人员编写一个出色的文档字符串。当使用许多相似的工具时,这一点尤其重要。

  • 测试模型如何使用你的工具:在我们的工作台中运行许多示例输入,看看模型会犯什么错误,然后进行迭代。

  • 对你的工具进行防错设计:更改参数,使其更难出错。

http://www.hskmm.com/?act=detail&tid=38707

相关文章:

  • 数字人公司:技术引领的数字人产业革新典范
  • 数字人公司:透视数字人企业生态格局
  • AI|国内GEO优化公司全链路优化
  • 数字人公司|数字人服务商生态全景
  • 高处作业安全 “智能监考”!思通数科 AI 卫士 + 安全帽摄像头杜绝防护违规
  • Java-SE Day5
  • AI|AI优化公司:智能搜索时代的企业增长新引擎
  • Java-SE Day6
  • 注解与反射
  • 2025 铝型材源头厂家最新推荐排行榜:优选企业深度解析,佛山亿生 / 永利坚及新锐品牌选购指南
  • 2025年工业生产发酵罐源头厂家权威推荐榜单:实验室发酵罐/醋酸发酵罐/工厂发酵罐源头厂家精选
  • 2025 年最新充电桩厂家口碑推荐排行榜:技术创新与服务保障双优品牌权威测评电动自行车充电桩/电动汽车充电桩公司推荐
  • Java-SE DAY3
  • 深入解析:C语言内存布局:虚拟地址空间详解
  • 奶奶都能看懂的 C++ —— vector 与迭代器
  • AI|AI优化公司智能GEO优化解决方案
  • Java-SE Day2
  • 2025 年无缝管厂家最新推荐榜,聚焦企业技术实力与市场口碑深度解析
  • 2025 年最新波形护栏厂家推荐排行榜:结合协会测评数据,精选行业优质品牌路侧波/乡村公路/县级公路波形护栏板公司推荐
  • 测试人请查收:金融级系统“三高”挑战下的AI测试工具栈与技术内幕
  • 年度 Demo Day!见证语音 AI 年度场景诞生!丨Convo AIRTE2025
  • 科学数据规模化迁移:Benchling从EAV模型转向JSONB的性能优化实践
  • 2025年10月杭州丝绸购买榜:万事利湖滨步行街店权威排行
  • 2025年10月加拿大海参产品推荐榜:谷得斯特领衔五强对比
  • 2025年10月宠物空气净化器产品推荐:性价比排行与选购攻略
  • Docker 部署 Debian 全流程教程
  • 2025年10月深圳离婚律师推荐榜:五强对比与选择指南
  • 2025 年花岗岩厂家最新推荐榜:覆盖路沿石、火烧板等全品类,结合行业协会测评数据精选优质厂家
  • 2025年10月房产继承律师推荐榜:五强对比与选择指南
  • 2025 年控制柜生产厂家最新推荐排行榜:聚焦换热机组 / 污水处理等领域品牌技术实力与服务能力测评