当前位置：首页 > news >正文

LLM 应用开发中的常见模式

news 2025/11/20 17:42:03

以下内容根据AI对话生成，如有雷同，纯属巧合

这是最基本也是最常见的模式。它指的是将多个 LLM 调用、数据处理步骤或工具调用按顺序连接起来，形成一个连贯的工作流。前一个步骤的输出是后一个步骤的输入。

示例：翻译+总结
一个经典的链式调用是先将一段外语文档翻译成中文，再对中文内容进行总结。

链的第一步：输入 = “一段德语文本”，调用 LLMChain_1（提示：“请将以下德语翻译成中文：{input}”）-> 输出 = “中文翻译文本”。
链的第二步：输入 = “中文翻译文本”，调用 LLMChain_2（提示：“请总结以下中文文本的要点：{input}”）-> 输出 = “总结要点”。

这是最强大、最接近“智能”的模式。代理模式将 LLM 视为一个推理引擎（大脑），它来决定为了回答问题需要采取哪些行动（Actions），即调用哪些工具（Tools）。

要解决的问题：LLM 的内部知识可能过时、不专业或无法访问外部世界（如计算、搜索、查询数据库）。
核心思想：“赋予 LLM 使用工具的能力”。让 LLM 自主规划、决策和执行，从而扩展其能力边界。
LangChain 实现：使用 Agent、Tool 和 AgentExecutor。常见的代理类型有 ZERO_SHOT_REACT_DESCRIPTION, CONVERSATIONAL_REACT_DESCRIPTION。
类比：你（LLM）是一个经理，有一个任务要做。你手下有各种专家（工具）：会计师（计算器）、研究员（搜索引擎）、秘书（日历API）。你分析任务（“我需要先知道今天的天气，然后计算一下出行成本”），然后命令相应的专家去执行，最后综合所有结果做出决策。

示例：回答复杂问题

用户问题：“埃隆·马斯克(Elon Musk)最近在推特上发了什么？他提到的公司当前股价是多少？”
代理的工作流程：
1. 思考：要回答这个问题，我需要做两件事：1. 获取马斯克的最新推文。2. 查询相关公司的股价。
2. 行动：调用 google_search_tool，输入查询：“Elon Musk latest tweet”。
3. 观察：获得推文内容，比如是关于 SpaceX 的。
4. 思考：推文是关于 SpaceX 的，但我需要查的是股价。SpaceX 是私有公司，没有股价。可能用户指的是特斯拉(TSLA)？我应该查一下特斯拉的股价。
5. 行动：调用 stock_price_tool，输入：“TSLA”。
6. 观察：获得特斯拉当前股价为 $XYZ。
7. 最终回答：“埃隆·马斯克的最新推文内容是：‘为SpaceX团队感到骄傲！’。这条推文主要提及了SpaceX，但SpaceX是私有公司，无公开股价。如果您感兴趣的话，特斯拉(TSLA)当前的股价是 $XYZ。”

RAG 模式用于解决 LLM 的“知识滞后”和“幻觉”问题。它通过在生成答案前，先从外部知识库（如你的文档、数据库）中检索相关信息，并将这些信息作为上下文提供给 LLM，从而让 LLM 生成更准确、更相关的答案。

要解决的问题：LLM 的内部知识有截止日期，且无法获取非公开的、私有的或特定领域的信息。
核心思想：“先检索，后生成”。为 LLM 提供相关的参考依据，让它“有据可依”地回答问题。
LangChain 实现：使用 Document Loaders, Text Splitters, Vectorstores (Chroma, FAISS), Embeddings, 和 RetrievalQA 链。
类比：开卷考试。LLM 是一个聪明的学生，但它的记忆（闭卷）可能不完整或过时。在考试（回答用户问题）时，允许它先去查阅相关的教科书和笔记（外部知识库），然后基于这些资料组织出最好的答案。

示例：公司内部知识库问答

LLM 本身是无状态的（Stateless），这意味着它默认不会记住之前的对话内容。记忆模式旨在让应用能够在多轮对话中记住之前的交互信息，从而实现连贯的对话。

要解决的问题：LLM 的“金鱼记忆”，无法进行连贯的多轮对话。
核心思想：在应用程序层面维护一个“记忆体”，存储历史对话，并在每次调用 LLM 时自动将其作为上下文注入。
LangChain 实现：使用 ConversationBufferMemory, ConversationSummaryMemory, ConversationBufferWindowMemory 等。
类比：聊天时看聊天记录。每次你回复对方时，都可以看到之前聊过的所有内容，这样你的回复才能贴合上下文。

示例：

用户：“什么是LangChain？” -> AI：（解释LangChain...）
用户：“它用什么语言编写？” -> 如果没有记忆，AI 不知道“它”指代什么。
- 有记忆：记忆体包含了上一轮对话的历史 [Human: 什么是LangChain?, AI: LangChain是一个...的框架]。系统会将记忆和当前问题组合成提示：“之前的对话：...[如上]...\n当前问题：它用什么语言编写？\n回答：”。LLM 就能明白“它”指的是 LangChain，并回答“主要使用Python编写”。

这些模式并非互斥，而是常常组合使用，构建出极其强大的应用：