当前位置：首页 > news >正文

RAG is really dead? 大模型和知识之间的桥梁没了？ - spader

news 2025/9/29 10:52:52

作者：SpaderMan

从 RAG 到上下文工程：理性思考 AI 应用开发，以交付业务结果为目标

最近，Latent Space 播客发布了一期标题为["RAG 已死，上下文工程为王"](https://www.latent.space/p/chroma ""RAG 已死，上下文工程为王"")的访谈，其中开源向量数据库 Chroma 的创始人 Jeff Huber 的观点引发了广泛讨论。这个观点触及了一个核心问题：我们是否真的理解自己在构建什么？

理解 RAG：概念与争议

RAG（Retrieval Augmented Generation，检索增强生成）是当前 AI 应用的主流技术架构。其核心思想是：当大语言模型需要回答问题时，先从外部知识库检索相关信息，将这些信息加入到提示词中，最后生成答案。

这个架构解决了大语言模型（LLM）的两个固有问题：知识的时效性和准确性。模型不再依赖训练时的静态知识，而是能够动态获取最新、最相关的信息。

然而，Jeff Huber 对"RAG"这个术语的观点值得我们思考：

"We never use the term RAG. I hate the term RAG... Are three concepts put together into one thing? Like, that's just really confusing."

他的核心观点是：RAG 这个缩写将检索（Retrieval）、增强（Augmented）、生成（Generation）三个独立且复杂的环节简单组合到了一起。这种"概念打包"带来的副作用使许多开发者误认为搭建了向量检索就算实现了 RAG，而忽略了每个环节都需要的精心设计和优化。

上下文工程（Context Engineering）的本质

Jeff Huber 提出的上下文工程定义：

"Context engineering is the job of figuring out what should be in the context window for any given LLM generation step."

上下文工程关注的核心问题是：在有限的上下文窗口中，如何选择和组织最相关的信息，以获得最佳的生成效果。

这个概念的提出基于一个重要发现——上下文腐烂（Context Rot）。Chroma 的研究表明，大语言模型（LLM）的性能并非随上下文长度线性提升。相反，当上下文包含过多信息时，模型的注意力会分散，推理能力会下降。即使是拥有百万 token 窗口的模型，最佳性能往往出现在 2000-5000 tokens 的范围内。

这个发现颠覆了"信息越多越好"的直觉。上下文工程的核心挑战就在于此：如何在信息充分性和信息过载之间找到最佳平衡点。

RAG 与上下文工程：对立还是互补

表面上看，RAG 和上下文工程似乎是对立的概念。但深入分析后，我们认为它们代表了同一问题的不同层次：

RAG 是架构层面的解决方案。它定义了一个清晰的系统结构：外部知识库、检索机制、生成模型。这个架构本身是合理且有效的。

上下文工程是实现层面的优化方法论。它不否定 RAG 架构，而是深化了对"增强"环节的理解。当我们的关注点从'如何检索信息'转向'如何组织信息'时，实际上是在做更精细的工程优化。

这种关系类似于"算法"与"工程"的关系。算法提供理论框架，工程关注实际效果。RAG 告诉我们"要检索"，上下文工程告诉我们"如何更好地利用检索结果"。

超越概念之争

这场讨论的价值不在于判定 RAG 或上下文工程孰优孰劣，而在于它促使我们重新思考 AI 应用开发的方法论。

第一，警惕概念简化。当复杂系统被简化为流行词汇时，实践者容易陷入表面理解。真正的工程能力体现在对每个组件的深入理解和精细优化。

第二，重视工程思维。Jeff 反复强调要让 AI 开发"更像工程，更少像炼金术"。这意味着建立可测量的目标、可重复的流程、可验证的改进。

第三，平衡理论与实践。RAG 提供了有用的概念框架，上下文工程强调了实践优化。两者结合才能构建真正可用的系统。

结语: 从概念验证到工程优化

"RAG 已死"更像是一种警示，其真正含义是：粗糙的、教条的 RAG 实践需要进化。上下文工程不是要替代 RAG，而是让 RAG 变得更加精细和有效。

无论是 RAG 还是上下文工程，本质都是在有限的计算资源下，为 AI 提供最有用的信息。名词会变，但工程师解决问题的使命不变。真正的进步，是让每一个 token 都有价值，让每一次推理都更精准。

这场讨论的最大意义在于：它提醒我们，AI 应用正在从"能跑"走向"跑得好"，从概念验证走向工程优化。这是整个行业走向成熟的标志。

关于 Spader.AI

Spader.AI，北京与星以舟智能科技有限公司，是一支专注于人工智能与云计算技术的创新团队，致力于推动前沿技术的发展和实际应用。
我们构建高性能、可扩展的 AI 基础设施，提供灵活、安全的智能解决方案，帮助企业轻松应对复杂计算任务，加速 AI 应用落地。我们相信，智能技术应当开放、可及，并真正创造价值。因此，我们不断优化算法与架构，以提升算力效率、降低使用门槛，让人工智能成为推动产业升级的重要驱动力。

如果您对高性价比算力、大模型训练训练及推理以及相关业务场景的技术感兴趣，或者对本篇分享中提到的某些观点有自己的见解希望讨论，扫码秒加 SpaderMan 客服，SpaderMan 会带您入群，和各领域技术大佬共同探讨最前沿的 AI 技术。