我希望用最直白的方式,让大家理解这四种常见的模式,并且真实商业落地和你想的可能完全相反。
模式讲解
第一种,工作流LLM
这种方式最直观,就是在你原有的工作流上插入Agent,替换掉原来代码做不了,必须人做的事请,你可以想象一条流水线上原来有三个工人,现在变成了三个机器人。
第二种,RAG
这种可能不算一种模式,更多的算一种手段,承接上面的流水线,这三个机器人有些内容是不知道的,所以你需要给他一个工作手册,让机器人自己去查这个工作手册,这个工作手册就是RAG的资料库,查工作手册的内容就是RAG
第三种,AI Agent
还以流水线为例,这个时候,我不需要三个机器人了,我只需要一个机器人。而且我只要告诉他流水线今天生产什么,他就完全理解,自己去调整产险,更新物流,控制产线生产,给到你最终的产品。好的,你有了一个负责的厂长,还能自己生产。
第四种,Agentic AI
承接流水线,继上面你有了一个AI Agent(一个厂长)之后,你又开发了一个AI AGent负责销售,一个AI Agent负责采购等等等,这些AI Agent互相通信,组成了一个团队,这就是Agentic AI,对你来说,作者简介赚钱即可。
商业落地
当你听到第四种的时候是不是觉得牛逼极了。但现实是,真实商业落地最多的是第一种。
其实所有问题根本原因就是“大模型不确定性”
抛开上面设计模式,我们先来回顾下,目前你能用到的大模型,大部分属于对话式,不管是生文、生图、生声音、生视频等等吧,这种方式其实就是第四种的垂直变体,非常强大,非常吸睛,但是有一个问题,你生成的内容永远是模糊的,永远不是和你的真实需求100%匹配的,这就是大模型的不确定性。
所以在类似于上面提到的生文、生图、生声音、生视频这些领域,非常好,因为本来这些领域就没有对错的判断,只有主观的好坏。但是在真实的商业世界里面,这种“模糊”是不允许的,你不可能算100笔账,其中就有一笔错的,罗列100个数据,其中有一个数据变了一个数字(真实经历),这种“模糊”会产生很多惊喜,但是在真实的企业、事业单位、政府等等的项目落地中,这种“模糊”是要了命的问题,一次也不行。
所以,一个反直觉的现实是“大模型用的越少,越是好的Agent”。
真实案例
A公司服务很多中小企业,需要月底之前收集各个公司上传来的数据,入库进行后续的操作。这里存在的问题是,A公司服务的企业仅仅是在一个微信群里,A公司的客户大部分是传统行业,他们不可能为了A公司去熟悉一个系统或者学习一个流程,因为A公司不做,多是的BCDEF公司在等着,所以对于客户来说,最简单的方式,就是将文件扔到微信群,A公司的人自己手动处理,并且注意,各个公司虽然都提供数据,但是模版和样式也并不相同。
A公司存在的问题:
A公司是没有谈判筹码的,不可能让客户做任何改变,所以要解决的是A公司内部的问题。
目前的问题是,因为客户给的数据格式不同、提交的时间不同,所以最少需要一个人,月底前几天,只做一件事,在群里等客户的文件,收到后人工打开文件、整理数据、录入系统。并且这个操作涉及大量数据的复制粘贴,仍然存在人工错误问题。
这是典型的,没有技术含量,但是还需要一个人的岗位。
各位也可以考虑下,自己公司是不是存在大量这样的岗位。
Agent落地解决方案:
所以对于这种场景,对A公司来说最优化的解决方案:
1、存在一个系统定时扫描微信群,获取最新的用户数据
2、根据发送用户的名称,对应上内部系统对应的公司名称,绑定数据和公司关系
3、自动解读文件,梳理出符合内部系统需求的数据
4、调用内部系统接口,录入数据
5、每月最后一天,自动统计还未上传数据客户,自动微信提醒
6、月底最后一天,整理工作统计,发送给公司内部管理者,线下对接可能存在问题的客户
这一套走下来,这个需求场景不再需要人的参与,既解放了人,不再进行无聊的重复操作,又极大地提高了数据的准确性,几乎100%。
技术分析:
确定了落地方案,我们再来讨论技术实现
1、读取电脑版微信中的信息,这个不算难事,并且电脑端的文件是保存在你自己电脑的,所以可以直接获取.
2、调用内部接口,上传数据,代码实现
3、统计数据,代码实现
4、发送微信信息,代码实现
5、对应用户名称和公司,代码实现
所以分析来分析去,只有一个读取数据和解析数据是需要借助大模型的,那这里就是一个Agent,为什么这里代码不能实现呢?因为不规则,没有确定边界。所有原来代码实现的大前提是确认流程、确认规则,不管你有多少流程,多少规则,他都是个有限元问题。
但在这一步,规则不同、时间不同,只有大模型能解决这种模糊的无限元问题。
在这一步,Agent接收传入文件,解析文件数据,根据我们的规则梳理出统一的数据格式,直接调用接口上传。当然在这里面处理解析数据外,还存在一个数据验证,和一个验证的Agent需要保证数据的准确性。
所以,纵观整个过程,其实几乎不涉及到什么艰深的算法问题,有的更多的是需求分析、任务拆解、Agent原子化的思考过程。
