当前位置: 首页 > news >正文

php本地搭建知识库实现rag遇到的一些问题解决方式

1、向量化的问题,中文的话,使用尽量使用国内的嵌入模型,国外的虽然支持中文,但是还是比不上国内专门针对中文的优化

本地使用ollama 搭建的话 ,我使用的是   quentinz/bge-large-zh-v1.5:latest

 

2、不规则的pdf文件,无法使用pdf插件读取内容问题,我是php 使用 smalot/pdfparser 包的

遇到不规则pdf文件时  使用 Imagick 将pdf 文件  转为图片,再使用多模态模型,读取图片内容

多模态模型使用的是ollama里面的 qwen2.5vl:7b,识别率非常高

 

3、文件的内容主题不突出问题,比如有一份文件叫QQ飞车攻略,但是内容全篇都没有QQ飞车  攻略 这几个字,当用户提问 QQ飞车有什么攻略,向量化搜索完全匹配不上

我是先将整个文件内容 包括文件标题  扔给大模型  让大模型大概总结一下 文本内容,然后作为一个文件块进行向量化 保存

 

4、搜索结果 权重排序不理想问题,往往不相关的文件排在前面

将搜索返回的内容,扔给大模型,让大模型针对问题 和 内容进行 打分排序,分数低的可以过滤排除掉

 

5、用户上下文提问关联问题

让大模型根据用户的历史提问,生成一个完整的新的问题,比如用户第一次提问 介绍一下xxx系统,第二次提问 重点介绍一下财务功能模块

那么让大模型重写后的提问就变成了,重点介绍一下xxx系统的财务功能模块,这样这个问题就能命中xxx系统的文件块

 

6、计算类的问题,这个完全无解

比如用户把很多excel文件都上传知识库,但是每个excel里面的数据,结构都不同,此时用户提问  今年公司的订单数有多少

这个完全无解啊,哦尼酱

http://www.hskmm.com/?act=detail&tid=9458

相关文章:

  • docker操作包括使用docker制作为接口
  • BuildingSystemPlugin使用指南
  • openEuler 24.03 (LTS-SP2)安装mysql5.7.42
  • Trae AI IDE与Gitee MCP深度整合:开启智能协作开发新时代
  • LangChain 入门:从 0 到 1 搞懂 LLM 应用开发框架​
  • [JOI Open 2023] 古代机器 2 / Ancient Machine 2 题解
  • Visual Studio 2022配置fftw第三方库
  • [React] nextjs useSWR导致的死循环,一直重复渲染rerender
  • 使用 Rust 实现的基础的List 和 Watch 机制
  • 解码C语言指针
  • windows下Qt调用fftw库
  • Gitee崛起:国产代码托管平台如何接棒CODING成为开发者新宠
  • flask下的MySQL增查配置
  • AT_agc056_c [AGC056C] 01 Balanced
  • 高效智能(到家服务)管理平台解决方案
  • jenkins如何与shell脚本结合使用
  • 【C++11】深度剖析智能指针 - 教程
  • struct * 初始化和造数据的简洁方式(二叉树,d, *left, *right)(面试)
  • Android抓包
  • 火山引擎多模态数据湖:基于 Daft 与 Lance,构筑 AI 时代数据湖新范式
  • doris窗口函数 LAG()(取上一条)和 LEAD()(取下一条)函数
  • debmirror工具
  • centos7卸载openjdk-java11
  • jenkins的安装和配置
  • 深入解析:【Day 52 】Linux-Jenkins
  • 本土开发者如何选择代码管理工具?Gitee与GitHub深度对比解析
  • MES系统核心组件
  • 易基因:多组学整合分析揭示DNA甲基化与基因组改变在肿瘤进化中的协同驱动机制|Nat Genet/IF29重磅
  • AI 视频模型大比拼(2025年7月版):价格、效果与分辨率
  • 为什么芯片行业需要私有化部署软件?