刚刚，我测试了下，效果超出想像！起个名，叫微智能问答吧，第一上传一个PDF文件做为本地知识库，再配置好deepseek大模型，开始提问：

我真的被自己搭建的大模型+本地知识库的能力惊到了！

RAG 基于 PDF 的问答系统分析

实现了基于 RAG (检索增强生成) 的 PDF 文档问答系统。以下是主要组件的分析：

初始化:

使用 Ollama 提供的大语言模型(默认: deepseek)和嵌入模型(默认: mxbai-embed-large)
设置文本分割器(RecursiveCharacterTextSplitter)
定义了中文提示模板，用于生成简洁的回答
关键方法:
ingest(): 加载PDF、分割文本、过滤元数据，并将嵌入存储到ChromaDB
ask(): 检索相关上下文并使用RAG流程生成答案
clear(): 重置向量存储
特点:
可配置的类似度分数阈值和检索数量
对缺失文档的错误处理
调试日志记录

界面

UI组件:
PDF文档上传器
检索参数调整滑块
带历史记录的聊天界面
清除聊天按钮
会话状态管理:
维护聊天历史和助手实例
处理文件摄取并显示进度指示器
在交互间保留设置
用户体验:
处理时显示思考指示器
显示文件处理时间反馈
对缺失文档显示明确的错误信息

改善提议

错误处理:
为不同类型的PDF解析问题添加更具体的错误处理
思考添加文件大小限制以防止内存问题
性能优化:
为ChromaDB添加缓存以避免重复处理一样文件
思考对大文档使用异步处理
UI增强:
添加聊天历史下载按钮
加入文档预览功能
支持更多文件类型(如Word、Excel等)
RAG改善:
尝试不同的文本分块策略
添加混合搜索(结合语义搜索和关键词搜索)
思考添加来源段落引用功能

该应用程序为基于文档的问答系统提供了坚实的基础，可以轻松扩展更多功能。

文章版权归作者所有，未经允许请勿转载。如内容涉嫌侵权，请在本页底部进入<联系我们>进行举报投诉!

THE END

知识分享

评论共24条

请登录后发表评论

登录注册

只看作者

- 厚远堂唐克铭0
  可以越狱吗
  3个月前回复
  举报
- 想来月亮摸鱼0
  断网可以吗？
  3个月前回复
  举报
- 黄瓜为什么是绿的0
  本地运行无须外网
  3个月前回复
  举报
- 垂绒0
  幻觉，换一个大点的模型就正常了
  3个月前回复
  举报
- 闪电凉凉0
  牛
  3个月前回复
  举报
- 正大帅哥0
  系统反应好慢，不知道怎么惊到你的
  3个月前回复
  举报
- 墨垢0
  收藏了，感谢分享
  3个月前回复
  举报
- 瑀xin-0
  先存入向量数据库，问题不大
  3个月前回复
  举报
- 金凯0
  优秀💪
  3个月前回复
  举报
- WEi楚雨荨醒醒别睡了0
  知识库有几个模型要配置，请问你的嵌入模型用的哪个？deepseek只适合做llm模型吧
  3个月前回复
  举报
- 逍遥未遂0
  💗感谢分享
  3个月前回复
  举报
- 捷0
  我的怎么很差劲，不知道哪里出了问题
  3个月前回复
  举报
- 璐璐小肥羊0
  有些PDF不识别，只能识别少数，知识库结果不理想
  3个月前回复
  举报
- 耳科赵医生0
  一本书几千页的效果如何
  3个月前回复
  举报
- 鱼见·UOMI0
  你用什么搭建的
  3个月前回复
  举报
- 霞霞0
  本地部署一搞一个不吱声，回答内容又慢又蠢……
  3个月前回复
  举报
- 七彩小火柴0
  车成旭为什么是另外两个人的准考号呢？
  3个月前回复
  举报
- 无期迷途0
  最大多大的文档
  3个月前回复
  举报
- 昭仪不emo0
  mxbai-embed-large
  3个月前回复
  举报
- 爱鸦为莺从未怪过你0
  哪会则么简单.先上传1000个文件试试吧，看他还能给你想要的
  3个月前回复
  举报

12 下一页

我真的被自己搭建的大模型+本地知识库的能力惊到了！

RAG 基于 PDF 的问答系统分析

界面

改善提议

请登录后发表评论

《困困兔》无删减免费在线观看全集1080p高清零广告_《困困兔寝室三部曲》完整夸克/迅雷网盘极速下载播放–《困困兔3》从深夜泡面到无声星河——一间大学宿舍直播间如何成为万千孤独灵魂的悬浮锚点

热门视频《bj女团熊猫班全员卸甲》免费观看_《bj女团熊猫班全员卸甲》无删减版 HD 高清在线观看_《bj女团熊猫班全员卸甲》全集免费观看，《bj女团熊猫班全员卸甲》全集在线播放 – 西瓜影视网…

《完全堕落》家人被奇异睡眠笼罩的谜题动漫全集在线观赏-《完全堕落》家人陷入长眠动漫全两季免费观看西瓜视频在线点播-探寻家人沉睡真相动漫双季2025 年最疯动漫！把家人「睡」个遍还不够，这尺度居然能播？

3个方法，教你如何设置 Windows 10/11 自动登录，一键直达桌面

《小舞》3DMAX小舞全集在线播放_小舞3D动画高清完整版免费观看_小舞遇险记3D漫画无删减_1080P超清画质流畅播放-VS影视

美国科幻:《铁血战士:杀戮之王》(2025)【4K超高清SDR中英字幕】免费在线观看播放夸克网盘资源下载《铁血战士:杀戮之王》–穿越千年的狩猎盛宴，重写人类与异星猎手的宿命对决