RAG 知识库
Retrieval Augmented Generation,检索增强生成技术,让 AI 基于特定知识回答问题
简介
RAG(检索增强生成)是一种结合检索和生成的 AI 技术架构。它通过从外部知识库检索相关信息,再将检索结果提供给大模型作为上下文,使大模型能够基于特定知识生成更准确的回答。
核心工作流程
企业文档 → Embedding 向量化 → 向量数据库存储
↓
用户提问 → Embedding 向量化 → 检索相似文档 → 大模型综合回答
关键技术组件
1. 文档处理管道
- 文档加载:支持 PDF、Word、Excel、PPT 等多种格式
- 文本切分:按语义或固定长度切分文档
- 元数据提取:标题、作者、日期等信息
2. Embedding 向量化
- 将文本转换为高维向量
- 语义相似的文本在向量空间中距离相近
- 支持多种 Embedding 模型
3. 向量数据库
- 高效存储海量向量
- 支持近似最近邻(ANN)检索
- 可扩展的索引结构
4. 检索策略
- 相似度检索
- 混合检索(关键词 + 向量)
- 重排序机制
- 结果融合
不同素材中的观点
来自 2026-04-29-yupi-ai-guide-core-concepts:
- RAG 是检索 + 生成两阶段技术
- 利用外部知识库给 AI 补充知识
- 回答更准确,减少幻觉
- 16 个核心概念之一
来自 2026-04-29-yupi-ai-guide-programming-tech:
- 构建企业自己的问答系统或客服
- 基于企业真实数据作答,更准确贴合实际
- 是 AI 编程开发的四大核心业务领域之一
来自 2026-05-17-ai-pm-interview-claude-workflow:
- 个人也应该给自己建RAG知识库,而不只是帮公司做。简历是第一份语料、项目复盘文档是第二份、面试转录是第三份、笔记是第四份
- 当这些语料持续喂给Claude,它从通用助手变成个人面试教练——知道你做过什么项目、踩过什么坑、答崩过哪道题
- “为什么选RAG不选微调”是AI PM面试中被问频率最高的题之一(38场面试中被问5次以上),说明RAG vs 微调的选型判断是行业共识级考点
- 搭建个人AI教练的成本是0元,核心是持续积累结构化语料
来自 2026-05-17-pm-ai-knowledge-base-design-practice:
- 本地RAG已经足以验证“文档可对话”的核心价值,但一旦要满足手机访问和多人协作,就必须从单机实验升级为云端产品
- 知识库产品的关键不只是“检索到段落”,而是把语义理解能力接入文件管理、权限、上传下载和多端访问等完整产品流程
- 作者用Ollama + Dify + 本地模型做了原型验证,最终选择带REST API和Docker部署能力的Yuxi,体现了RAG从技术方案走向产品化落地的路径
- 在20位知识工作者的非正式调研中,87%经常找不到已存文档内容、63%会因为找不到而重复整理资料,这说明RAG知识库首先解决的是知识可达性与复用率问题
来自 2026-05-18-woshipm-ai-knowledge-management-design-practice:
- 这篇素材进一步把RAG知识库的价值从“回答问题”推进到“重建知识可达性”:用户真正痛的不是没存资料,而是资料命名缺乏语义、导致无法按意图找回
- 作者先用Ollama + Dify + 本地模型验证了RAG对文档问答的可行性,但很快暴露出单机方案无法支撑手机访问、多人共享和免安装使用,说明RAG产品的真正门槛在交付形态而不只是检索效果
- 从产品化视角看,RAG系统必须接入文件上传下载、用户认证、权限治理、移动端体验和API能力,才能从“桌面盆栽”变成组织级知识基础设施
- Yuxi之所以胜出,不是因为概念上更先进,而是因为REST API、流式输出、Docker部署和知识图谱/向量检索结合,更适合把RAG能力嵌入完整业务流程
学习重点(面试高频考点)
1. 向量数据库选型
- Milvus:开源高性能向量数据库
- PGVector:PostgreSQL 向量扩展
- Chroma:轻量级本地向量库
- Pinecone:云原生向量数据库服务
2. 文档管道优化
- 抽取:不同格式文档的解析策略
- 转换:文本清洗和标准化
- 加载:批量导入和增量更新
3. 索引构建策略
- 索引类型选择
- 分片和分区
- 性能调优参数
4. 查询优化方法
- 查询重写
- 多轮检索
- 结果排序
- 上下文压缩
实用信息
典型应用场景
- 企业内部知识库问答
- 客服机器人
- 文档智能检索
- 法律/医疗专业问答
- 产品手册查询
开发工具
- Apache Tika:强大的文件解析器
- LangChain4j:Java RAG 框架
- Spring AI:Spring 生态 RAG 支持
- Dify:低代码 RAG 平台