RAG 知识库

Retrieval Augmented Generation,检索增强生成技术,让 AI 基于特定知识回答问题

简介

RAG(检索增强生成)是一种结合检索和生成的 AI 技术架构。它通过从外部知识库检索相关信息,再将检索结果提供给大模型作为上下文,使大模型能够基于特定知识生成更准确的回答。

核心工作流程

企业文档 → Embedding 向量化 → 向量数据库存储
                                     ↓
用户提问 → Embedding 向量化 → 检索相似文档 → 大模型综合回答

关键技术组件

1. 文档处理管道

  • 文档加载:支持 PDF、Word、Excel、PPT 等多种格式
  • 文本切分:按语义或固定长度切分文档
  • 元数据提取:标题、作者、日期等信息

2. Embedding 向量化

  • 将文本转换为高维向量
  • 语义相似的文本在向量空间中距离相近
  • 支持多种 Embedding 模型

3. 向量数据库

  • 高效存储海量向量
  • 支持近似最近邻(ANN)检索
  • 可扩展的索引结构

4. 检索策略

  • 相似度检索
  • 混合检索(关键词 + 向量)
  • 重排序机制
  • 结果融合

不同素材中的观点

来自 2026-04-29-yupi-ai-guide-core-concepts

  • RAG 是检索 + 生成两阶段技术
  • 利用外部知识库给 AI 补充知识
  • 回答更准确,减少幻觉
  • 16 个核心概念之一

来自 2026-04-29-yupi-ai-guide-programming-tech

  • 构建企业自己的问答系统或客服
  • 基于企业真实数据作答,更准确贴合实际
  • 是 AI 编程开发的四大核心业务领域之一

来自 2026-05-17-ai-pm-interview-claude-workflow

  • 个人也应该给自己建RAG知识库,而不只是帮公司做。简历是第一份语料、项目复盘文档是第二份、面试转录是第三份、笔记是第四份
  • 当这些语料持续喂给Claude,它从通用助手变成个人面试教练——知道你做过什么项目、踩过什么坑、答崩过哪道题
  • “为什么选RAG不选微调”是AI PM面试中被问频率最高的题之一(38场面试中被问5次以上),说明RAG vs 微调的选型判断是行业共识级考点
  • 搭建个人AI教练的成本是0元,核心是持续积累结构化语料

来自 2026-05-17-pm-ai-knowledge-base-design-practice

  • 本地RAG已经足以验证“文档可对话”的核心价值,但一旦要满足手机访问和多人协作,就必须从单机实验升级为云端产品
  • 知识库产品的关键不只是“检索到段落”,而是把语义理解能力接入文件管理、权限、上传下载和多端访问等完整产品流程
  • 作者用Ollama + Dify + 本地模型做了原型验证,最终选择带REST API和Docker部署能力的Yuxi,体现了RAG从技术方案走向产品化落地的路径
  • 在20位知识工作者的非正式调研中,87%经常找不到已存文档内容、63%会因为找不到而重复整理资料,这说明RAG知识库首先解决的是知识可达性与复用率问题

来自 2026-05-18-woshipm-ai-knowledge-management-design-practice

  • 这篇素材进一步把RAG知识库的价值从“回答问题”推进到“重建知识可达性”:用户真正痛的不是没存资料,而是资料命名缺乏语义、导致无法按意图找回
  • 作者先用Ollama + Dify + 本地模型验证了RAG对文档问答的可行性,但很快暴露出单机方案无法支撑手机访问、多人共享和免安装使用,说明RAG产品的真正门槛在交付形态而不只是检索效果
  • 从产品化视角看,RAG系统必须接入文件上传下载、用户认证、权限治理、移动端体验和API能力,才能从“桌面盆栽”变成组织级知识基础设施
  • Yuxi之所以胜出,不是因为概念上更先进,而是因为REST API、流式输出、Docker部署和知识图谱/向量检索结合,更适合把RAG能力嵌入完整业务流程

学习重点(面试高频考点)

1. 向量数据库选型

  • Milvus:开源高性能向量数据库
  • PGVector:PostgreSQL 向量扩展
  • Chroma:轻量级本地向量库
  • Pinecone:云原生向量数据库服务

2. 文档管道优化

  • 抽取:不同格式文档的解析策略
  • 转换:文本清洗和标准化
  • 加载:批量导入和增量更新

3. 索引构建策略

  • 索引类型选择
  • 分片和分区
  • 性能调优参数

4. 查询优化方法

  • 查询重写
  • 多轮检索
  • 结果排序
  • 上下文压缩

实用信息

典型应用场景

  • 企业内部知识库问答
  • 客服机器人
  • 文档智能检索
  • 法律/医疗专业问答
  • 产品手册查询

开发工具

  • Apache Tika:强大的文件解析器
  • LangChain4j:Java RAG 框架
  • Spring AI:Spring 生态 RAG 支持
  • Dify:低代码 RAG 平台

相关页面