RAG 知识库

Retrieval Augmented Generation，检索增强生成技术，让 AI 基于特定知识回答问题

简介

RAG（检索增强生成）是一种结合检索和生成的 AI 技术架构。它通过从外部知识库检索相关信息，再将检索结果提供给大模型作为上下文，使大模型能够基于特定知识生成更准确的回答。

核心工作流程

企业文档 → Embedding 向量化 → 向量数据库存储
                                     ↓
用户提问 → Embedding 向量化 → 检索相似文档 → 大模型综合回答

关键技术组件

1. 文档处理管道

文档加载：支持 PDF、Word、Excel、PPT 等多种格式
文本切分：按语义或固定长度切分文档
元数据提取：标题、作者、日期等信息

2. Embedding 向量化

将文本转换为高维向量
语义相似的文本在向量空间中距离相近
支持多种 Embedding 模型

3. 向量数据库

高效存储海量向量
支持近似最近邻（ANN）检索
可扩展的索引结构

4. 检索策略

相似度检索
混合检索（关键词 + 向量）
重排序机制
结果融合

不同素材中的观点

来自 2026-04-29-yupi-ai-guide-core-concepts：

RAG 是检索 + 生成两阶段技术
利用外部知识库给 AI 补充知识
回答更准确，减少幻觉
16 个核心概念之一

来自 2026-04-29-yupi-ai-guide-programming-tech：

构建企业自己的问答系统或客服
基于企业真实数据作答，更准确贴合实际
是 AI 编程开发的四大核心业务领域之一

来自 2026-05-17-ai-pm-interview-claude-workflow：

个人也应该给自己建RAG知识库，而不只是帮公司做。简历是第一份语料、项目复盘文档是第二份、面试转录是第三份、笔记是第四份
当这些语料持续喂给Claude，它从通用助手变成个人面试教练——知道你做过什么项目、踩过什么坑、答崩过哪道题
“为什么选RAG不选微调”是AI PM面试中被问频率最高的题之一（38场面试中被问5次以上），说明RAG vs 微调的选型判断是行业共识级考点
搭建个人AI教练的成本是0元，核心是持续积累结构化语料

来自 2026-05-17-pm-ai-knowledge-base-design-practice：

本地RAG已经足以验证“文档可对话”的核心价值，但一旦要满足手机访问和多人协作，就必须从单机实验升级为云端产品
知识库产品的关键不只是“检索到段落”，而是把语义理解能力接入文件管理、权限、上传下载和多端访问等完整产品流程
作者用Ollama + Dify + 本地模型做了原型验证，最终选择带REST API和Docker部署能力的Yuxi，体现了RAG从技术方案走向产品化落地的路径
在20位知识工作者的非正式调研中，87%经常找不到已存文档内容、63%会因为找不到而重复整理资料，这说明RAG知识库首先解决的是知识可达性与复用率问题

来自 2026-05-18-woshipm-ai-knowledge-management-design-practice：

这篇素材进一步把RAG知识库的价值从“回答问题”推进到“重建知识可达性”：用户真正痛的不是没存资料，而是资料命名缺乏语义、导致无法按意图找回
作者先用Ollama + Dify + 本地模型验证了RAG对文档问答的可行性，但很快暴露出单机方案无法支撑手机访问、多人共享和免安装使用，说明RAG产品的真正门槛在交付形态而不只是检索效果
从产品化视角看，RAG系统必须接入文件上传下载、用户认证、权限治理、移动端体验和API能力，才能从“桌面盆栽”变成组织级知识基础设施
Yuxi之所以胜出，不是因为概念上更先进，而是因为REST API、流式输出、Docker部署和知识图谱/向量检索结合，更适合把RAG能力嵌入完整业务流程

学习重点（面试高频考点）

1. 向量数据库选型

Milvus：开源高性能向量数据库
PGVector：PostgreSQL 向量扩展
Chroma：轻量级本地向量库
Pinecone：云原生向量数据库服务

2. 文档管道优化

抽取：不同格式文档的解析策略
转换：文本清洗和标准化
加载：批量导入和增量更新

3. 索引构建策略

索引类型选择
分片和分区
性能调优参数

4. 查询优化方法

查询重写
多轮检索
结果排序
上下文压缩

实用信息

典型应用场景

企业内部知识库问答
客服机器人
文档智能检索
法律/医疗专业问答
产品手册查询

开发工具

Apache Tika：强大的文件解析器
LangChain4j：Java RAG 框架
Spring AI：Spring 生态 RAG 支持
Dify：低代码 RAG 平台

个人知识库

探索

RAG 知识库

RAG 知识库

简介

核心工作流程

关键技术组件

1. 文档处理管道

2. Embedding 向量化

3. 向量数据库

4. 检索策略

不同素材中的观点

学习重点（面试高频考点）

1. 向量数据库选型

2. 文档管道优化

3. 索引构建策略

4. 查询优化方法

实用信息

典型应用场景

开发工具

相关页面

关系图谱

快速导航

目录

反向链接