向量数据库与 RAG 的基础认知

2023年5月16日 · 阅读需 2 分钟

全栈开发者

当 2023 年大家真正把大模型往业务里接时，很快就会撞上一堵墙：模型很强，但它并不知道你公司的资料、文档、规则和业务上下文。

RAG 开始火，就是因为它正好补这块短板。它本质上不是让模型“更聪明”，而是让模型在回答前先拿到更相关的外部知识。

为什么要先理解检索，再理解生成

RAG 这个词很容易让人把注意力放在“生成”上，但真正决定效果的，往往是前面的检索环节。

一条基础链路通常是：

如果检索出来的上下文本身不对，后面的回答大概率也不会好。

传统关键词检索当然有用，但在自然语言问答里，用户表达方式经常和原文不完全一致。向量检索的价值，就是把“语义相近”这件事纳入匹配逻辑。

这也是为什么 2023 年之后，向量数据库一下进入了很多工程团队的视野。

RAG 很有用，但它并不是万能解法。它更适合：

不太适合：

很多人以为难点是“选哪种向量数据库”，其实更难的是：

这些问题决定了 RAG 是能长期维护，还是只能演示。

2023 年 RAG 变热，不是因为它听起来高级，而是因为它确实解决了大模型与私有知识脱节的问题。先把它理解成“检索增强的回答链路”，再往里做工程细化，会更稳。