10 篇博文含有标签「知识库」

知识库过期文档怎么治理：软归档、补写、重定向，而不是一键删除

2026年3月28日 · 阅读需 6 分钟

全栈开发者

我后来不太爱用“清理过期文档”这个说法了，因为它太容易让人误会成一次性的删库动作。真正麻烦的，从来不是把几篇旧文删掉，而是判断它们到底该保留、补写、软归档、重定向，还是彻底退出系统。内容写得越久，这个问题越明显，因为旧文不只是旧文件，它们还是外链入口、搜索结果、系列上下文和历史证据。

内容站、知识库、文档、教程要不要拆系统：先统一内容对象，再决定页面形态

2026年1月21日 · 阅读需 5 分钟

一介布衣

全栈开发者

很多团队一讨论内容系统，第一句就会问“博客、文档、知识库、教程到底要不要拆成四套”。这个问题当然重要，但我现在越来越少把它放在最前面。因为真正会决定后面是不是越来越乱的，通常不是页面长什么样，而是同一份内容进入系统时，到底有没有一个稳定身份。

AI 团队统一 Prompt、工具、知识和评测：版本号、发布流和回滚点怎么设计

2025年12月28日 · 阅读需 2 分钟

一介布衣

全栈开发者

组织真正开始提效，通常不是因为又接了一个新模型，而是 Prompt、工具、知识和评测终于共享了一套版本和发布语言。

一次向量库参数调整带来的召回变化

2025年10月22日 · 阅读需 4 分钟

一介布衣

全栈开发者

补档说明：本文属于「AI 工程落地周记」系列，计划发布时间为 2025-10-22 09:10。当前先保留为草稿，后续补充真实案例、代码片段和复盘细节后再发布。

有一次我们为了把检索时延压下来，动了向量库的一组参数。改动本身不大，甚至可以说很“合理”：

降一点搜索深度
控一点候选数
让查询更快一点

结果上线后最先变化的不是延迟，而是答案味道。
用户不会告诉你“召回率下降了”，他们只会说：

怎么最近更容易答偏了
怎么有些问题又像没看文档一样

后来追回去才发现，这次参数调整表面上节省了一点查询成本，实际上悄悄改掉了检索质量的下限。

一次 RAG 检索命中率异常排查

2025年3月8日 · 阅读需 3 分钟

一介布衣

全栈开发者

这次排查很典型：业务方反馈“最近知识库回答突然变差”，但表面上看系统并没有报错，模型也没换，接口响应时间甚至还是正常的。真正的问题出在一个很容易被忽略的指标上，检索命中率突然掉了一截。

一开始大家本能地怀疑 Prompt、怀疑模型、怀疑重排，但继续查下去才发现，问题不是最后生成阶段，而是索引更新后，一部分文档的元数据缺失，导致相关片段虽然被召回了，却没有排进最终候选。

Chunk、召回、重排，RAG 最容易被忽略的顺序问题

2025年2月7日 · 阅读需 7 分钟

一介布衣

全栈开发者

补档说明：本文属于「AI 工程落地周记」系列，计划发布时间为 2025-02-07 10:20。当前先保留为草稿，后续补充真实案例、代码片段和复盘细节后再发布。

很多团队在做 RAG 优化时，容易把问题切成几个独立模块来看：Chunk 怎么切、检索怎么召回、重排怎么加、最后模型怎么答。表面上看这很合理，因为技术栈确实也是这么拆开的。但真正调过一轮系统之后就会发现，这几个环节并不是并列关系，它们是串联关系，而且前一个环节的决策会强烈限制后一个环节的上限。

也就是说，很多 RAG 项目效果不好，不是某一个组件单独弱，而是顺序没想清楚：一开始切分就把信息结构破坏了，后面再怎么改召回和重排，都只能在一堆不完整片段里做“最优选择”。

所以我现在更在意的是这条链路的顺序：先怎么切，再怎么召，再怎么排，最后才轮到模型组织答案。

做企业知识库前，我先回答这 7 个问题

2025年2月3日 · 阅读需 6 分钟

一介布衣

全栈开发者

补档说明：本文属于「AI 工程落地周记」系列，计划发布时间为 2025-02-03 20:15。当前先保留为草稿，后续补充真实案例、代码片段和复盘细节后再发布。

企业知识库是过去一年我见过最多的 AI 落地入口之一。几乎每个团队在讨论 AI 能做什么的时候，都会很快想到它：把文档喂进去、把制度接进去、把 FAQ 接进去，然后做一个“问什么答什么”的系统。这个方向当然成立，但也正因为看起来太成立了，大家很容易低估它背后的难度。

我现在一听到“我们想做一个企业知识库”，脑子里不会先出现模型，也不会先出现向量库，而是先出现七个问题。只要其中有几项答不清楚，我就不会建议直接开工。因为很多知识库项目，不是死在技术实现上，而是死在一开始的问题定义就不清楚。

RAG 不是银弹：哪些场景我宁可不用检索增强

2025年1月16日 · 阅读需 7 分钟

一介布衣

全栈开发者

补档说明：本文属于「AI 工程落地周记」系列，计划发布时间为 2025-01-16 14:30。当前先保留为草稿，后续补充真实案例、代码片段和复盘细节后再发布。

过去一年，RAG 几乎成了大模型落地的标准答案。只要有人问“模型回答不准怎么办”，大家第一反应往往就是“上 RAG”。这条路线当然没有错，很多知识型场景确实该这么做。但我越来越警惕另一种倾向：把 RAG 变成条件反射，仿佛只要做 AI 问答，前面就必须先接一个向量库。

现实没有这么简单。RAG 不是一个按钮，而是一整套系统：文档清洗、切分、索引、召回、重排、上下文拼装、引用展示、评估和回放。只要其中一个环节没做好，最后用户看到的就不是“更智能”，而是“更复杂且更不稳定”。

所以我现在会先问：这件事真的需要检索增强吗？如果不需要，硬上 RAG 不仅没有收益，反而会把系统搞重。

RAG 流水线设计笔记

2023年11月21日 · 阅读需 2 分钟

一介布衣

全栈开发者

RAG 在 2023 年越来越热，但真正落地后就会发现，它从来不是“把文档丢进向量库”这么简单。一个像样的 RAG 系统，本质上是一条检索与生成协同的流水线。

向量数据库与 RAG 的基础认知

2023年5月16日 · 阅读需 2 分钟

一介布衣

全栈开发者

当 2023 年大家真正把大模型往业务里接时，很快就会撞上一堵墙：模型很强，但它并不知道你公司的资料、文档、规则和业务上下文。