17 篇博文含有标签「RAG」

RAG 回答里的引用和 grounding 风格

2023年11月17日 · 阅读需 2 分钟

全栈开发者

引用与 grounding 风格这件事在 2023 年开始越来越频繁地进入真实项目，但很多团队一开始只看到表面收益，没有先把边界收住。只要模型回答看起来很自信，但用户根本不知道依据来自哪里，问题就会很快从“一个小体验瑕疵”变成系统性的维护成本。

2023年11月12日 · 阅读需 3 分钟

全栈开发者

embedding 模型切换成本这件事在 2023 年开始越来越频繁地进入真实项目，但很多团队一开始只看到表面收益，没有先把边界收住。只要只盯着单点评测结果，忽略了索引重建和线上切换的系统代价，问题就会很快从“一个小体验瑕疵”变成系统性的维护成本。

2023年11月8日 · 阅读需 3 分钟

全栈开发者

rerank 阶段这件事在 2023 年开始越来越频繁地进入真实项目，但很多团队一开始只看到表面收益，没有先把边界收住。只要初始召回虽然覆盖到了答案，但排序顺序不对，模型看到的上下文依然不够好，问题就会很快从“一个小体验瑕疵”变成系统性的维护成本。

2023年11月4日 · 阅读需 2 分钟

全栈开发者

query rewrite 这件事在 2023 年开始越来越频繁地进入真实项目，但很多团队一开始只看到表面收益，没有先把边界收住。只要原始问题太口语或太短，检索阶段根本抓不到真正意图，问题就会很快从“一个小体验瑕疵”变成系统性的维护成本。

2023年5月20日 · 阅读需 2 分钟

全栈开发者

metadata 过滤设计这件事在 2023 年开始越来越频繁地进入真实项目，但很多团队一开始只看到表面收益，没有先把边界收住。只要字段命名和过滤粒度不一致，导致向量召回只能靠全文语义硬扛，问题就会很快从“一个小体验瑕疵”变成系统性的维护成本。

2023年5月16日 · 阅读需 2 分钟

全栈开发者

当 2023 年大家真正把大模型往业务里接时，很快就会撞上一堵墙：模型很强，但它并不知道你公司的资料、文档、规则和业务上下文。

2023年5月10日 · 阅读需 3 分钟

全栈开发者

chunk overlap 这件事在 2023 年开始越来越频繁地进入真实项目，但很多团队一开始只看到表面收益，没有先把边界收住。只要重叠太少时语义会断，重叠太多时索引体积和噪音一起膨胀，问题就会很快从“一个小体验瑕疵”变成系统性的维护成本。