RAG 知识库召回不准，我从切片、向量、重排这三处调了一遍（企业文档问答实录）-二趣网

做企业文档问答的都知道，模型本身不是瓶颈，召回才是。我给公司一堆产品手册搭了个问答助手，第一版答得稀烂——明明文档里写了的东西，它说"未找到相关内容"。排查下来，问题全在召回环节。记一下我调的三个地方。

第一版我图省事用了默认的大块切分，一段几百字。结果一个 chunk 里塞了好几个主题，向量化之后语义被稀释，检索时匹配不上。改成按小节切、控制在两三百字、相邻块留点重叠之后，召回立刻好转。

经验：宁可切细一点多召回几块，也别切太粗。太粗是"找不到"，太细顶多是"多带点无关的"，后者好处理。

中文文档用了个偏英文的 embedding，相似度算出来一团糟。换成对中文友好的向量模型后，同义改写的问题也能命中了（用户问"咋退款"，文档写的是"退货流程"，之前完全匹配不到）。

向量召回粗筛出 Top10 之后，再用一个重排模型按"和问题的相关度"重新排序，取前 3 喂给大模型。这一步把"召回到了但排在第 8 位、被截断扔掉"的情况救回来不少。

我是直接在讯飞星辰里搭的知识库，切片参数、向量、重排它都能在界面里调，省了我自己搭检索链路。缺点也有：参数得自己一组组试，没有银弹；测评用例也得自己攒，不然你不知道这次改到底是变好还是变差了。

调召回这事没什么玄学，就是切片→向量→重排一处处量化对比。我把我那套测试问题集和参数放评论区了。你们的知识库召回率现在大概多少？

企业官网建设流程全解析