RAG 知识库召回不准,我从切片、向量、重排这三处调了一遍(企业文档问答实录)
2026/6/5 22:25:21 网站建设 项目流程

做企业文档问答的都知道,模型本身不是瓶颈,召回才是。我给公司一堆产品手册搭了个问答助手,第一版答得稀烂——明明文档里写了的东西,它说"未找到相关内容"。排查下来,问题全在召回环节。记一下我调的三个地方。

1. 切片粒度(chunk)

第一版我图省事用了默认的大块切分,一段几百字。结果一个 chunk 里塞了好几个主题,向量化之后语义被稀释,检索时匹配不上。改成按小节切、控制在两三百字、相邻块留点重叠之后,召回立刻好转。

经验:宁可切细一点多召回几块,也别切太粗。太粗是"找不到",太细顶多是"多带点无关的",后者好处理。

2. 向量模型对不对路

中文文档用了个偏英文的 embedding,相似度算出来一团糟。换成对中文友好的向量模型后,同义改写的问题也能命中了(用户问"咋退款",文档写的是"退货流程",之前完全匹配不到)。

3. 加一层重排(rerank)

向量召回粗筛出 Top10 之后,再用一个重排模型按"和问题的相关度"重新排序,取前 3 喂给大模型。这一步把"召回到了但排在第 8 位、被截断扔掉"的情况救回来不少。

我是直接在讯飞星辰里搭的知识库,切片参数、向量、重排它都能在界面里调,省了我自己搭检索链路。缺点也有:参数得自己一组组试,没有银弹;测评用例也得自己攒,不然你不知道这次改到底是变好还是变差了。

调召回这事没什么玄学,就是切片→向量→重排一处处量化对比。我把我那套测试问题集和参数放评论区了。你们的知识库召回率现在大概多少?

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询