Skip to content

reranker.py

概述

retrieval/retrieverModules/reranker.py 是对初步宽泛召回(如 BM25 或者是基础稀疏向量检索取回的上百条段落文本)之后,使用深度但小批量(比如 bge-reranker 等交叉编码架构模型)再次逐条比对 query 与文档之间精细相关度的二次高计算成本过滤逻辑重新装配包。 由于对于数学推导逻辑来说,“不”、“非”、“如果”的位置决定了命题真假,双塔模型捕捉较弱,此类精准阅读重排对于在真正喂给 Qwen 等大预言模型之前的压缩噪音输入量来说极其致命地重要。

配置与模块点

class RerankerNodePostprocessor(...)

一个挂载在比如 LlamaIndex 或者是自定义管线尾端作为过滤增强节点的处理单元(NodePostprocessor)类的封装结构实现,接受一系列带着初打分的 nodes,然后调用模型(本地或是基于外部的部署终端)完成非常沉重的推理并重新分配一个更高区分度的预测排序标签的控制器模块方法业务层。

Math-RAG 毕业设计项目