vector.py
概述
retrieval/retrieverModules/vector.py 是完全基于在特定大语言模型或者判别模型编码下生成的双塔式分布式稠密表征嵌入技术寻回上下文数据的单维策略执行入口引擎层封装。 通过调用例如 FAISS 等已经建好在硬盘以及装载入内存环境之内的向量基库进行高速如余弦距离和点积运算拉拽最靠近在语义隐空间中提问句子的文章区域片段模块包操作接口层。
典型核心管理装载
class VectorDBRetriever(BaseRetriever)
接受例如针对 bge-large-zh 或者 OpenAI 的 embedding 函数实例或者直接操作库指针绑定索引并将我们用户的 query 直接通过该嵌入进行编码之后发起高效多并发距离计算并抽取相应的库内原文字符与源头文档位置(元信息)重新组织作为统一结果对象给管线前台的核心调用端执行逻辑构建点。