根据得分检索源文档：LangChain Python 的分步指南

2024-03-09 05:57:18

如何使用 LangChain Python 根据得分检索源文档

问题陈述

LangChain 查询会返回基于索引的文档块，并根据得分进行排序。但是，我们需要返回与匹配查询的平均得分最高的文档源（包含匹配块）。例如：对于“Aws 认证详细信息”的查询，我们需要返回与匹配查询的平均得分最高的文档源，并按层次顺序排列。

解决方案

LangChain Python 库提供了 API，可以用来检索具有最高平均得分的源文档。

步骤：

安装 LangChain Python 库：

pip install langchain

导入 LangChain 库：

import langchain

创建查询：

query = langchain.Query(text="Aws 认证详细信息")

执行相似度搜索：

results = client.similarity_search_with_score(query)

获取源文档的 ID：

source_document_id = results[0].source_document_id

获取源文档：

source_document = client.get_document(source_document_id)

打印源文档的内容：

print(source_document.content)

示例

from langchain import Client, Query

# 初始化 LangChain 客户端
client = Client()

# 创建查询
query = Query(text="Aws 认证详细信息")

# 执行相似度搜索
results = client.similarity_search_with_score(query)

# 获取源文档的 ID
source_document_id = results[0].source_document_id

# 获取源文档
source_document = client.get_document(source_document_id)

# 打印源文档的内容
print(source_document.content)