检索增强生成（RAG）方法有哪些提升效果的手段：LangChain在RAG功能上的一些高级能力总结

检索增强生成（Retrieval-augmented Generation，RAG）可以让大语言模型与最新的外部数据或者知识连接，进而可以基于最新的知识和数据回答问题。但是，如果文档切分有问题、检索不准确，检索增强生成可能也会有很多问题。本文基于LangChain提供的一些方法给大家总结一下有哪些提高检索增强生成的方式。

检索增强生成简介及其提高效果方法概述

在此前，DataLearnerAI曾经详细介绍过关于向量检索增强生成的方法及其主要问题。

简单来说，向量检索增强生成是一种结合向量空间的检索能力和大模型生成能力的解决方法。通过将输入数据映射到高维向量空间中，系统可以快速地找到与之相似的向量完成大模型所需上下文结果。这种方法可以让大模型接入实时数据或者外部私有数据，对大模型来说具有很好的扩展性。

一个典型的向量检索增强生成系统流程如下：

但是检索增强也有很多问题，例如向量匹配不准确、文档切分复杂等。针对这些问题也有一些解决方案。

下表是LangChain总结的当前提升RAG效果的一些方案：

想法	示例	来源
RAG基础案例	在嵌入的文档块上进行Top K检索，为LLM上下文窗口返回文档块	LangChain vectorstores, 嵌入模型
摘要嵌入（Summary embedding）	在嵌入的文档摘要上进行Top K检索，但为LLM上下文窗口返回完整文档	LangChain 多向量检索器
窗口化（Windowing）	在嵌入的块或句子上进行Top K检索，但返回扩展窗口或完整文档	LangChain 父文档检索器
元数据过滤（Metadata filtering）	通过元数据过滤块进行Top K检索	自查询检索器
微调RAG嵌入（Fine-tune RAG embeddings）	在您的数据上微调嵌入模型	LangChain 微调指南
2阶段 RAG（2-stage RAG）	第一阶段关键字搜索，然后是第二阶段的语义Top K检索	Cohere重新排名

检索增强生成（RAG）方法有哪些提升效果的手段：LangChain在RAG功能上的一些高级能力总结

检索增强生成简介及其提高效果方法概述

DataLearner 官方微信

向量检索增强生成提升方案之摘要总结：LangChain的多向量检索器

向量检索增强生成提升方案之查询转换：LangChain的Query Transformations

热门博客