RAG基础知识简记

1.大模型应用开发的三种模式:Prompt,RAG,模型Fine-tuning

Prompt场景:问题没问清楚

RAG场景:缺少专业知识,背景知识

模型Fine-tuning:模型能力不足

以上三种模式结合使用。

2.RAG: Retrieval-Augmented Generation, 检索增强生成

检索结果作为上下文内容,给大模型整合输出,提高时效性和准确性。

检索:向量检索

增强:prompt中放入检索内容,

生成:大模型生成结果

本质:重新构建了一个新的Prompt。

3.RAG 整体流程

USER query(Embedding)-> Vector DB ->Retrieval system-Retrieval Data->Rerank->Filter->Generates final answer.

Step1. 数据预处理,构建索引库(知识库构建-文档分块chunks-向量化处理[嵌入模型BGE,M3E,Chinese-Alpaca-2等])

Step2. 检索阶段(查询处理,重排序)

Step3. 生成阶段(构建prompt,获取结果)

RAG在不同阶段提升质量的实践

  • 数据准备环节,阿里云考虑到文档具有多层标题属性且不同标题之间存在关联性,提出多粒度知识提取方案,按照不同标题级别对文档进行拆分,然后基于Qwen14b模型和RefGPT训练了一个面向知识提取任务的专属模型,对各个粒度的chunk进行知识提取和组合,并通过去重和降噪的过程保证知识不丢失、不冗余。最终将文档知识提取成多个事实型对话,提升检索效果;
  • 知识检索环节,哈啰出行采用多路召回的方式,主要是向量召回和搜索召回。其中,向量召回使用了两类,一类是大模型的向量、另一类是传统深度模型向量;搜索召回也是多链路的,包括关键词、ngram等。通过多路召回的方式,可以达到较高的召回查全率。
  • 答案生成环节,中国移动为了解决事实性不足或逻辑缺失,采用FoRAG两阶段生成策略,首先生成大纲,然后基于大纲扩展生成最终答案。

标签

发表评论