LLM

Retrieval-augmented generation
检索增强生成

概念

LLM Base 幻觉中提到，解决幻觉最简单的方法就是直接把相关知识放在上下文中，去除模糊记忆的依赖

RAG 要做的就是把这一步自动化，由程序来根据问题自动拼接相关的上下文知识，提交给 LLM

Pasted image 20250319112547

总的来说分几步

Pasted image 20250319153915

以 perplexity 为例，提问并不会直接由大模型回复，而是先对网页进行索引后，将相关网页放入上下文中，大模型对网页内容进行总结回复，同时会在回复中标明引用的网页，方便内容核实

一文整理20多种目前常用的 RAG 创新方法
 为什么RAG系统"一看就会，一做就废"？

实际落地并不简单，不是将文档上传到某个框架/平台里就完事了

代码场景，使用 AST 来进行分割，确保上下文完整

让 LLM 先对文档进行一次处理，将语义关系梳理出来

多级索引

父区块（Parent-chunk）保持较大的文本单位（如段落），提供丰富的上下文信息

子区块（Child-chunk）则是较小的文本单位（如句子），用于精确检索

首先通过子区块进行精确检索以确保相关性，然后获取对应的父区块来补充上下文信息

对检索出的 chunk 进行排序

Pasted image 20250319161115