RAG
RAG(Retrieval-Augmented Generation,检索增强生成):在模型回答前,先从外部知识库(文档/代码/数据库/网页等)里检索出最相关的片段,把这些片段作为“证据”塞进上下文,再让模型生成答案。
解决什么问题
- 让回答更贴近你的私有资料/项目事实,减少幻觉
- 让模型能“引用证据”而不是凭空编
最常见的组件
- Chunking:把长文档/代码切片
- Embedding:把切片向量化
- Top-K 检索:按相关性取最相关的 K 段
- Prompt 拼装:把检索结果放进结构化上下文块里