LLM 应用进阶2026-05-26 更新

检索增强生成(RAG)

从检索、生成到生产落地,系统掌握 RAG 的核心组件

RAG(Retrieval Augmented Generation,检索增强生成)通过从外部知识库中检索相关信息,帮助大语言模型生成更准确、更实用、更有依据的回复。

这门课围绕真实应用中的 RAG 系统展开:你会先理解检索与生成如何配合,再学习搜索技术、向量数据库、提示词设计、系统评估与生产部署中的关键权衡。

课程设计

  • 第一部分建立 RAG 的整体图景:RAG 是什么、为什么需要它,以及它如何把 LLM 与外部知识库连接起来。
  • 第二部分补齐信息检索和搜索基础,理解关键词搜索、语义搜索、混合检索、分块和查询解析等技术。
  • 第三部分进入向量数据库、LLM 文本生成、评估与生产化,讨论上下文窗口、延迟、成本、监控和系统迭代。

适合人群

  • 正在构建 RAG、企业知识库问答、客服机器人、代码助手或搜索增强应用的工程师。
  • 已经了解生成式 AI 基础,希望把 RAG 从 Demo 推进到可调试、可评估、可上线系统的人。
  • 具备中级 Python 编程能力,希望系统学习检索、提示词、向量数据库和生产部署之间关系的人。

建议背景

需要中级 Python 编程能力;了解生成式 AI 基础知识会更容易跟上课程节奏。

学习目标

理解检索与生成如何协同,能设计可靠、灵活的 RAG 系统。
掌握关键词搜索、语义搜索、混合检索、文本分块和查询解析等常见检索技术。
理解向量数据库在 RAG 中的作用,并能判断不同检索策略的适用场景。
能编写更好利用检索上下文的提示词,并评估 RAG 系统的回答质量。
能围绕延迟、成本、上下文窗口、监控和调试做出更稳的生产工程决策。

课程目录

Chapter 2

第二章:信息检索和搜索基础

后续更新。学习关键词搜索、语义搜索、混合搜索、文本分块和查询解析等检索基础。

0 课时
Chapter 3

第三章:信息检索和向量数据库

后续更新。学习向量数据库如何支持文档索引、相似度搜索和大规模 RAG 检索链路。

0 课时
Chapter 4

第四章:大模型和文本生成

后续更新。学习 LLM 如何利用检索上下文生成回答,并围绕提示词、上下文窗口和生成质量做工程优化。

0 课时
Chapter 5

第五章:生产上的 RAG 系统

后续更新。学习如何评估、监控、调试和部署 RAG 系统,并在延迟、成本和可靠性之间做权衡。

0 课时