课程设计
- 第一部分建立 RAG 的整体图景:RAG 是什么、为什么需要它,以及它如何把 LLM 与外部知识库连接起来。
- 第二部分补齐信息检索和搜索基础,理解关键词搜索、语义搜索、混合检索、分块和查询解析等技术。
- 第三部分进入向量数据库、LLM 文本生成、评估与生产化,讨论上下文窗口、延迟、成本、监控和系统迭代。
适合人群
- 正在构建 RAG、企业知识库问答、客服机器人、代码助手或搜索增强应用的工程师。
- 已经了解生成式 AI 基础,希望把 RAG 从 Demo 推进到可调试、可评估、可上线系统的人。
- 具备中级 Python 编程能力,希望系统学习检索、提示词、向量数据库和生产部署之间关系的人。
建议背景
需要中级 Python 编程能力;了解生成式 AI 基础知识会更容易跟上课程节奏。
学习目标
理解检索与生成如何协同,能设计可靠、灵活的 RAG 系统。
掌握关键词搜索、语义搜索、混合检索、文本分块和查询解析等常见检索技术。
理解向量数据库在 RAG 中的作用,并能判断不同检索策略的适用场景。
能编写更好利用检索上下文的提示词,并评估 RAG 系统的回答质量。
能围绕延迟、成本、上下文窗口、监控和调试做出更稳的生产工程决策。
课程目录
Chapter 1
7 课时第一章:RAG 综述
从 RAG 的基本概念、应用场景、系统架构、LLM 机制和检索器职责建立整体图景。
01第一节:本章介绍梳理第一章会覆盖的 RAG 基础、系统架构、组件分工和应用场景。视频 / 图文5 分钟02第二节:RAG 介绍用酒店问题示例解释检索增强生成的基本思想:先检索信息,再让 LLM 基于上下文生成回答。视频 / 图文20 分钟03第三节:RAG 应用介绍介绍代码生成、企业聊天机器人、医疗法律、网络搜索和个人助手等典型 RAG 场景。视频 / 图文20 分钟04第四节:RAG 架构设计简述拆解 RAG 系统从用户提示到检索器、知识库、增强提示词和 LLM 输出的核心链路。视频 / 图文20 分钟05第五节:大模型介绍解释 LLM 如何基于 token 概率自回归生成文本,以及为什么这会带来幻觉和上下文窗口限制。视频 / 图文20 分钟06第六节:信息检索介绍从图书馆类比出发说明检索器如何组织、索引、排序和过滤知识库文档。视频 / 图文20 分钟07第七节:本章总结总结 RAG 的核心目标:用检索到的信息锚定 LLM 回复,并引出后续章节的深入内容。视频 / 图文3 分钟
Chapter 2
0 课时第二章:信息检索和搜索基础
后续更新。学习关键词搜索、语义搜索、混合搜索、文本分块和查询解析等检索基础。
Chapter 3
0 课时第三章:信息检索和向量数据库
后续更新。学习向量数据库如何支持文档索引、相似度搜索和大规模 RAG 检索链路。
Chapter 4
0 课时第四章:大模型和文本生成
后续更新。学习 LLM 如何利用检索上下文生成回答,并围绕提示词、上下文窗口和生成质量做工程优化。
Chapter 5
0 课时第五章:生产上的 RAG 系统
后续更新。学习如何评估、监控、调试和部署 RAG 系统,并在延迟、成本和可靠性之间做权衡。