RAG - LLM 题库

题目列表

只看错题

0/75

【数据导入】在处理包含复杂表格的 PDF 文档时，希望尽可能准确地提取并保留表格的结构化信息（如行列...

【数据导入】在使用 Unstructured 库处理 CSV 数据时，关于“元数据”（Metad...

【数据导入】关于 RAG 中处理“非结构化数据”（如 PDF、Word）和“半结构化/结构化数据”（...

【数据导入】OCR（光学字符识别）技术在多模态 RAG 系统处理图像信息时扮演重要角色。以下哪一项是...

【数据导入】在 RAG 系统中，为了有效解析和理解 PDF 文档中的表格数据，可以选用哪些工具或方法...

【数据导入】爬取网页数据并进行解析时，如果目标网页的内容大量通过 JavaScript 动态加载，最...

【数据导入】在使用 LLM 解析图文信息时，设计良好的 “Prompt”（提示语）其主要作用是什么？

【分块】在 RAG 系统中，文本分块（Text Chunking）是至关重要的预处理步骤。下列哪一项...

【分块】面对一份结构清晰的技术手册（包含明确的章节和子章节），希望分块后每个块能对应一个完整的逻辑单...

【分块】在设定文本分块的大小时，需要考虑哪些关键限制因素？

【分块】使用 LangChain 的 `RecursiveCharacterTextSplitter...

【分块】“语义分块”（Semantic Chunking）方法的核心思想是什么？

【分块】为文本块添加元数据（Metadata）是优化 RAG 系统的重要环节。下列哪些是元数据的常见...

【分块】Tiktoken 工具在文本分块过程中的主要用途是？

【分块】构建多层次索引（例如，同时包含“摘要块”和“详细内容块”）主要是为了应对以下哪种情况？

【嵌入】嵌入模型（Embedding Model）的核心功能是什么？

【嵌入】在嵌入模型生成的向量空间中，如何理解“语义相似性”？

【嵌入】以下关于开源嵌入模型（如 BGE、Sentence-BERT）和商用嵌入模型（如 OpenA...

【嵌入】MTEB（Massive Text Embedding Benchmark）基准测试的主要用...

【嵌入】“重排序模型”（Reranker）在 RAG 系统中的作用通常是？

【嵌入】为 RAG 系统选择嵌入模型时，需要考虑哪些关键因素？

【嵌入】关于“稀疏嵌入”（如 BM25）和“密集嵌入”（如 BERT），以下说法正确的是？

【嵌入】Sentence-BERT（SBERT）等句子嵌入模型相比早期的 Word2Vec 模型，其...

【向量存储和索引】向量数据库的核心价值在于什么？

【向量存储和索引】在向量数据库的近似最近邻（ANN）搜索中，HNSW（分层可导航小世界）索引相较于暴...

【向量存储和索引】在为 RAG 系统选择向量数据库时，需要重点考虑哪些因素？

【向量存储和索引】“混合检索”（Hybrid Search）在高级 RAG 系统中通常指的是？

【向量存储和索引】在调整 HNSW 索引的参数时，增大 efSearch（搜索时的动态候选集大小...

【向量存储和索引】以下关于不同向量数据库特点的描述，哪些是正确的？

【向量存储和索引】“多模态检索”（Multimodal Retrieval）是指？

【向量存储和索引】向量数据库中“查询”（Query）和“搜索”（Search）两个概念在实践中的常见...

【预检索和查询优化】“查询重写”（Query Rewriting）技术在 RAG 预检索阶段的核心目...

【预检索和查询优化】下列哪些属于“查询分解”（Query Decomposition）策略的典型应用...

【预检索和查询优化】“假设文档嵌入”（HyDE）技术的核心思想是下列哪一项？

【预检索和查询优化】在 RAG 系统中，“查询路由”（Query Routing）的主要作用是什么？

【预检索和查询优化】关于“查询澄清”（Query Clarification），以下哪些描述是正确的...

【预检索和查询优化】“Text-to-SQL”作为查询构建的一种技术，最适合用于以下哪种场景？

【预检索和查询优化】“RAG-Fusion”技术与基础的“多查询”（Multi-Query）技术相比...

【提升检索准确性】在 RAG 系统中，“节点-句子滑动窗口技术”作为一种检索策略，其核心价值和优势主...

【提升检索准确性】RecursiveRetriever 通过构建“多层次索引”来提升检索效果。例如，...

【提升检索准确性】“混合查询”是提升 RAG 检索效果的关键策略之一，它通常结合了哪几种检索方式？

【提升检索准确性】当在 RAG 系统中遇到“关键文档确实存在于知识库中，但总是无法被检索到（排名过低...

【提升检索准确性】“查询重写”技术（Query Rewriting）在解决“检索结果不够全面或过于宽...

【提升检索准确性】针对“检索结果过于冗长，包含大量无关信息”的问题，以下哪些优化措施是有效的？

【提升检索准确性】“分层合并”策略在检索过程中的主要目的是什么？

【检索后处理】在 RAG 系统中，检索后处理（Post-Retrieval Processing）的...

【检索后处理】“重排序”（Reranking）是检索后处理的关键步骤，以下哪些是它的主要作用？

【检索后处理】“倒数排序融合”（Reciprocal Rank Fusion, RRF）算法在重排序...

【检索后处理】Cross-Encoder（交叉编码器）重排序模型与 Bi-Encoder（双编码器）...

【检索后处理】“上下文压缩”（Contextual Compression）技术的主要目的是？

【检索后处理】以下关于检索后处理中“校正”（Correction）技术的描述，哪些是正确的？

【检索后处理】在实际构建 RAG 系统时，常采用“分层管道”策略来组合不同的后处理技术（例如：先快速...

【检索后处理】使用 LLM 作为重排序器（LLM-as-a-Reranker）的一个显著优势和劣势分...

【生成过程】在 RAG 系统的提示设计中，“角色预设”（Role Assignment）技术的主要目...

【生成过程】以下哪些属于 RAG 系统提示设计中“推理链引导”（Chain-of-Thought G...

【生成过程】在 RAG 系统中，将检索结果在“输入层”进行集成，其最典型的做法是？

【生成过程】“Self-RAG”这类高级生成技术的核心创新点在于？

【生成过程】为了控制 RAG 系统生成内容的“准确性”并减少幻觉，在 LLM 参数调优中，通常建议如...

【生成过程】在 RAG 系统中，设计提示词时明确加入“未知信息处理规则”（如“若无法从上下文找到答案...

【生成过程】“RRR”（Recursive Reprompting and Revision）技术的...

【评估检索结果】RAG 系统的评估通常需要从多个维度进行，以下哪一项最能概括其核心评估目标？

【评估检索结果】在 RAG 的检索评估中，“召回率@ $K$ ”（Recall@ $K$ ）这个指标主要用于...

【评估检索结果】在评估 RAG 生成答案的质量时，“忠实度”（Faithfulness，或称事实一致...

【评估检索结果】“平均倒数排名”（Mean Reciprocal Rank, MRR）是 RAG 检...

【评估检索结果】RAGAS 作为一种流行的 RAG 评估框架，其核心优势包括哪些？

【评估检索结果】“答案相关性”（Answer Relevance）指标评估的是？

【评估检索结果】当发现 RAG 系统的“忠实度”（Faithfulness）指标较低时，最有效的优化...

【评估检索结果】以下哪些属于利用 RAG 评估结果来优化系统的常见实践？

【复杂检索策略和范式】GraphRAG 与传统 RAG 最根本的区别在于？

【复杂检索策略和范式】GraphRAG 在索引构建阶段通常包含以下哪些关键步骤？

【复杂检索策略和范式】Contextual Retrieval（上下文检索）技术的核心思想是什么？

【复杂检索策略和范式】多模态 RAG 的主要目标是什么？

【复杂检索策略和范式】多模态 RAG 在实际应用中面临的主要挑战包括哪些？

【复杂检索策略和范式】在 Agentic-RAG 框架中，智能体（Agent）扮演的核心角色是什么？

【复杂检索策略和范式】Agentic-RAG 的优势主要体现在哪些方面？

请选择一道题目开始答题