【反思】在图表生成的反思环节中,利用多模态大语言模型 (MLLM) 的“视觉推理能力”可以带来哪些关...
【反思】以 ChatBI 中优化数据库查询语句为例,该如何验证反思效果?可能采用的客观评估方法会有哪...
【反思】一个有效的反思效果评估系统应具备哪些特征?
【反思】与仅依赖 LLM 自身进行反思相比,引入“外部反馈”的反思机制之所以更强大,主要是因为外部反...
【反思】以下哪些是可有效获取“外部反馈”的具体工具或方法?
【工具】假设在某个“日历助手智能体”场景中,LLM 需要处理请求“请帮我找到周四的空闲时间段,并预约...
【工具】一个完整的大模型工具调用工作流程,通常包含以下哪些关键步骤?
【工具】以下哪些是工具调用能力为 LLM 带来的关键价值?
【工具】业界普遍认为代码执行工具特别强大的原因包括?
【工具】实际生产中,运行 LLM 生成的代码时可能存在安全风险(如删除项目目录)。为确保安全,工业界...
【工具】一个健壮的代码执行模块 (Code Executor) 通常需要具备哪些关键功能?
【工具】在一个典型的 MCP 工作流(如查询 GitHub 仓库信息)中,以下哪些组件是必须参与并各...
【工具】尽管 MCP 优势显著,但根据搜索结果,其在企业级应用中仍面临一些挑战和缺陷。下列哪些是当前...
【最佳实践】考虑在研究型 Agent 撰写关于黑洞文章的例子中,为其设计评估时会为每个主题设定 3-...
【最佳实践】下列哪些属于“端到端评估” (end-to-end evals) 的特点或优势?
【最佳实践】工业界的错误分析实践中会使用电子表格统计各组件出现错误的频率。以下哪些是该实践的关键步骤...
【最佳实践】一个系统化的错误分析流程能够为团队带来哪些核心价值?
【最佳实践】进行有效的误差分析,对于大模型应用开发有哪些重要意义?
【最佳实践】大模型在落地企业业务场景(如发票处理、邮件回复)时,可能出现的错误或“失效模式”包括?
【最佳实践】组件级评估相对于端到端评估有哪些显著优点?
【最佳实践】以下哪些是实施 Agent 组件级评估时可能采用的正确方法或指标?
【最佳实践】以下哪些关于组件级评估的说法是对的?
【最佳实践】以下哪些是改进基于 LLM 的组件的可能途径?
【最佳实践】下述关于延迟优化的信息,以下哪些说法是正确的?
【最佳实践】以下哪些属于有效的成本优化策略?
【最佳实践】延迟和成本的优化哲学中包含了以下哪些核心思想?
【最佳实践】在智能体开发过程中,“分析”活动主要可以包括以下哪些具体做法?
【最佳实践】关于智能体开发流程的建议,以下哪些说法是正确的?
【最佳实践】一个高效的智能体工作流开发过程通常具备哪些特点?
【规划】在规划设计模式的实际执行过程中,以下哪些步骤是必要的?
【规划】以下关于“智能体型工作流” (Agentic Workflow) 中的“规划”说法,哪些是正...
【规划】要求 LLM 以 JSON 等结构化格式输出计划,相较于纯文本计划,主要有哪些优势?
【规划】在 AI Agent 的规划领域,“任务分解”是核心概念之一。以下哪些属于“任务分解”的典型...
【规划】LLM 在进行规划时可能面临哪些主要挑战?
【规划】下列哪些是“用代码执行进行规划”方法的潜在优点?
【规划】“代码执行规划”方法非常适用于某些场景,但也存在局限性。以下哪些说法符合这一观点?
【规划】以下关于“代码执行规划”与“Plan-and-Execute”模式(先生成计划如 `JSON...
【多Agents】单一智能体相比,多智能体工作流 (Multi-Agent Workflow) 主要...
【多Agents】以下关于这些模式适用场景的描述,哪些是正确的?
【多Agents】在设计和实施多智能体工作流时,需要考虑哪些关键因素?
【多Agents】以下关于多智能体工作流中不同沟通模式的描述,哪些是正确的?
【多Agents】在设计多 Agent 系统的交流范式时,通常需要权衡考虑哪些关键因素?
【多Agents】关于当前市面上的多 Agent 交流范式的说法,哪些是对的?
【概念】智能体AI工作流(Agentic AI)与传统直接提示(Direct Prompting)大...
【概念】对写作智能体AI工作流的阐述,大型语言模型在其中扮演的核心角色最准确的描述是?
【概念】吴恩达使用“Agentic AI”这一形容词来描述AI系统,而不是使用“Agent”,其主要...
【概念】低自主性智能体与高自主性智能体最根本的区别在于?
【概念】高度自主的智能体甚至可以编写新的函数,或创建可执行的新工具。这最能体现下列哪一项概念?
【概念】当前许多企业广泛部署的是低自主性应用。以下哪项最不可能是其首要原因?
【概念】根据某次实验数据,在Human Eval编程基准测试中,将GPT-3.5嵌入智能体工作流后,...
【概念】智能体工作流具备并行处理能力,能极快地完成某些任务。以下哪一项最准确地描述了这种能力相较于人...
【概念】智能体工作流的模块化设计是一个重要优势。这种设计最直接促进了以下哪项能力?
【概念】智能体工作流的强大功能建立在多组件协同的基础上,下列哪一项是构建此类工作流时,架构师需要特别...
【概念】在基于Coze/Dify等平台开发的发票批量识别与处理智能体工作流中,其设计架构最显著地体现...
【概念】一个能处理“你们有黑色牛仔裤或蓝色牛仔裤吗?”这类查询的客户服务智能体,其挑战性主要体现在哪...
【概念】在“计算机使用型智能体”(如操作浏览器查询航班信息的智能体)的例子中,其目前面临的主要挑战不...
【概念】以下哪项是Agentic AI在应用中展现出显著价值的关键原因?
【概念】将复杂任务分解为小步骤的核心价值主要体现在哪个方面?
【概念】当发现研究智能体(Research Agent)生成的初稿不连贯时,最有效的改进策略是什么?
【概念】在评估一个已分解的子任务是否可行时,开发者应首要关注的问题是什么?
【概念】在“发票处理智能体”工作流中,工具调用(如PDF转文本API、数据库更新接口)扮演的关键角色...
【概念】与单次直接提示LLM完成整个任务相比,采用基于任务分解的智能体工作流最根本的优势是什么?
【概念】使用另一个LLM作为裁判来为研究智能体(Research Agent)生成的文章打分(例如1...
【概念】评估分为端到端评估和组件级评估。以下关于这两种评估的描述,哪一项最符合实际?
【概念】有的开发者会检查“中间输出”,有时我们称之为LLM的‘轨迹’,以便了解它在哪些方面未能达到我...
【概念】在智能客服智能体的例子中,如果要避免生成结果中出现“竞争对手名称”,最佳实践是通过编写代码统...
【概念】一个严谨的Agent评估流程通常强调以下哪种实践?
【概念】“反思”(Reflection)设计模式的核心机制是什么?
【概念】在“工具使用”(Tool Use)设计模式中,大型语言模型(LLM)扮演的关键角色是什么?
【概念】“规划”(Planning)模式,其最显著的特点是什么?
【概念】“多代理协作”(Multi-agent Collaboration)模式相较于单一代理模式,...
【概念】将四种设计模式组合运用(如反思+工具使用,或多代理协作+规划)构建智能体工作流,其根本目的是...
【反思】“反思”(Reflection)设计模式最核心的机制是什么?
【反思】反思模式的能力在哪种情况下会大大增强?
【反思】在实现反思模式时,开发者有时会选择使用不同的模型分别负责“生成初稿”和“进行反思与优化”。这...
【反思】关于反思模式的局限性,以下哪种说法最准确?
【反思】与简单的“零样本提示”直接生成相比,引入“反思”工作流最核心的价值在于什么?
【反思】反思机制能够有效提升输出质量,其内在原理最接近以下哪种人类认知模型?
【反思】在撰写一个有效的反思提示时,建议应特别关注哪一项关键要素?
【反思】反思机制在处理以下哪类任务时可能发挥特别重要的作用?
【反思】关于反思机制的局限性或适用场景,以下哪种说法最准确?
【反思】对于一个图表生成工作流,“反思”机制最核心的流程是什么?
【反思】设计有效的反思提示(Reflection Prompt)时,一个重要的技巧是什么?
【反思】关于在图表生成工作流中为“初始生成”和“反思”阶段选择模型,最佳实践是什么?
【反思】图表生成工作流中引入反思机制,其根本价值在于什么?
【反思】在决定是否引入反思机制到智能体工作流时,为什么必须进行效果验证?
【反思】当面对图表生成等主观性任务时,业界发现直接让LLM比较两个图表并判断“哪个更好”存在局限性。...
【反思】业界的最佳实践是:针对主观任务(如图表质量评估),选用更可靠的评估方法--“评分量表”(ru...
【反思】在提示工程优化效果进入平台期时,引入结合外部反馈的反思机制能带来性能“跃升”。这最主要是因为...
【反思】一个有效整合了外部反馈的反思工作流,其最显著的优势是能够?
【工具】假设有这样一个完整的工具使用工作流程,当用户提问“现在几点了?”时,其正确的执行顺序是?
【工具】LLM工具使用的一个关键特征是“自主性”。这最准确地体现在以下哪一环节?
【工具】下列哪项是工具使用模式赋予LLM的最根本价值?
【工具】大语言模型(LLM)调用工具(如函数)最本质的机制是什么?
【工具】当今主流的标准化工具调用方式(如 OpenAI Function Calling)与传统方法...
【工具】在时间工具调用流程中,为何需要将函数执行的结果再次返回给 LLM,而不是由外部系统直接输出给...
【工具】使用LangChain等库实现LLM工具调用的核心优势是什么?
【工具】在技术层面上,LLM调用工具的准确含义是?
【工具】LangChain等库能自动为工具函数生成JSON Schema。这个JSON Schema...
【工具】与为每个数学运算(如加法、平方根)单独创建专用工具相比,让LLM“编写代码并执行”的方法最根...
【工具】在“编写代码并执行”的工作流中,当代码执行失败(如出现语法错误或逻辑错误)时,业界普遍的优化...
【工具】MCP(模型上下文协议)正在改变LLM工具生态。结合搜索结果,MCP协议对于“代码执行”这类...
【工具】MCP(模型上下文协议)最核心的设计目标,即它试图解决的根本问题是什么?
【工具】与传统的、为每个应用单独编写代码集成特定API的方式相比,采用MCP协议进行工具集成的最主要...
【工具】“MCP是一个重要的技术标准,越来越多的开发者正在遵循这一标准”。这主要预示着MCP的哪一发...
【最佳实践】业界经常使用的评估方法二维分类框架,如果使用代码自动统计小红书营销文案是否超过30个词的...
【最佳实践】在开始构建评估体系时,应遵循什么核心原则以避免陷入停滞?
【最佳实践】构建一个有效评估体系的最根本出发点是什么?
【最佳实践】对智能体工作流进行“错误分析”(Error Analysis)的根本目的是什么?
【最佳实践】在决定优化组件的优先级时,工业界最佳实践中除了考虑“错误频率”外,还应重点考量下列哪个关...
【最佳实践】查看“追踪日志”(traces)或“片段”(span)对于错误分析至关重要。这些术语在工...
【最佳实践】在进行大模型误差分析时,对于发票处理流程中“提取日期”频繁出错的问题,首先应该采取的关键...
【最佳实践】在客户邮件回复的智能工作流中,误差分析显示75%的错误源于LLM编写的数据库查询问题,这...
【最佳实践】企业级AI应用场景(如财务核算、合规审查)对模型输出有一个普遍且严格的要求,这导致基于概...
【最佳实践】在发票处理的误差分析中,发现LLM数据提取组件发生了更多错误。这个结论是通过什么方法得出...
【最佳实践】对于研究助手Agent,如果只依赖端到端评估来优化其网络搜索组件,主要存在什么问题?
【最佳实践】进行Agent组件级评估(如评估网络搜索组件)的一个核心优势是什么?
【最佳实践】在完成对某个组件(如网络搜索)的一系列调整和组件级评估后,还应该做什么?
【最佳实践】在网络搜索组件评估方案中,“黄金标准网络资源列表”是由谁来确定的?
【最佳实践】在智能体工作流中,改进非LLM组件的效果时,以下哪项是首要提及的通用方法?
【最佳实践】对于基于LLM的组件,在考虑成本较高的微调之前,应优先尝试哪种改进策略?
【最佳实践】为了培养关于不同LLM擅长何种任务的直觉,工业界没有推荐以下哪种做法?
【最佳实践】关于AI Agent组件的论述,一个强大的AI Agent除了LLM核心外,通常还需要哪...
【最佳实践】对于智能体工作流,在确保输出质量达到生产要求后,接下来通常需要优化的两个重要方面是?
【最佳实践】在构建智能体工作流时,开发团队应优先优化的核心目标是什么?
【最佳实践】当需要优化智能体工作流的延迟时,首先应该采取的关键步骤是什么?
【最佳实践】进行成本和延迟的基准测试,一个非常重要的价值在于?
【最佳实践】在构建一个新的智能体工作流时,工业界通常建议的第一步是什么?
【最佳实践】随着智能体系统逐渐成熟,其分析活动会如何变化?
【最佳实践】哪个是智能体系统的开发过程的核心观点是?
【最佳实践】工业界对于在智能体开发中使用现成工具与构建定制化评估体系的态度是怎样的?
【最佳实践】以下哪项是智能体开发中应遵循的核心原则?
【规划】在“规划(planing)”设计模式中,智能体(Agent)应对用户复杂查询的核心流程是什么...
【规划】“规划(planing)”设计模式的一个主要优势是什么?
【规划】LLM生成的计划通常不包括以下哪个特点?
【规划】关于AI Agent设计模式,以下哪项是“规划模式”(Planning Pattern)的核...
【规划】在让大语言模型(LLM)生成执行计划时,为什么许多开发者倾向于要求模型将计划格式化为JSON...
【规划】来自工业界的经验:除了使用JSON/XML等结构化数据来表达计划,还有一个“非常巧妙的想法”...
【规划】在“规划设计模式”中,智能体(Agent)的核心能力是什么?
【规划】华为的WorkTeam框架最可能通过什么方法来提升生成复杂工作流的准确性?
【规划】“用代码执行进行规划”这一理念的核心是什么?
【规划】相比于为每个新需求不断创建新工具,采用“代码执行规划”方法的主要优势是什么?
【规划】在让LLM生成并执行代码以实现规划时,一个重要注意事项是什么?
【规划】来自工业界的经验表明,与其他规划表达方式相比,“代码执行规划”(即“代码即行动”)的性能表现...
【多Agents】采用多智能体工作流(Multi-Agent Workflow)的核心价值类比是什么...
【多Agents】关于创建某产品营销手册的例子中,三个智能体(研究员、平面设计师、撰稿人)的协作方式...
【多Agents】构建多智能体工作流的一个显著优势是什么?
【多Agents】以下哪种多智能体协作模式特别适用于需要通过多次生成、评估和优化迭代来保证高质量输出...
【多Agents】在一个市场营销团队的多智能体工作流中,如果研究员完成工作后将输出直接传递给平面设计...
【多Agents】某多智能体设计范式为层级式沟通模式,扮演核心协调角色的最可能是下述的哪个智能体?
【多Agents】哪种沟通模式虽然执行起来具有挑战性且结果难以预测,但在一些实验性项目中仍有使用?