【反思】在图表生成的反思环节中,利用多模态大语言模型 (MLLM) 的“视觉推理能力”可以带来哪些关...
【反思】以 ChatBI 中优化数据库查询语句为例,该如何验证反思效果?可能采用的客观评估方法会有哪...
【反思】一个有效的反思效果评估系统应具备哪些特征?
【反思】与仅依赖 LLM 自身进行反思相比,引入“外部反馈”的反思机制之所以更强大,主要是因为外部反...
【反思】以下哪些是可有效获取“外部反馈”的具体工具或方法?
【工具】假设在某个“日历助手智能体”场景中,LLM 需要处理请求“请帮我找到周四的空闲时间段,并预约...
【工具】一个完整的大模型工具调用工作流程,通常包含以下哪些关键步骤?
【工具】以下哪些是工具调用能力为 LLM 带来的关键价值?
【工具】业界普遍认为代码执行工具特别强大的原因包括?
【工具】实际生产中,运行 LLM 生成的代码时可能存在安全风险(如删除项目目录)。为确保安全,工业界...
【工具】一个健壮的代码执行模块 (Code Executor) 通常需要具备哪些关键功能?
【工具】在一个典型的 MCP 工作流(如查询 GitHub 仓库信息)中,以下哪些组件是必须参与并各...
【工具】尽管 MCP 优势显著,但根据搜索结果,其在企业级应用中仍面临一些挑战和缺陷。下列哪些是当前...
【最佳实践】考虑在研究型 Agent 撰写关于黑洞文章的例子中,为其设计评估时会为每个主题设定 3-...
【最佳实践】下列哪些属于“端到端评估” (end-to-end evals) 的特点或优势?
【最佳实践】工业界的错误分析实践中会使用电子表格统计各组件出现错误的频率。以下哪些是该实践的关键步骤...
【最佳实践】一个系统化的错误分析流程能够为团队带来哪些核心价值?
【最佳实践】进行有效的误差分析,对于大模型应用开发有哪些重要意义?
【最佳实践】大模型在落地企业业务场景(如发票处理、邮件回复)时,可能出现的错误或“失效模式”包括?
【最佳实践】组件级评估相对于端到端评估有哪些显著优点?
【最佳实践】以下哪些是实施 Agent 组件级评估时可能采用的正确方法或指标?
【最佳实践】以下哪些关于组件级评估的说法是对的?
【最佳实践】以下哪些是改进基于 LLM 的组件的可能途径?
【最佳实践】下述关于延迟优化的信息,以下哪些说法是正确的?
【最佳实践】以下哪些属于有效的成本优化策略?
【最佳实践】延迟和成本的优化哲学中包含了以下哪些核心思想?
【最佳实践】在智能体开发过程中,“分析”活动主要可以包括以下哪些具体做法?
【最佳实践】关于智能体开发流程的建议,以下哪些说法是正确的?
【最佳实践】一个高效的智能体工作流开发过程通常具备哪些特点?
【规划】在规划设计模式的实际执行过程中,以下哪些步骤是必要的?
【规划】以下关于“智能体型工作流” (Agentic Workflow) 中的“规划”说法,哪些是正...
【规划】要求 LLM 以 JSON 等结构化格式输出计划,相较于纯文本计划,主要有哪些优势?
【规划】在 AI Agent 的规划领域,“任务分解”是核心概念之一。以下哪些属于“任务分解”的典型...
【规划】LLM 在进行规划时可能面临哪些主要挑战?
【规划】下列哪些是“用代码执行进行规划”方法的潜在优点?
【规划】“代码执行规划”方法非常适用于某些场景,但也存在局限性。以下哪些说法符合这一观点?
【规划】以下关于“代码执行规划”与“Plan-and-Execute”模式(先生成计划如 `JSON...
【多Agents】单一智能体相比,多智能体工作流 (Multi-Agent Workflow) 主要...
【多Agents】以下关于这些模式适用场景的描述,哪些是正确的?
【多Agents】在设计和实施多智能体工作流时,需要考虑哪些关键因素?
【多Agents】以下关于多智能体工作流中不同沟通模式的描述,哪些是正确的?
【多Agents】在设计多 Agent 系统的交流范式时,通常需要权衡考虑哪些关键因素?
【多Agents】关于当前市面上的多 Agent 交流范式的说法,哪些是对的?