Skip to content

能力地图

语言:English · 中文

这是导航工具:先判断问题属于哪一层,再去对应章节。

十层模型

它回答的问题去哪读
1. 单次请求我能不能从模型拿到一个结构化答案?快速开始Requests 概览
2. 稳定输出我每次都能拿到期望的字段吗?Schema as Prompt输出控制
3. 响应与记忆我能复用一次响应、延续受控窗口对话,或跨 turn 保存任务 records 吗?模型响应会话记忆Workspace
4. Action 与执行环境模型是否需要调用函数、MCP server 或带托管执行依赖的沙箱命令?Actions 概览Action RuntimeExecution Environment
5. 知识与服务是否需要检索、HTTP、SSE 或 WebSocket 暴露?知识库FastAPI 服务封装
6. 观测与开发是否需要 observation event、DevTools 或 coding-agent 指引?观测概览Coding Agents
7. Agent 自动编排是否需要一次 Agent turn 在模型响应、Actions、Skills 或 Dynamic Task 候选中选择路线?Agent 自动编排
8. AgentTask loop是否需要一个业务任务经过计划、有边界执行、Workspace 证据、验证和 replan?Agent 自动编排
9. 动态任务图是否需要让模型或应用提交 DAG,并在执行前校验它?Dynamic Task
10. 编排分支、并发、暂停恢复、持久化TriggerFlow 概览

每一层都依赖前面的层。跳层是出问题最常见的原因——比如,单次请求没稳定就跳进 TriggerFlow。

路径选择

你的处境去哪
完全新手快速开始
输出不稳定 / 偶尔缺字段Schema as Prompt输出控制
想要字段级流式 UXAsync First输出控制
一次响应想多种方式复用模型响应
多轮对话且要控制窗口会话记忆
多轮任务需要持久 observations、artifacts、decisions 或 checkpointsWorkspace
显式 workflow loop 需要持久结构化状态、record links、execution snapshot 查询和 recallTriggerFlow 概览 + Workspace;见 examples/workspace/workspace_loop_foundation.py
模型要调工具 / MCPAction Runtime
需要常见 Python / shell / workspace / Node.js / SQLite 能力Action Runtime,优先从 agent.enable_python(...)agent.enable_shell(...)agent.enable_workspace_file_actions(...)agent.enable_nodejs(...)agent.enable_sqlite(...) 开始
需要 web search 或页面 browseAction Runtime,使用 from agently.builtins.actions import Search, Browseagent.use_actions(...)
执行前需要托管 MCP/sandbox/process/browser/SQLite 生命周期Execution Environment,通常面向 action/plugin 开发者
判断新扩展应该放在哪一层扩展边界
把 agent 包成服务FastAPI 服务封装
需要查看观测事件Event CenterDevTools
需要一次 Agent turn 在模型响应、Actions、Skills 或 Dynamic Task 中选路线Agent 自动编排
单个业务任务需要计划 → 有边界执行 → 证据 → 验证 → replanAgent 自动编排,从 agent.create_task(...) 开始,并按 AgentExecution result 消费
模型生成或应用提交的 DAG 需要先校验再执行Dynamic Task
多阶段带分支的工作流TriggerFlow 概览模式
长跑流程带人工审批 / 中断Pause 与 Resume
跨重启保存恢复 execution持久化与 Blueprint
.end() / set_result() / 旧 runtime_data 迁移TriggerFlow 兼容

决策捷径

  • 「我需要 TriggerFlow 吗?」——只在有明确的阶段、分支、并发或暂停恢复时才需要。带重试的单次请求不需要 TriggerFlow。
  • 「Dynamic Task 还是 TriggerFlow?」——当图本身是提交上来的数据,需要规划、校验、裁剪和执行时用 Dynamic Task;当你在代码里掌握稳定工作流拓扑时直接用 TriggerFlow。
  • 「Sync 还是 async?」——脚本和 demo 用 sync。服务、流式 UI 与 TriggerFlow 用 async。见 Async First
  • 「Action 还是 tool API?」——新代码:Agently.action / agent.use_actions(...)、来自 agently.builtins.actions 的内置 package,以及 agent.enable_python(...)agent.enable_shell(...)agent.enable_workspace_file_actions(...) 等场景 helper。已有的 tool_func / use_tools / use_mcp / use_sandbox 仍可用,但定位为兼容入口;见 Action Runtime
  • 「Agent start 还是显式 API?」——候选驱动的自动编排用 agent.start();需要路线诊断或过程流式输出时用 agent.create_execution()。如果应用必须强制走 Skills 或 Dynamic Task,使用显式 agent.run_skills_task(...)Agently.create_dynamic_task(...)
  • 「AgentTask 还是 TriggerFlow?」——当模型拥有单个业务任务的计划、验证和 replan loop 时,用 agent.create_task(...);它返回 task-strategy AgentExecution,因此通过 AgentExecution result facade 读取 result/meta/stream/task refs。当应用掌握明确阶段、分支和暂停恢复拓扑时,直接用 TriggerFlow。
  • 「Executor 还是 Execution Environment?」——Executor 负责一次调用;Execution Environment 在调用前准备可复用或受 policy 约束的依赖;见 Execution Environment
  • 「Core API 还是语法糖?」——应用开发者应优先使用 built-in actions 和 Agent Component helpers。Core manager 与 provider 面向框架、action、plugin 开发者;见 扩展边界
  • 「Observation event 还是 TriggerFlow event?」——observation event 归 Event Centeremit / when 与 runtime stream 归 TriggerFlow 事件与流