“多数人仍将 AI 当作增强版搜索工具,AI Agent 是下一代 AI 变革,懂与不懂的差距会快速拉大。”
但 Agent 究竟是什么?它和普通 Prompt 的本质区别在哪里?它的内部是怎么运转的?
今天,我们从概念到源码,系统性拆解 AI Agent 的核心原理。
一、先厘清本质:Prompt 是司机,Agent 是自动驾驶
普通 Prompt:雇佣一个听话的新手司机
你告诉它"帮我查一下北京今天的天气",它就查完天气、给你答案。全程需要你引导,每一步都要你下指令。
这种模式叫被动响应:人类下指令,AI 单次执行,过程需要人全程介入。
AI Agent:雇佣一个老司机 + 自动驾驶系统
你告诉它"帮我把这份报告发给王总",它会:
- 自己规划步骤(打开邮箱 → 找到联系人 → 粘贴报告 → 发送)
- 遇到异常自己调整(王总邮箱地址变了?自动找到新地址)
- 自己校验结果(确认发送成功了吗?)
- 全程不需要你盯着
这种模式叫自主闭环:人类只下达总目标,内部系统自动规划、执行、自查、修正。
核心差距:Prompt 等待指令,Agent 自主行动。
二、AI Agent 四大核心模块
AI Agent 的内部,核心是一个大语言模型(LLM),它是整个系统的"大脑",负责理解意图、逻辑推理、识别信息。
在这个大脑之上,配备了四个协作模块:
┌─────────────────────┐ │ 大脑:LLM │ └─────────────────────┘ ▲ ▼ ┌──────────┴──────┴──────────┐ │ │ ┌──┴──┐ ┌──────┐ ┌────┐ ┌───┴───┐ │分析师│─▶│规划师│─▶│操作员│─▶│审计员│ └─────┘ └──────┘ └────┘ └───┬───┘ │ ◀──── OODA 循环 ──── ◀─┘1. 分析师(Information Integrator)
职责:收集、梳理原始信息,挖掘数据规律,把杂乱素材整理成可用信息。
对应 PilotDeck 模块:ContextRuntime(上下文运行时)
// PilotDeck 中的 ContextRuntime.prepareForModel()// 负责准备模型所需的上下文信息constawaitprepareForModelmessagescloneMessagesmaxMessagesthisconfigmaxContextMessagesContextRuntime 扮演"分析师"角色:它收集对话历史、工具列表、用户上下文,进行预处理后交给大脑(LLM)。
2. 规划师(Planner)
职责:接收最终目标,将复杂任务拆解成多步执行方案。
对应 PilotDeck 模块:RouterRuntime.decide() + AgentLoop
// PilotDeck 中的路由决策 - 规划师的核心逻辑constawaitthisdependenciesrouterdecidemetadataundefined// 根据决策结果,选择合适的模型和策略// 这就是规划师的"决策"过程同时,Auto-Orchestrate 模块扮演更直接的"规划师"角色——它负责在复杂任务中编排子 Agent:
// applyOrchestration.ts - 编排规划ifautoOrchestrateenabledconstapplyOrchestrationconfigautoOrchestratetier// 注入编排 Prompt,相当于"规划师"制定执行方案requestPatchmessagesrequestmessagestoolsrequesttoolssystemPromptrequestsystemPrompt3. 操作员(Operator)
职责:落地执行具体操作——查资讯、发邮件、生成报表、操作文件等。
对应 PilotDeck 模块:AgentLoop.executeToolsWithEventPump()
// AgentLoop 中的工具执行 - 操作员的执行动作constyieldthisexecuteToolsWithEventPump// 包含所有工具的运行时上下文PilotDeck 的工具系统(Tool Runtime)就是"操作员"。它通过统一的工具接口,执行读取文件、搜索代码、执行命令等各种操作。
4. 审计员(Auditor)
职责:校验操作员产出的结果,核对是否符合预设标准,发现偏差后反馈给规划师重新调整。
对应 PilotDeck 模块:CompactionEngine + Circuit Breaker
// CompactionEngine - 审计员检查上下文是否"合规"ifpostTokensthistokenBudgetestimateMessagesTokensbuildPostCompactMessages// 检查压缩后是否符合预期的 token 上限// Circuit Breaker - 审计员发现连续失败直接熔断constevery(r) =>type"error"errorcode"invalid_tool_input"ififMAX_CONSECUTIVE_ALL_INVALID_TURNSthrownewError"模型陷入工具调用错误循环,终止执行"审计员不只在结束时检查,还会在过程中实时监控——Token 预算超了?压缩。连续错误?熔断。
三、OODA 循环:Agent 的自主运行引擎
OODA 循环是 Agent 区别于传统自动化脚本的核心:
- 传统自动化:按固定脚本执行,遇到异常就中断
- AI Agent:通过 OODA 循环自主应对突发状况
观察 → 调整 → 决策 → 行动 → (循环) ▲ │ └────────────────────────┘观察(Observation)
Agent 实时获取当前状态:
// PilotDeck AgentLoop 中的状态观察constassembleAssistantMessageconstcollectToolCallsmessage// 观察当前轮次产生了哪些工具调用调整(Orient)
根据新观察到的信息,重新分析现状:
// TokenSaver 的智能分类 - 观察后调整 tier 决策constawaitclassifyAndRouteconfigtokenSavermessagesrequestmessagespreviousTiermetadatapreviousTier// 参考前一轮的 tier// 如果上一轮是 "complex",这一轮发现任务变简单了,自动调整决策(Decide)
规划师更新执行步骤:
// decideScenario - 根据最新观察重新决策constdecideScenarioscenariosifmodelHint// 检测到子 Agent 标签 → 切换到 subagent 场景"subagent"行动(Act)
操作员按新方案继续执行:
// RouterRuntime.execute() - 执行决策forawaitconstofthisdependenciesrouterexecuteyield// 流式输出行动结果PilotDeck 的 OODA 实现:
whiletrue// 1. 观察 - tryAutoCompact 获取上下文状态constawaittryAutoCompact// 2. 调整 - 决策前压缩(适应主模型窗口)ifmessages// 重新调整上下文// 3. 决策 - decide() 选择模型和策略constawaitdecide// 4. 行动 - execute() 执行模型调用forawaitconstofexecuteyield// 循环直到完成或达到 maxTurns四、GPS 前置校验:启动前的三件事
“Agent 不是魔法,会放大指令的模糊与流程缺陷。”
启动任务前,必须明确三项信息,消除指令模糊:
G - Goal(目标)
清晰定义最终要达成什么结果。
PilotDeck 实现:SessionRouterStore 中的tokenSaverTier记录当前任务类型,帮助 Agent 始终明确"我在处理什么级别的问题"。
P - Standard(标准)
划定审核规则、边界要求。
PilotDeck 实现:
- Circuit Breaker 设置错误次数上限(3次连续失败即熔断)
- maxOutputTokens 设置输出上限
- TokenBudgetManager 控制 token 消耗上限
S - Steps(步骤)
明确基础执行约束。
PilotDeck 实现:
// AgentLoop 的执行步骤是明确的whiletrueifbreak// 步骤约束:最大轮次ifbreak// 步骤约束:可中止ifundefinedbreak// 步骤约束:结构化输出即停止五、实战对比:普通 Prompt vs AI Agent 任务处理
| 维度 | 普通 Prompt | AI Agent |
|---|---|---|
| 交互模式 | 单次问答 | 多轮自主循环 |
| 异常处理 | 人工介入 | OODA 循环自动调整 |
| 任务拆解 | 人工规划 | 规划师模块自动拆解 |
| 结果校验 | 人工检查 | 审计员模块自动校验 |
| 上下文管理 | 无 | 自动压缩(CompactionEngine) |
| 工具调用 | 手动指定 | 自动选择并执行 |
| 故障恢复 | 人工重试 | Fallback 链自动降级 |
六、落地关键:窄场景 > 大而全
“成功的 Agent 不追求大而全,而是聚焦人们厌恶但必须重复做的具体任务。”
PilotDeck 的设计也印证了这一点:
- TokenSaver只做一件事:判断当前任务用哪个 tier 的模型
- Auto-Orchestrate只做一件事:当任务是 complex 时,触发编排模式
- Circuit Breaker只做一件事:发现连续错误就熔断
每个模块职责单一,通过组合形成复杂能力。
总结
AI Agent 的本质,是在 LLM 这个"大脑"之上,构建一套自主运行系统:
LLM(大语言模型) │ ├── 分析师 → ContextRuntime(上下文管理) ├── 规划师 → RouterRuntime.decide()(路由决策) ├── 操作员 → AgentLoop + ToolRuntime(工具执行) ├── 审计员 → CompactionEngine + CircuitBreaker(审核容错) │ └── 运行引擎 → OODA 循环(自主迭代) │ └── 前置校验 → GPS(目标/标准/步骤)理解了这套架构,你就理解了所有主流 Agent 框架的核心设计逻辑——无论是开源的 PilotDeck,还是商业化的 AI 产品。
学AI大模型的正确顺序,千万不要搞错了
🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!
有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!
就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋
📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇
学习路线:
✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经
以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!
我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~