一个 Agent 干不完的活,我在代码里用 API 把几个 Agent 串成了流水线
2026/6/5 8:55:00 网站建设 项目流程

有个需求:把用户上传的一篇长文,先翻译成中文,再提炼成三句话摘要,最后按固定格式生成一张卡片。一开始我想用一个万能 Agent 把这仨活全包了,写了一大坨 Prompt,结果它经常顾此失彼——翻译对了摘要跑偏,摘要好了格式又乱。

后来换思路:一个 Agent 只干一件事,干净利落,然后在我自己的代码里把它们串起来。

三个专职 Agent

我用讯飞星辰分别搭了三个智能体,各自职责单一,每个都发布成了 API:

  • 翻译 Agent:只管把外文准确译成中文,Prompt 里只约束翻译质量,别的不管。

  • 摘要 Agent:输入中文,输出三句话核心摘要。

  • 排版 Agent:输入摘要,按固定 JSON 结构输出卡片字段。

每个单独调试都很容易,因为职责窄,出问题一眼能定位是哪一环。

在代码里编排

串联的逻辑放在我自己的服务里,本质就是顺序调用三个 API,把上一个的输出喂给下一个:

text = await callAgent(TRANSLATE, raw)
brief = await callAgent(SUMMARY, text)
card = await callAgent(LAYOUT, brief)

中间想加缓存、加重试、加并发(比如一次处理多篇),都在代码里控制,比把所有逻辑塞进一个大 Prompt 灵活太多。

取舍

  • 多了几次网络往返,整体变慢,对延迟敏感的场景要权衡,或者把能并行的步骤并行掉。

  • 每环的输出格式要约定死,否则下一环接不住。我让每个 Agent 严格输出结构化结果,省去解析的麻烦。

把复杂任务拆成几个专职 Agent 接力,可维护性比"一个巨型 Agent"强一个量级。编排那段代码我放评论区了。你们是堆一个大的,还是拆成小的?

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询