跳到主要内容

2025-03-11 之后,为什么工作流加工具调用更重要了

· 阅读需 5 分钟
一介布衣
全栈开发者 / 技术写作者

补档说明:本文属于「AI 工程落地周记」系列,计划发布时间为 2025-03-23 21:30。当前先保留为草稿,后续补充真实案例、代码片段和复盘细节后再发布。

2025 年 3 月 11 日之后,我对 AI 应用的一些判断开始变得更明确了。不是因为那天突然出现了一个完全颠覆的新世界,而是因为“工具调用”和“围绕工具调用组织工作流”这件事,被越来越正式地推到了台前。那之后我更确定了一点:很多 AI 产品的价值中心,正在从“模型单次回答得多聪明”,转向“系统能不能围绕模型把事情做成”。

这两者看起来只差一点点,实际是完全不同的工程重心。

前一种重心下,团队更容易围绕 Prompt、模型榜单、单次回答效果去优化;后一种重心下,团队会开始更认真地讨论:

  • 哪些步骤适合交给模型判断
  • 哪些能力必须外置成工具
  • 失败后怎么回退
  • 多步任务怎么追踪
  • 结果怎么进入业务流程

我觉得这就是为什么“工作流 + 工具调用”在这个时间点之后显得更重要了。因为它把 AI 应用从“会说话”推进到了“能协作、能执行、能被治理”。

为什么单次回答已经不够了

如果 AI 只是做摘要、改写、闲聊,那么单次回答质量当然仍然是核心。但很多真实业务走到下一步之后,问题已经不再是“它会不会答”,而是:

  • 它能不能查到真实数据
  • 它能不能按规则调用系统能力
  • 它能不能把结果交还给后续流程
  • 它出错时能不能停下来

这时,模型不再是完整系统,而是系统中的一个判断节点。

一旦你接受这一点,设计思路就会明显变化。团队不会再只盯着“把 Prompt 再磨一磨”,而会开始思考怎样把模型放进一个更稳的工作流里。

工具调用的重要性,来自“事实”和“执行”被外置

我一直觉得,工具调用真正提升的不是炫技程度,而是事实获取和动作执行的边界清晰度。

1. 事实获取外置

模型不应该假装自己天然知道今天的库存、当前的审批状态、最新的文档版本。把这些交给工具去查,系统才更可信。

2. 动作执行外置

建工单、发通知、写数据库、更新状态,这些动作都不该靠模型“脑补执行”。模型可以决定要不要做,但真正执行必须走工具。

一旦事实和执行都外置,系统的可控性会大幅提升。因为你终于能看清楚:

  • 哪部分是模型判断
  • 哪部分是工具结果
  • 哪部分是业务规则

为什么工作流会跟着变重要

工具调用一旦变多,系统就不可能只靠“模型自己临场发挥”来完成复杂任务。你需要工作流来管理这些东西:

  • 步骤顺序
  • 状态流转
  • 成功条件
  • 重试策略
  • 人工兜底

工作流的价值,不是限制模型,而是把模型纳入一个能被运营和维护的系统里。

很多团队一开始把工作流理解成“繁琐的编排层”,后来才发现,没有这层,系统根本无法长期运行。

一个我越来越强的判断

我现在更相信这样一种分工:

  • 模型负责理解、判断、补全、选择
  • 工具负责查事实、做动作、返回结果
  • 工作流负责串联、约束、回退、记录

这三者缺一不可。

如果只有模型,没有工具,系统会停留在“看起来聪明”;如果只有工具,没有工作流,系统会很快变成一堆散乱调用;如果只有工作流,没有模型,系统又回到了纯规则系统。

真正成熟的 AI 应用,往往是三者配合。

它对产品设计意味着什么

这套变化会直接影响产品怎么设计。

以前一个 AI 功能的设计重点可能是:

  • 聊天窗口
  • 提示词
  • 单次结果展示

现在越来越多产品真正需要的是:

  • 任务面板
  • 步骤状态
  • 工具执行记录
  • 人工接管入口
  • 结果沉淀和回放

也就是说,产品不再只是“对话界面”,而更像“任务系统 + 工具系统 + 对话层”的组合。

为什么这件事对团队协作也有影响

工作流和工具调用变重要之后,项目分工也会跟着变。

原来可能只有“前端 + 调模型后端”就能撑起一个原型;现在更常见的是:

  • 平台层负责模型接入和通用调用能力
  • 业务层负责流程设计和规则约束
  • 数据层负责知识和工具结果治理
  • 运维层负责日志、限流、回放和审计

这说明 AI 应用的工程形态正在变成熟。它开始像一个完整系统,而不是一个单独的模型功能模块。

一个更接近现实的最小链路

async function handleRequest(input) {
const intent = await classifyIntent(input)
const plan = workflowFor(intent)

for (const step of plan) {
if (step.type === 'tool') {
step.result = await callTool(step.name, step.payload)
} else if (step.type === 'model') {
step.result = await callModel(step.prompt, step.context)
}
if (step.failed) return fallback(step)
}

return finalize(plan)
}

这段逻辑并不复杂,但它表达了一件很重要的事:模型已经不是唯一核心,真正核心的是围绕模型组织起来的工作流。

总结

2025-03-11 之后,“工作流 + 工具调用”为什么更重要了?因为 AI 应用正在从“生成一个看起来不错的回答”,进入“围绕模型、工具和规则组织一个可执行系统”的阶段。

这意味着工程重点也在变化。未来真正拉开差距的,未必是谁的 Prompt 更花,而更可能是谁更早把模型接进了可观测、可回退、可治理的工作流里。