AI 链路日志字段别随便起:traceId、sessionId、toolCallId 到底各指什么
· 阅读需 5 分钟
最尴尬的一次排查,不是没日志,而是四拨人都拿着“自己的那条 id”在说话。前端同学贴了一个 sessionId,BFF 说自己只有 requestId,工作流平台那边只认 runId,到了工具服务层又冒出一个没人见过的 trace。会议开了十几分钟,大家连“我们查的是不是同一次请求”都还没对齐。
最尴尬的一次排查,不是没日志,而是四拨人都拿着“自己的那条 id”在说话。前端同学贴了一个 sessionId,BFF 说自己只有 requestId,工作流平台那边只认 runId,到了工具服务层又冒出一个没人见过的 trace。会议开了十几分钟,大家连“我们查的是不是同一次请求”都还没对齐。
如果让我给还打算继续做 AI 的团队只留三项投资建议,我不会先选更复杂的 Agent 框架,也不会先选更花哨的工作台。我会先问三个很现实的问题:线上某次异常到底发生了什么,最近一次改动到底是变好了还是变差了,三周前那次事故今天还能不能重放出来。如果这三个问题答不上来,后面所有“持续迭代”都很容易变成盲飞。