跳到主要内容
一介布衣
全栈开发者 / 技术写作者
查看所有作者

如果 2026 还继续做 AI,先补这三块基础设施:Trace、评测集和回放系统

· 阅读需 6 分钟
一介布衣
全栈开发者 / 技术写作者

如果让我给还打算继续做 AI 的团队只留三项投资建议,我不会先选更复杂的 Agent 框架,也不会先选更花哨的工作台。我会先问三个很现实的问题:线上某次异常到底发生了什么,最近一次改动到底是变好了还是变差了,三周前那次事故今天还能不能重放出来。如果这三个问题答不上来,后面所有“持续迭代”都很容易变成盲飞。

内容审核规则热修复实战:规则优先级、灰度发布和误杀回滚怎么做

· 阅读需 4 分钟
一介布衣
全栈开发者 / 技术写作者

内容审核最难看的时刻,通常不是漏了一条规则,而是补丁已经打上去了,现场却没人说得清它到底会影响谁、优先级会不会把旧规则压掉、误杀一旦冒出来要怎么撤。这个阶段如果还把规则更新理解成“改几行配置”,系统就很容易开始靠运气运行。

2025 年最值得复用的 10 个 AI 工程机制:评测集、幂等键和回放链路怎么落

· 阅读需 4 分钟
一介布衣
全栈开发者 / 技术写作者

如果让我回头看这一年最值得保留下来的 AI 工程经验,我已经不太想再列那些听上去很大的词,比如“平台化”“智能体化”或者“工作流升级”。这些词当然都重要,但真正被我反复带进不同项目里的,往往是更朴素、更具体的一层:哪些字段必须有,哪些状态必须落盘,哪些样本必须先收起来,哪些动作必须能回滚。

人在回路不是妥协,而是系统设计的一部分

· 阅读需 4 分钟
一介布衣
全栈开发者 / 技术写作者

补档说明:本文属于「AI 工程落地周记」系列,计划发布时间为 2025-10-24 20:15。当前先保留为草稿,后续补充真实案例、代码片段和复盘细节后再发布。

很多团队一开始做 AI 系统时,会把“人在回路”理解成一种过渡方案:

  • 现在模型还不够好,所以先让人兜着
  • 等以后模型更强,就把人拿掉

我以前也有点这样想。后来做的系统越来越多,反而越来越不这么看了。
我现在更倾向于认为:人在回路不是妥协,而是很多 AI 系统天然就该有的一层设计。

因为很多业务问题本来就不是“把人替掉”才算成功,而是“把人的注意力放到真正值得判断的地方”才算成功。