跳到主要内容

如果 2026 还继续做 AI,先补这三块基础设施:Trace、评测集和回放系统

· 阅读需 6 分钟
一介布衣
全栈开发者

如果让我给还打算继续做 AI 的团队只留三项投资建议,我不会先选更复杂的 Agent 框架,也不会先选更花哨的工作台。我会先问三个很现实的问题:线上某次异常到底发生了什么,最近一次改动到底是变好了还是变差了,三周前那次事故今天还能不能重放出来。如果这三个问题答不上来,后面所有“持续迭代”都很容易变成盲飞。

内容审核规则热修复实战:规则优先级、灰度发布和误杀回滚怎么做

· 阅读需 4 分钟
一介布衣
全栈开发者

内容审核最难看的时刻,通常不是漏了一条规则,而是补丁已经打上去了,现场却没人说得清它到底会影响谁、优先级会不会把旧规则压掉、误杀一旦冒出来要怎么撤。这个阶段如果还把规则更新理解成“改几行配置”,系统就很容易开始靠运气运行。

2025 年最值得复用的 10 个 AI 工程机制:评测集、幂等键和回放链路怎么落

· 阅读需 4 分钟
一介布衣
全栈开发者

如果让我回头看这一年最值得保留下来的 AI 工程经验,我已经不太想再列那些听上去很大的词,比如“平台化”“智能体化”或者“工作流升级”。这些词当然都重要,但真正被我反复带进不同项目里的,往往是更朴素、更具体的一层:哪些字段必须有,哪些状态必须落盘,哪些样本必须先收起来,哪些动作必须能回滚。