一介布衣技术博客 | 一介布衣

跳到主要内容

AI 成本看板该删哪些指标：平均时长为什么不如 P95 首 token 延迟有用

2025年12月21日 · 阅读需 2 分钟

全栈开发者

AI 成本和体验看板里最该删掉的，往往是那些看起来平滑、却掩盖尾部问题的平均指标。

从零搭一个内部 AI 平台：模型网关、Prompt Registry 和评测流水线的最小实现

2025年12月11日 · 阅读需 2 分钟

全栈开发者

从零搭内部 AI 平台时，最重要的不是一次性把能力做全，而是先收出一个最小可治理的底座。

如果 2026 还继续做 AI，先补这三块基础设施：Trace、评测集和回放系统

2025年12月8日 · 阅读需 6 分钟

全栈开发者

如果让我给还打算继续做 AI 的团队只留三项投资建议，我不会先选更复杂的 Agent 框架，也不会先选更花哨的工作台。我会先问三个很现实的问题：线上某次异常到底发生了什么，最近一次改动到底是变好了还是变差了，三周前那次事故今天还能不能重放出来。如果这三个问题答不上来，后面所有“持续迭代”都很容易变成盲飞。

内容审核规则热修复实战：规则优先级、灰度发布和误杀回滚怎么做

2025年12月6日 · 阅读需 4 分钟

全栈开发者

内容审核最难看的时刻，通常不是漏了一条规则，而是补丁已经打上去了，现场却没人说得清它到底会影响谁、优先级会不会把旧规则压掉、误杀一旦冒出来要怎么撤。这个阶段如果还把规则更新理解成“改几行配置”，系统就很容易开始靠运气运行。

把单点 AI 功能做成系统能力：模型路由、评测回放和成本看板要怎么接

2025年11月28日 · 阅读需 2 分钟

全栈开发者

把单点 AI 功能做成系统能力，关键变化不在模型更强，而在团队开始补模型路由、评测回放和成本视图这些控制面。

2025 年最容易被高估的 5 个 AI 方案：全自动 Agent、超长上下文和纯 Prompt 工作流怎么取舍

2025年11月23日 · 阅读需 2 分钟

全栈开发者

很多被高估的 AI 话题之所以显得迷人，是因为大家只看到了 demo 的上限，没有认真算集成成本、维护成本和失败代价。

2025 年最值得复用的 10 个 AI 工程机制：评测集、幂等键和回放链路怎么落

2025年11月19日 · 阅读需 4 分钟

全栈开发者

如果让我回头看这一年最值得保留下来的 AI 工程经验，我已经不太想再列那些听上去很大的词，比如“平台化”“智能体化”或者“工作流升级”。这些词当然都重要，但真正被我反复带进不同项目里的，往往是更朴素、更具体的一层：哪些字段必须有，哪些状态必须落盘，哪些样本必须先收起来，哪些动作必须能回滚。

Node.js 调大模型接口的三层超时：前端等待、网关 deadline 和任务补偿怎么配

2025年11月17日 · 阅读需 2 分钟

全栈开发者

大模型接口的超时不是单个配置项，而是一条贯穿前端等待、网关 deadline 和异步补偿的用户体验契约。

AI 审批助手怎么划责任边界：证据引用、置信度和人工确认三层设计

2025年11月10日 · 阅读需 2 分钟

全栈开发者

审批助手一旦影响报销、准入、风控这类结果，系统就不能只输出一个结论，而必须把证据、置信度和最终确认者一起设计进去。

LLM 网关安全实战：API Key 隔离、工具白名单和输出审计怎么接

2025年11月3日 · 阅读需 2 分钟

全栈开发者

LLM 网关安全真正要收住的，不只是 prompt 注入，而是身份、工具、数据和输出这四层边界。