一介布衣技术博客

一周成本变化观察

2025年7月21日 · 阅读需 5 分钟

一介布衣

全栈开发者

补档说明：本文属于「AI 工程落地周记」系列，计划发布时间为 2025-07-21 09:10。当前先保留为草稿，后续补充真实案例、代码片段和复盘细节后再发布。

很多团队第一次做 AI 成本复盘时，最先盯住的都是一个总数：这周花了多少钱，比上周多了还是少了。

这个数字当然重要，但它几乎永远不够解释问题。

我后来越来越相信，AI 成本看板如果只能回答“贵了没有”，那它对工程决策的帮助非常有限。真正有价值的是：这笔钱是被哪种请求、哪种失败路径、哪种系统漂移吃掉的。

前阵子我就碰到过一次很典型的情况：业务请求量几乎没变，但一周总成本突然涨了三成多。乍一看像是模型贵了，结果真正的问题根本不在模型单价。

从 Copilot 到 agentic coding，边界到底在哪里

2025年7月18日 · 阅读需 5 分钟

一介布衣

全栈开发者

补档说明：本文属于「AI 工程落地周记」系列，计划发布时间为 2025-07-18 09:10。当前先保留为草稿，后续补充真实案例、代码片段和复盘细节后再发布。

从 2025 年开始，几乎所有 AI 编程产品都在往“agentic coding”这个词靠。结果就是一个很现实的问题：大家都在说 Agent，但说的其实不是同一件事。

有人把“补全变聪明了”叫 agentic。有人把“能一次改多个文件”叫 agentic。也有人把“能接收目标、自己跑测试、自己收尾”才叫 agentic。

如果边界不先说清楚，团队在选工具、定规范、做试点的时候就会非常混乱。因为你以为你在评估“Agent 能力”，实际上你评估的可能只是一个更强的编辑器插件。

团队里引入 AI 编程，先定规范还是先买工具

2025年7月11日 · 阅读需 4 分钟

一介布衣

全栈开发者

补档说明：本文属于「AI 工程落地周记」系列，计划发布时间为 2025-07-11 16:10。当前先保留为草稿，后续补充真实案例、代码片段和复盘细节后再发布。

如果只从管理角度看，“先买工具还是先定规范”很像一个顺序问题；但真正落地到团队里，我更愿意把它理解成一个失败概率问题。因为这两条路都会通向使用 AI 编程，但通向的方式完全不同：

先买工具：上手快，但团队很容易各自形成野路子
先定规范：起步慢一点，但后面更容易稳定放大

我自己的结论越来越明确：工具当然要买，但规范应该先于工具成为团队共识。
不是因为规范比工具更重要，而是因为如果没有规范，工具会把团队原本就存在的差异和混乱放大得更快。

让 AI 写代码，最怕的不是错，而是看起来对

2025年7月2日 · 阅读需 4 分钟

一介布衣

全栈开发者

补档说明：本文属于「AI 工程落地周记」系列，计划发布时间为 2025-07-02 09:10。当前先保留为草稿，后续补充真实案例、代码片段和复盘细节后再发布。

我越来越觉得，AI 写代码最大的风险不是它会明显报错，而是它经常会生成一段“看起来特别像对的东西”。这种代码危险的地方就在于，它不会像语法错误那样立刻被发现，反而更容易一路混进 review、测试，最后在边角场景里才炸开。

我印象最深的一次，是一个缓存键生成函数。AI 给出的实现非常自然，变量名也不错，测试样例甚至都能过。但真正上线后我们才发现，它把两个不同参数集在某些顺序下算成了同一个 key，导致缓存串了。

这类问题最麻烦的，不是它难修，而是它在第一次看代码时太像“经验丰富的人写出来的东西”了。

AI 编码助手开始真正可用后，我的开发方式变了什么

2025年6月28日 · 阅读需 5 分钟

一介布衣

全栈开发者

补档说明：本文属于「AI 工程落地周记」系列，计划发布时间为 2025-06-28 10:20。当前先保留为草稿，后续补充真实案例、代码片段和复盘细节后再发布。

AI 编码助手真正开始可用之后，我最大的变化不是“写代码更快”这么简单，而是工作流本身变了。以前很多开发动作天然是线性的：看需求、想实现、写代码、跑测试、再修。现在它更像一个往返过程：

我先定义边界
让 AI 生成一个初版
我负责验证、删减、改名、重构
再把更清楚的上下文喂回去

也就是说，AI 没把开发变成“自动完成”，而是把很多工作从“手打实现”转移成了“定义问题和审查结果”。

这个变化一开始会让人有点不适应，因为你会明显感觉到自己不再只是 coder，而更像 reviewer、router 和 constraint designer。但一旦进入节奏，效率提升确实是实打实的。

一次前端流式渲染体验优化记录

2025年6月25日 · 阅读需 2 分钟

一介布衣

全栈开发者

这次优化很小，但非常值钱。问题出在一个对话页：模型流式返回 token 时，我们最初每收到一段就直接 setState 一次，结果页面在长回答场景里会明显抖动，尤其是移动端更明显。

最初大家直觉上以为这是“模型流太慢”或者“前端机器太差”，但真正看性能面板后才发现，问题不是响应慢，而是我们把过多的小更新直接推给了 React 渲染。

当工作流开始跨系统，凭证管理会突然变成大问题

2025年6月19日 · 阅读需 4 分钟

一介布衣

全栈开发者

工作流只在单系统里跑的时候，凭证问题常常被低估。很多团队一开始会觉得，不就是在环境变量里放几个 token 吗？等到真的开始跨系统：

调知识库
调邮件服务
调 CMS
调对象存储
调内部 API

这些 token、key、secret 就会突然从“配置细节”变成整条工作流最脆弱的一层。

我后来对这个问题印象最深的一次，是一个看起来很普通的内容发布工作流。它需要同时访问：

内部内容数据库
站点构建服务
第三方通知渠道
搜索索引 API

结果真正先出问题的，不是业务逻辑，而是凭证边界混乱：有的 token 权限过大，有的 token 被多个流程共用，有的过期了没人知道，还有的出错日志里直接把敏感信息暴露出来。

从那之后我才真正把“凭证管理”当成跨系统工作流的核心设计问题，而不是交给运维顺手处理的附属项。

一个小功能为什么不值得上 Agent

2025年6月13日 · 阅读需 6 分钟

一介布衣

全栈开发者

补档说明：本文属于「AI 工程落地周记」系列，计划发布时间为 2025-06-13 21:30。当前先保留为草稿，后续补充真实案例、代码片段和复盘细节后再发布。

很多团队在接入大模型之后，都会很快进入一个误区：只要某个功能里有“判断”“调用工具”“多轮交互”这些词，就想把它包装成 Agent。看起来好像更先进，也更符合行业叙事。

但真落到工程里，很多小功能的问题恰恰在于它们太小了，小到根本不值得引入 Agent 这一整套复杂度。

我后来越来越明确的一条原则是：能用一次结构化调用解决的问题，不要先升级成带规划、带循环、带状态恢复的 Agent 任务。

这不是保守，而是成本意识。因为对一个小功能来说，Agent 带来的往往不是“更强能力”，而是额外的系统负担：

更多运行时状态
更多日志和追踪字段
更多失败路径
更多权限边界
更多测试和回归成本

一个可追踪的 AI 内容流水线应该有哪些节点

2025年6月11日 · 阅读需 4 分钟

一介布衣

全栈开发者

很多团队在做 AI 内容流水线时，一开始只盯着“生成”。但只要流程开始进入多人协作、审核和发布，真正麻烦的问题马上会变成：

这篇内容现在处在哪一步
是谁改过它
哪一版被审核通过了
哪个模型、哪个模板生成的
出错时到底该回滚到哪里

如果这些问题回答不出来，系统虽然能生成内容，但很难被真正信任。

所以我后来越来越把“AI 内容流水线”理解成一条需要被追踪的状态链，而不是一个“生成完就结束”的文本处理脚本。

内容生产自动化最难的不是生成，而是审核和回滚

2025年6月6日 · 阅读需 5 分钟

一介布衣

全栈开发者

补档说明：本文属于「AI 工程落地周记」系列，计划发布时间为 2025-06-06 10:20。当前先保留为草稿，后续补充真实案例、代码片段和复盘细节后再发布。

如果只谈“生成一篇内容”，现在的大模型其实已经能做得像模像样了。真正把团队拖进泥里的，往往不是生成这一步，而是后面三件更现实的事：

谁来审核
错了怎么撤
撤了以后系统怎么恢复一致

我之所以会把这个问题单独拉出来讲，是因为我见过太多内容自动化项目，一开始都卡在“怎么生成得更好”，结果真正上线后最先出事故的，都是审核和回滚链路。

最典型的一次，是一条自动生成的内容流里，模型把一个引用来源写错了。正文本身看起来挺顺，发布动作也正常完成，但问题在于：

审核同学只看了前两段
发布后外链已经同步出去
内容又被下游渠道抓走了一份

这时候真正难的已经不是“修正文案”，而是“怎么让整条发布链恢复一致”。