只盯准确率会让你错过真正的业务问题
补档说明:本文属于「AI 工程落地周记」系列,计划发布时间为 2025-09-06 16:10。当前先保留为草稿,后续补充真实案例、代码片段和复盘细节后再发布。
很多 AI 项目一旦进入评测阶段,最容易被一个数字绑架:准确率。
准确率当然重要,但我后来越来越少单独看它。因为在线上系统里,准确率高并不自动等于业务效果好。有时候它甚至会掩盖真正的问题。
一个最典型的例子,就是某类客服分流功能。离线看分类准确率挺高,团队一开始很满意。但上线后业务同学还是不买账,因为真正痛的地方并没有被解决:
- 高价值工单还是会漏
- 低价值工单却被过度升级
- 人工审核量没有降多少
- 平均处理时长也没明显改善
也就是说,模型在“答题”这件事上可能不错,但业务在“运转”这件事上并没有变更好。
