以“任务/成本/延迟/安全”四维度做路由,形成动态策略。
🎯 文章目标
- 给出可工程化的路由策略与实现
- 形成监控驱动的动态路由
📚 背景/前置
- 任务分层:抽取/写作/多步骤/高风险
- 指标:latency/成本/拒答率/错误率
🔧 核心内容
1) 路由策略
- 按任务类型:抽取走小模型,复杂写作走大模型
- 按长度:短文本与长文本分流
- 按风险:高风险任务走更安全的模型
2) 动态路由
- 指标感知:P95/错误率越界触发切换
- 成本感知:预算达到阈值自动降级
💡 实战示例:路由函数
javascript
function route(task){
if (task.type==='抽取' && task.len<600) return 'small'
if (task.risk==='high') return 'secure'
return 'standard'
}
📊 对比/取舍(速查)
- 静态简单但僵硬;动态灵活但复杂
🧪 踩坑与经验
- 未接入指标,路由形同虚设
- 忽略降级路径,导致峰值期间超时
📎 参考与延伸
- 路由策略、A/B 与成本看板
💭 总结
- 用“任务/长度/风险 + 指标感知 + 降级/回退”的路由策略提升稳定性