选择与路由：按任务/成本/延迟的策略 | 一介布衣

以“任务/成本/延迟/安全”四维度做路由，形成动态策略。

🎯 文章目标

给出可工程化的路由策略与实现
形成监控驱动的动态路由

📚 背景/前置

任务分层：抽取/写作/多步骤/高风险
指标：latency/成本/拒答率/错误率

🔧 核心内容

1) 路由策略

按任务类型：抽取走小模型，复杂写作走大模型
按长度：短文本与长文本分流
按风险：高风险任务走更安全的模型

2) 动态路由

指标感知：P95/错误率越界触发切换
成本感知：预算达到阈值自动降级

💡 实战示例：路由函数

javascript

function route(task){
  if (task.type==='抽取' && task.len<600) return 'small'
  if (task.risk==='high') return 'secure'
  return 'standard'
}

📊 对比/取舍（速查）

静态简单但僵硬；动态灵活但复杂

🧪 踩坑与经验

未接入指标，路由形同虚设
忽略降级路径，导致峰值期间超时

📎 参考与延伸

路由策略、A/B 与成本看板

💭 总结

用“任务/长度/风险 + 指标感知 + 降级/回退”的路由策略提升稳定性