Skip to content

故障回退

当主模型不可用或超时时,系统应自动切换到备用模型,保障业务连续性。

回退触发条件

  • 上游超时
  • 连续 5xx 错误
  • 限流持续超过阈值

回退策略

  1. 同能力模型优先回退,减少输出风格漂移。
  2. 回退后降低温度参数,提升稳定性。
  3. 对关键请求记录主备差异,持续优化。