Skip to content

控制台总览

控制台用于观察请求量、成功率、延迟和成本趋势。

核心指标

  • 请求总量
  • 成功率
  • P95 延迟
  • 输入输出 token
  • 成本消耗

排查流程

  1. 先看错误码分布是否异常。
  2. 再看单模型延迟是否抬升。
  3. 最后定位到具体 request_id 回放问题。