Skip to content

用量追踪

通过用量追踪可以识别高成本请求、低收益任务与异常调用行为。

建议采集字段

  • tenant_id
  • project_id
  • model
  • request_id
  • input_tokens
  • output_tokens
  • latency_ms
  • status_code

分析建议

  1. 按业务线统计单位请求成本。
  2. 按模型对比效果与预算占比。
  3. 对异常峰值建立告警阈值。