Skip to content

调用与错误处理

本页聚焦生产环境常见问题,包括流式响应、函数调用和错误处理策略。

流式响应

当你需要更低的首字延迟时,可启用流式返回:

json
{
  "model": "openai/gpt-5.3-codex",
  "messages": [{ "role": "user", "content": "请总结以下内容" }],
  "stream": true
}

函数调用

建议将可执行动作定义为工具,并限制参数结构:

json
{
  "tools": [
    {
      "type": "function",
      "function": {
        "name": "create_ticket",
        "description": "创建工单",
        "parameters": {
          "type": "object",
          "properties": {
            "title": { "type": "string" },
            "priority": { "type": "string", "enum": ["low", "medium", "high"] }
          },
          "required": ["title"]
        }
      }
    }
  ]
}

错误分类

类型示例状态码处理建议
请求错误400修正参数并记录失败样本
认证错误401检查密钥与权限范围
频率限制429使用指数退避并限制并发
服务异常5xx保留 request_id 并重试

重试与熔断

  1. 仅对幂等请求进行自动重试。
  2. 重试间隔使用指数退避并增加随机抖动。
  3. 失败率持续升高时触发熔断,降级到备用模型。

观测建议

  • 记录 request_id、模型名、耗时、输入 token、输出 token。
  • 按模型和业务场景拆分成功率与延迟指标。
  • 每周复盘错误码分布,优化提示词与参数设置。