调用与错误处理

本页聚焦生产环境常见问题，包括流式响应、函数调用和错误处理策略。

流式响应

当你需要更低的首字延迟时，可启用流式返回：

json

{
  "model": "openai/gpt-5.3-codex",
  "messages": [{ "role": "user", "content": "请总结以下内容" }],
  "stream": true
}

函数调用

建议将可执行动作定义为工具，并限制参数结构：

json

{
  "tools": [
    {
      "type": "function",
      "function": {
        "name": "create_ticket",
        "description": "创建工单",
        "parameters": {
          "type": "object",
          "properties": {
            "title": { "type": "string" },
            "priority": { "type": "string", "enum": ["low", "medium", "high"] }
          },
          "required": ["title"]
        }
      }
    }
  ]
}

错误分类

类型	示例状态码	处理建议
请求错误	400	修正参数并记录失败样本
认证错误	401	检查密钥与权限范围
频率限制	429	使用指数退避并限制并发
服务异常	5xx	保留 request_id 并重试

重试与熔断

仅对幂等请求进行自动重试。
重试间隔使用指数退避并增加随机抖动。
失败率持续升高时触发熔断，降级到备用模型。

观测建议

记录 request_id、模型名、耗时、输入 token、输出 token。
按模型和业务场景拆分成功率与延迟指标。
每周复盘错误码分布，优化提示词与参数设置。

调用与错误处理 ​

流式响应 ​

函数调用 ​

错误分类 ​

重试与熔断 ​

观测建议 ​

调用与错误处理

流式响应

函数调用

错误分类

重试与熔断

观测建议