调用与错误处理
本页聚焦生产环境常见问题,包括流式响应、函数调用和错误处理策略。
流式响应
当你需要更低的首字延迟时,可启用流式返回:
json
{
"model": "openai/gpt-5.3-codex",
"messages": [{ "role": "user", "content": "请总结以下内容" }],
"stream": true
}函数调用
建议将可执行动作定义为工具,并限制参数结构:
json
{
"tools": [
{
"type": "function",
"function": {
"name": "create_ticket",
"description": "创建工单",
"parameters": {
"type": "object",
"properties": {
"title": { "type": "string" },
"priority": { "type": "string", "enum": ["low", "medium", "high"] }
},
"required": ["title"]
}
}
}
]
}错误分类
| 类型 | 示例状态码 | 处理建议 |
|---|---|---|
| 请求错误 | 400 | 修正参数并记录失败样本 |
| 认证错误 | 401 | 检查密钥与权限范围 |
| 频率限制 | 429 | 使用指数退避并限制并发 |
| 服务异常 | 5xx | 保留 request_id 并重试 |
重试与熔断
- 仅对幂等请求进行自动重试。
- 重试间隔使用指数退避并增加随机抖动。
- 失败率持续升高时触发熔断,降级到备用模型。
观测建议
- 记录 request_id、模型名、耗时、输入 token、输出 token。
- 按模型和业务场景拆分成功率与延迟指标。
- 每周复盘错误码分布,优化提示词与参数设置。