Skip to content

计费说明

计费通常与输入 token、输出 token、模型单价和附加能力相关。

成本估算

$$ 总成本 = 输入Token成本 + 输出Token成本 + 附加能力成本 $$

优化建议

  1. 缩短无效上下文,降低输入 token。
  2. 为不同场景配置不同 max_tokens。
  3. 对低价值请求使用低成本模型。
  4. 对可缓存场景启用提示缓存。