模型与计费

长上下文

理解长上下文行为和 Gemini 长上下文计费。

长上下文请求可能和普通请求有不同的成本和路由行为。

Gemini native 请求在超过较高 token 阈值后，可能应用长上下文计费。这和普通 prompt / completion token 计费是分开的。

最佳实践：

速率限制

理解并发、等待队列和 provider 容量。

排错

修复 AnyRoute 常见配置和 API 错误。