AnyRouteAnyRoute 文档
AnyRouteAnyRoute 文档
首页

开始

AnyRoute 文档

工具

能力

图片能力OpenAI 图片Codex 图片生成Gemini 图片生成图片输入计费与限制

API 参考

运维与排错

常见问题
图片能力

图片输入

通过支持的协议格式,把图片发送给具备视觉能力的模型。

图片输入和图片生成不同。图片输入是把图片发给模型,用于理解、提取或推理。

协议常见图片格式Endpoint
Anthropic-compatibletype: "image" 的 content block,source 使用 base64/v1/messages
OpenAI-compatible根据 API 风格使用 image_url 或 input_image/v1/chat/completions 或 /v1/responses
Gemini native带 mimeType 和 base64 data 的 inlineData/v1beta/models/{model}:generateContent

图片输入支持取决于所选模型。如果模型拒绝图片输入,请在同一 provider group 中选择具备视觉能力的模型。

Gemini 图片生成

通过 Gemini native generateContent 使用 Gemini 图片模型。

计费与限制

理解图片权限、计费和常见限制。