图片能力
图片输入
通过支持的协议格式,把图片发送给具备视觉能力的模型。
图片输入和图片生成不同。图片输入是把图片发给模型,用于理解、提取或推理。
| 协议 | 常见图片格式 | Endpoint |
|---|---|---|
| Anthropic-compatible | type: "image" 的 content block,source 使用 base64 | /v1/messages |
| OpenAI-compatible | 根据 API 风格使用 image_url 或 input_image | /v1/chat/completions 或 /v1/responses |
| Gemini native | 带 mimeType 和 base64 data 的 inlineData | /v1beta/models/{model}:generateContent |
图片输入支持取决于所选模型。如果模型拒绝图片输入,请在同一 provider group 中选择具备视觉能力的模型。
AnyRoute 文档