多模态大模型(视觉)
支持图像输入的大模型,按输入价升序 · 共 152 个 · 数据更新于 2026-06-30
多模态模型除文本外还能接收图片作为输入,理解图表、照片、截图、文档扫描件等视觉信息。部分模型还支持音频/视频输入(见能力标记栏)。
| 模型 | 输入 | 输出 | 缓存读 | 缓存写 | 上下文 | 最大输出 | 能力 |
|---|---|---|---|---|---|---|---|
| Auto Router | $-1000000.00 | $-1000000.00 | — | — | 2M | — | 工具调用视觉文件音频推理结构化 |
| Free Models Router | $0.00 | $0.00 | — | — | 200K | — | 工具调用视觉推理结构化 |
| Lyria 3 Clip Preview | $0.00 | $0.00 | — | — | 1.05M | 66K | 视觉 |
| Lyria 3 Pro Preview | $0.00 | $0.00 | — | — | 1.05M | 66K | 视觉 |
| Gemma 3 12B | $0.05 | $0.15 | — | — | 131K | 16K | 工具调用视觉结构化 |
| Gemma 3 4B | $0.05 | $0.10 | — | — | 131K | 16K | 视觉结构化 |
| GPT-5 Nano | $0.05 | $0.40 | $0.01 | — | 400K | — | 工具调用视觉文件推理结构化 |
| Nova Lite 1.0 | $0.06 | $0.24 | — | — | 300K | 5K | 工具调用视觉 |
| Gemma 4 26B A4B | $0.06 | $0.33 | — | — | 262K | — | 工具调用视觉推理结构化 |
| Qwen3.5-Flash ≈¥0.44/¥1.77 | $0.07 | $0.26 | — | — | 1M | 66K | 工具调用视觉推理结构化 |
| Seed 1.6 Flash ≈¥0.51/¥2.04 | $0.07 | $0.30 | — | — | 262K | 33K | 工具调用视觉推理结构化 |
| Mistral Small 3.2 24B | $0.07 | $0.20 | — | — | 128K | 16K | 工具调用视觉结构化 |
| Gemma 3 27B | $0.08 | $0.16 | — | — | 131K | 16K | 工具调用视觉结构化 |
| Qwen3 VL 8B Instruct ≈¥0.54/¥3.4 | $0.08 | $0.50 | — | — | 256K | 33K | 工具调用视觉结构化 |
| Seed-2.0-Mini ≈¥0.68/¥2.72 | $0.10 | $0.40 | — | — | 262K | 131K | 工具调用视觉推理结构化 |
| UI-TARS 7B ≈¥0.68/¥1.36 | $0.10 | $0.20 | $0.10 | — | 128K | 2K | 视觉结构化 |
| Gemini 2.5 Flash Lite | $0.10 | $0.40 | $0.01 | $0.08 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Gemini 2.5 Flash Lite Preview 09-2025 | $0.10 | $0.40 | $0.01 | $0.08 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Llama 4 Scout | $0.10 | $0.30 | — | — | 10M | 16K | 工具调用视觉结构化 |
| Ministral 3 3B 2512 | $0.10 | $0.10 | $0.01 | — | 131K | — | 工具调用视觉结构化 |
| GPT-4.1 Nano | $0.10 | $0.40 | $0.03 | — | 1.05M | 33K | 工具调用视觉文件结构化 |
| Qwen3.5-9B ≈¥0.68/¥1.02 | $0.10 | $0.15 | — | — | 262K | 262K | 工具调用视觉推理结构化 |
| Reka Edge | $0.10 | $0.10 | — | — | 16K | 16K | 工具调用视觉结构化 |
| Qwen3 VL 32B Instruct ≈¥0.71/¥2.82 | $0.10 | $0.42 | — | — | 262K | 33K | 工具调用视觉结构化 |
| MiMo-V2.5 ≈¥0.71/¥1.9 | $0.10 | $0.28 | — | — | 1.05M | — | 工具调用视觉音频推理结构化 |
| Qwen3 VL 8B Thinking ≈¥0.79/¥9.27 | $0.12 | $1.36 | — | — | 256K | 33K | 工具调用视觉推理结构化 |
| Gemma 4 31B | $0.12 | $0.35 | $0.09 | — | 262K | 262K | 工具调用视觉推理结构化 |
| Qwen3 VL 30B A3B Instruct ≈¥0.88/¥3.53 | $0.13 | $0.52 | — | — | 262K | 33K | 工具调用视觉结构化 |
| Qwen3 VL 30B A3B Thinking ≈¥0.88/¥10.59 | $0.13 | $1.56 | — | — | 131K | 33K | 工具调用视觉推理结构化 |
| Qwen3.5-35B-A3B ≈¥0.95/¥6.79 | $0.14 | $1.00 | $0.05 | — | 262K | 82K | 工具调用视觉推理结构化 |
| Qwen3.6 35B A3B ≈¥0.95/¥6.79 | $0.14 | $1.00 | — | — | 262K | 262K | 工具调用视觉推理结构化 |
| Llama 4 Maverick | $0.15 | $0.60 | — | — | 1.05M | 16K | 工具调用视觉结构化 |
| Ministral 3 8B 2512 | $0.15 | $0.15 | $0.01 | — | 262K | — | 工具调用视觉结构化 |
| Mistral Small 4 | $0.15 | $0.60 | $0.01 | — | 262K | — | 工具调用视觉推理结构化 |
| GPT-4o-mini | $0.15 | $0.60 | $0.07 | — | 128K | 16K | 工具调用视觉文件结构化 |
| GPT-4o-mini (2024-07-18) | $0.15 | $0.60 | $0.07 | — | 128K | 16K | 工具调用视觉文件结构化 |
| Perceptron Mk1 | $0.15 | $1.50 | — | — | 33K | 8K | 视觉推理结构化 |
| Llama Guard 4 12B | $0.18 | $0.18 | — | — | 164K | 16K | 视觉 |
| Qwen3.6 Flash ≈¥1.27/¥7.64 | $0.19 | $1.13 | — | $0.23 | 1M | 66K | 工具调用视觉推理结构化 |
| Qwen3.5-27B ≈¥1.32/¥10.59 | $0.20 | $1.56 | — | — | 262K | 66K | 工具调用视觉推理结构化 |
| MiniMax-01 ≈¥1.36/¥7.47 | $0.20 | $1.10 | — | — | 1M | 1M | 视觉 |
| Ministral 3 14B 2512 | $0.20 | $0.20 | $0.02 | — | 262K | — | 工具调用视觉结构化 |
| GPT-5.4 Nano | $0.20 | $1.25 | $0.02 | — | 400K | 128K | 工具调用视觉文件推理结构化 |
| Qwen3 VL 235B A22B Instruct ≈¥1.36/¥5.98 | $0.20 | $0.88 | $0.11 | — | 262K | 16K | 工具调用视觉结构化 |
| Step 3.7 Flash ≈¥1.36/¥7.81 | $0.20 | $1.15 | $0.04 | — | 256K | 256K | 工具调用视觉推理结构化 |
| Claude 3 Haiku | $0.25 | $1.25 | $0.03 | $0.30 | 200K | 4K | 工具调用视觉 |
| Seed 1.6 ≈¥1.7/¥13.58 | $0.25 | $2.00 | — | — | 262K | 33K | 工具调用视觉推理结构化 |
| Seed-2.0-Lite ≈¥1.7/¥13.58 | $0.25 | $2.00 | — | — | 262K | 131K | 工具调用视觉推理结构化 |
| Gemini 3.1 Flash Lite | $0.25 | $1.50 | $0.03 | $0.08 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Gemini 3.1 Flash Lite Preview | $0.25 | $1.50 | $0.03 | $0.08 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Nex-N2-Pro | $0.25 | $1.00 | $0.03 | — | 262K | 262K | 视觉推理 |
| GPT-5 Mini | $0.25 | $2.00 | $0.03 | — | 400K | 128K | 工具调用视觉文件推理结构化 |
| GPT-5.1-Codex-Mini | $0.25 | $2.00 | $0.03 | — | 400K | 100K | 工具调用视觉推理结构化 |
| Qwen3.6 27B ≈¥1.76/¥16.19 | $0.26 | $2.38 | — | — | 262K | 262K | 工具调用视觉推理结构化 |
| Qwen3 VL 235B A22B Thinking ≈¥1.77/¥17.65 | $0.26 | $2.60 | — | — | 131K | 33K | 工具调用视觉推理结构化 |
| Qwen3.5 Plus 2026-02-15 ≈¥1.77/¥10.59 | $0.26 | $1.56 | — | — | 1M | 66K | 工具调用视觉推理结构化 |
| Qwen3.5-122B-A10B ≈¥1.77/¥14.12 | $0.26 | $2.08 | — | — | 262K | 262K | 工具调用视觉推理结构化 |
| Nova 2 Lite | $0.30 | $2.50 | — | — | 1M | 66K | 工具调用视觉文件推理 |
| Gemini 2.5 Flash | $0.30 | $2.50 | $0.03 | $0.08 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Nano Banana (Gemini 2.5 Flash Image) | $0.30 | $2.50 | $0.03 | $0.08 | 33K | 33K | 视觉结构化 |
| MiniMax M3 ≈¥2.04/¥8.15 | $0.30 | $1.20 | $0.06 | — | 1.05M | 512K | 工具调用视觉推理结构化 |
| Qwen3.5 Plus 2026-04-20 ≈¥2.04/¥12.22 | $0.30 | $1.80 | — | $0.38 | 1M | 66K | 工具调用视觉推理结构化 |
| GLM 4.6V ≈¥2.04/¥6.11 | $0.30 | $0.90 | $0.06 | — | 131K | 33K | 工具调用视觉推理 |
| Qwen3.7 Plus ≈¥2.17/¥8.69 | $0.32 | $1.28 | $0.06 | $0.40 | 1M | 66K | 工具调用视觉推理结构化 |
| Qwen3.6 Plus ≈¥2.21/¥13.24 | $0.33 | $1.95 | — | $0.41 | 1M | 66K | 工具调用视觉推理结构化 |
| Llama 3.2 11B Vision Instruct | $0.34 | $0.34 | — | — | 131K | 16K | 视觉 |
| Mistral Small 3.1 24B | $0.35 | $0.56 | — | — | 128K | 128K | 视觉 |
| Kimi K2.5 ≈¥2.55/¥13.75 | $0.38 | $2.02 | — | — | 262K | — | 工具调用视觉推理结构化 |
| Qwen3.5 397B A17B ≈¥2.61/¥16.64 | $0.39 | $2.45 | — | — | 256K | — | 工具调用视觉推理结构化 |
| Mistral Medium 3 | $0.40 | $2.00 | $0.04 | — | 131K | — | 工具调用视觉文件结构化 |
| Mistral Medium 3.1 | $0.40 | $2.00 | $0.04 | — | 131K | — | 工具调用视觉文件结构化 |
| GPT-4.1 Mini | $0.40 | $1.60 | $0.10 | — | 1.05M | 33K | 工具调用视觉文件结构化 |
| ERNIE 4.5 VL 424B A47B ≈¥2.85/¥8.49 | $0.42 | $1.25 | — | — | 131K | 16K | 视觉推理 |
| Gemini 3 Flash Preview | $0.50 | $3.00 | $0.05 | $0.08 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Nano Banana 2 (Gemini 3.1 Flash Image Preview) | $0.50 | $3.00 | — | — | 131K | 33K | 视觉推理结构化 |
| Nano Banana 2 (Gemini 3.1 Flash Image) | $0.50 | $3.00 | — | — | 131K | 33K | 视觉推理结构化 |
| Mistral Large 3 2512 | $0.50 | $1.50 | $0.05 | — | 262K | — | 工具调用视觉文件结构化 |
| GLM 4.5V ≈¥4.07/¥12.22 | $0.60 | $1.80 | $0.11 | — | 66K | 16K | 工具调用视觉推理 |
| Kimi K2.6 ≈¥4.48/¥23.15 | $0.66 | $3.41 | $0.14 | — | 262K | 262K | 工具调用视觉推理结构化 |
| Kimi K2.7 Code ≈¥5.02/¥23.77 | $0.74 | $3.50 | $0.15 | — | 262K | 16K | 工具调用视觉推理结构化 |
| GPT-5.4 Mini | $0.75 | $4.50 | $0.07 | — | 400K | 128K | 工具调用视觉文件推理结构化 |
| Nova Pro 1.0 | $0.80 | $3.20 | — | — | 300K | 5K | 工具调用视觉 |
| Qwen2.5 VL 72B Instruct ≈¥5.43/¥6.79 | $0.80 | $1.00 | $0.40 | — | 131K | 128K | 视觉结构化 |
| Claude Haiku 4.5 | $1.00 | $5.00 | $0.10 | $1.25 | 200K | 64K | 工具调用视觉文件推理结构化 |
| Sonar | $1.00 | $1.00 | — | — | 127K | — | 视觉 |
| Grok Build 0.1 | $1.00 | $2.00 | $0.20 | — | 256K | — | 工具调用视觉推理结构化 |
| o4 Mini | $1.10 | $4.40 | $0.28 | — | 200K | 100K | 工具调用视觉文件推理结构化 |
| o4 Mini High | $1.10 | $4.40 | $0.28 | — | 200K | 100K | 工具调用视觉文件推理结构化 |
| GLM 5V Turbo ≈¥8.15/¥27.16 | $1.20 | $4.00 | $0.24 | — | 203K | 131K | 工具调用视觉推理 |
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.13 | $0.38 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Gemini 2.5 Pro Preview 05-06 | $1.25 | $10.00 | $0.13 | $0.38 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Gemini 2.5 Pro Preview 06-05 | $1.25 | $10.00 | $0.13 | $0.38 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| GPT-5 | $1.25 | $10.00 | $0.13 | — | 400K | 128K | 工具调用视觉文件推理结构化 |
| GPT-5 Chat | $1.25 | $10.00 | $0.13 | — | 128K | 16K | 视觉文件结构化 |
| GPT-5 Codex | $1.25 | $10.00 | $0.13 | — | 400K | 128K | 工具调用视觉推理结构化 |
| GPT-5.1 | $1.25 | $10.00 | $0.13 | — | 400K | 128K | 工具调用视觉文件推理结构化 |
| GPT-5.1 Chat | $1.25 | $10.00 | $0.13 | — | 128K | 32K | 工具调用视觉文件结构化 |
| GPT-5.1-Codex | $1.25 | $10.00 | $0.13 | — | 400K | 128K | 工具调用视觉推理结构化 |
| GPT-5.1-Codex-Max | $1.25 | $10.00 | $0.13 | — | 400K | 128K | 工具调用视觉推理结构化 |
| Grok 4.20 | $1.25 | $2.50 | $0.20 | — | 2M | — | 工具调用视觉文件推理结构化 |
| Grok 4.20 Multi-Agent | $1.25 | $2.50 | $0.20 | — | 2M | — | 视觉文件推理结构化 |
| Grok 4.3 | $1.25 | $2.50 | $0.20 | — | 1M | — | 工具调用视觉文件推理结构化 |
| Gemini 3.5 Flash | $1.50 | $9.00 | $0.15 | $0.08 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Mistral Medium 3.5 | $1.50 | $7.50 | — | — | 262K | — | 工具调用视觉文件推理结构化 |
| GPT-5.2 | $1.75 | $14.00 | $0.17 | — | 400K | 128K | 工具调用视觉文件推理结构化 |
| GPT-5.2 Chat | $1.75 | $14.00 | $0.17 | — | 128K | 16K | 工具调用视觉文件结构化 |
| GPT-5.2-Codex | $1.75 | $14.00 | $0.17 | — | 400K | 128K | 工具调用视觉推理结构化 |
| GPT-5.3 Chat | $1.75 | $14.00 | $0.17 | — | 128K | 16K | 工具调用视觉文件结构化 |
| GPT-5.3-Codex | $1.75 | $14.00 | $0.17 | — | 400K | 128K | 工具调用视觉文件推理结构化 |
| Gemini 3.1 Pro Preview | $2.00 | $12.00 | $0.20 | $0.38 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Gemini 3.1 Pro Preview Custom Tools | $2.00 | $12.00 | $0.20 | $0.38 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Nano Banana Pro (Gemini 3 Pro Image Preview) | $2.00 | $12.00 | $0.20 | $0.38 | 66K | 33K | 视觉推理结构化 |
| Nano Banana Pro (Gemini 3 Pro Image) | $2.00 | $12.00 | $0.20 | $0.38 | 66K | 33K | 工具调用视觉推理结构化 |
| GPT-4.1 | $2.00 | $8.00 | $0.50 | — | 1.05M | — | 工具调用视觉文件结构化 |
| o3 | $2.00 | $8.00 | $0.50 | — | 200K | 100K | 工具调用视觉文件推理结构化 |
| o4 Mini Deep Research | $2.00 | $8.00 | $0.50 | — | 200K | 100K | 工具调用视觉文件推理结构化 |
| Sonar Reasoning Pro | $2.00 | $8.00 | — | — | 128K | — | 视觉推理 |
| Nova Premier 1.0 | $2.50 | $12.50 | $0.63 | — | 1M | 32K | 工具调用视觉 |
| GPT-4o | $2.50 | $10.00 | — | — | 128K | 16K | 工具调用视觉文件结构化 |
| GPT-4o (2024-08-06) | $2.50 | $10.00 | $1.25 | — | 128K | 16K | 工具调用视觉文件结构化 |
| GPT-4o (2024-11-20) | $2.50 | $10.00 | $1.25 | — | 128K | 16K | 工具调用视觉文件结构化 |
| GPT-5 Image Mini | $2.50 | $2.00 | $0.25 | — | 400K | 128K | 视觉文件推理结构化 |
| GPT-5.4 | $2.50 | $15.00 | $0.25 | — | 1.05M | 128K | 工具调用视觉文件推理结构化 |
| Claude Sonnet 4 | $3.00 | $15.00 | $0.30 | $3.75 | 1M | 64K | 工具调用视觉文件推理 |
| Claude Sonnet 4.5 | $3.00 | $15.00 | $0.30 | $3.75 | 1M | 64K | 工具调用视觉文件推理结构化 |
| Claude Sonnet 4.6 | $3.00 | $15.00 | $0.30 | $3.75 | 1M | 128K | 工具调用视觉文件推理结构化 |
| Sonar Pro | $3.00 | $15.00 | — | — | 200K | 8K | 视觉 |
| Sonar Pro Search | $3.00 | $15.00 | — | — | 200K | 8K | 视觉推理结构化 |
| Claude Opus 4.5 | $5.00 | $25.00 | $0.50 | $6.25 | 200K | 64K | 工具调用视觉文件推理结构化 |
| Claude Opus 4.6 | $5.00 | $25.00 | $0.50 | $6.25 | 1M | 128K | 工具调用视觉文件推理结构化 |
| Claude Opus 4.7 | $5.00 | $25.00 | $0.50 | $6.25 | 1M | 128K | 工具调用视觉文件推理结构化 |
| Claude Opus 4.8 | $5.00 | $25.00 | $0.50 | $6.25 | 1M | 128K | 工具调用视觉文件推理结构化 |
| GPT Chat Latest | $5.00 | $30.00 | $0.50 | — | 400K | 128K | 工具调用视觉文件结构化 |
| GPT-4o (2024-05-13) | $5.00 | $15.00 | — | — | 128K | 4K | 工具调用视觉文件结构化 |
| GPT-5.5 | $5.00 | $30.00 | $0.50 | — | 1.05M | 128K | 工具调用视觉文件推理结构化 |
| Fugu Ultra | $5.00 | $30.00 | $0.50 | — | 1M | 128K | 工具调用视觉推理结构化 |
| GPT-5.4 Image 2 | $8.00 | $15.00 | $2.00 | — | 272K | 128K | 视觉文件推理结构化 |
| Claude Fable 5 | $10.00 | $50.00 | $1.00 | $12.50 | 1M | 128K | 工具调用视觉文件推理结构化 |
| Claude Opus 4.8 (Fast) | $10.00 | $50.00 | $1.00 | $12.50 | 1M | 128K | 工具调用视觉文件推理结构化 |
| GPT-4 Turbo | $10.00 | $30.00 | — | — | 128K | 4K | 工具调用视觉结构化 |
| GPT-5 Image | $10.00 | $10.00 | $1.25 | — | 400K | 128K | 视觉文件推理结构化 |
| o3 Deep Research | $10.00 | $40.00 | $2.50 | — | 200K | 100K | 工具调用视觉文件推理结构化 |
| Claude Opus 4 | $15.00 | $75.00 | $1.50 | $18.75 | 200K | 32K | 工具调用视觉文件推理 |
| Claude Opus 4.1 | $15.00 | $75.00 | $1.50 | $18.75 | 200K | 32K | 工具调用视觉文件推理结构化 |
| GPT-5 Pro | $15.00 | $120.00 | — | — | 400K | 128K | 工具调用视觉文件推理结构化 |
| o1 | $15.00 | $60.00 | $7.50 | — | 200K | 100K | 工具调用视觉文件推理结构化 |
| o3 Pro | $20.00 | $80.00 | — | — | 200K | 100K | 工具调用视觉文件推理结构化 |
| GPT-5.2 Pro | $21.00 | $168.00 | — | — | 400K | 128K | 工具调用视觉文件推理结构化 |
| Claude Opus 4.7 (Fast) | $30.00 | $150.00 | $3.00 | $37.50 | 1M | 128K | 工具调用视觉文件推理结构化 |
| GPT-5.4 Pro | $30.00 | $180.00 | — | — | 1.05M | 128K | 工具调用视觉文件推理结构化 |
| GPT-5.5 Pro | $30.00 | $180.00 | — | — | 1.05M | 128K | 工具调用视觉文件推理结构化 |
| o1-pro | $150.00 | $600.00 | — | — | 200K | 100K | 视觉文件推理结构化 |
价格参考 OpenRouter 及各厂商公开页面整理,以官方为准。