大模型库
API 价格 · 上下文窗口 · 能力 · 变动历史
收录 306 个主流大模型 API 的价格(收费标准)、上下文窗口、最大输出与能力字段, 按厂商分组对比,价格变动每日自动追踪。价格以 美元 / 百万 tokens 计。 数据更新于 2026-06-10
输入最便宜的主力模型
- GPT-OSS 120B$0.04 去 OpenAI 官方开通 →官网
- DeepSeek V4 Flash$0.10
- Llama 4 Scout$0.10
输出最便宜的主力模型
- GPT-OSS 120B$0.18 去 OpenAI 官方开通 →官网
- DeepSeek V4 Flash$0.20
- Llama 4 Scout$0.30
在白名单主力模型中按当前输入/输出价(每百万 tokens)取最低,客观排序、与返佣无关;想按自己的用量比成本见下方计算器。
💰 成本计算器 — 按你的月用量,算哪个模型最划算
按当前价(数据更新于 2026-06-10)估算月成本,从低到高排序。仅供参考,以官方为准。
Anthropic 16
去 Anthropic 官方开通 →官网| 模型 | 输入 | 输出 | 缓存读 | 缓存写 | 上下文 | 最大输出 | 能力 |
|---|---|---|---|---|---|---|---|
| Claude Haiku 4.5 | $1.00 | $5.00 | $0.10 | $1.25 | 200K | 64K | 工具调用视觉文件推理结构化 |
| Claude Sonnet 4.6 | $3.00 | $15.00 | $0.30 | $3.75 | 1M | 128K | 工具调用视觉文件推理结构化 |
| Claude Opus 4.7 | $5.00 | $25.00 | $0.50 | $6.25 | 1M | 128K | 工具调用视觉文件推理结构化 |
| Claude Opus 4.8 | $5.00 | $25.00 | $0.50 | $6.25 | 1M | 128K | 工具调用视觉文件推理结构化 |
| Claude Fable 5 | $10.00 | $50.00 | $1.00 | $12.50 | 1M | 128K | 工具调用视觉文件推理结构化 |
| Claude 3 Haiku | $0.25 | $1.25 | $0.03 | $0.30 | 200K | 4K | 工具调用视觉 |
| Claude 3.5 Haiku | $0.80 | $4.00 | $0.08 | $1.00 | 200K | 8K | 工具调用视觉 |
| Claude Sonnet 4 | $3.00 | $15.00 | $0.30 | $3.75 | 1M | 64K | 工具调用视觉文件推理 |
| Claude Sonnet 4.5 | $3.00 | $15.00 | $0.30 | $3.75 | 1M | 64K | 工具调用视觉文件推理结构化 |
| Claude Opus 4.5 | $5.00 | $25.00 | $0.50 | $6.25 | 200K | 64K | 工具调用视觉文件推理结构化 |
| Claude Opus 4.6 | $5.00 | $25.00 | $0.50 | $6.25 | 1M | 128K | 工具调用视觉文件推理结构化 |
| Claude Opus 4.8 (Fast) | $10.00 | $50.00 | $1.00 | $12.50 | 1M | 128K | 工具调用视觉文件推理结构化 |
| Claude Opus 4 | $15.00 | $75.00 | $1.50 | $18.75 | 200K | 32K | 工具调用视觉文件推理 |
| Claude Opus 4.1 | $15.00 | $75.00 | $1.50 | $18.75 | 200K | 32K | 工具调用视觉文件推理结构化 |
| Claude Opus 4.6 (Fast) | $30.00 | $150.00 | $3.00 | $37.50 | 1M | 128K | 工具调用视觉文件推理结构化 |
| Claude Opus 4.7 (Fast) | $30.00 | $150.00 | $3.00 | $37.50 | 1M | 128K | 工具调用视觉文件推理结构化 |
OpenAI 60
去 OpenAI 官方开通 →官网| 模型 | 输入 | 输出 | 缓存读 | 缓存写 | 上下文 | 最大输出 | 能力 |
|---|---|---|---|---|---|---|---|
| GPT-OSS 120B | $0.04 | $0.18 | — | — | 131K | — | 工具调用推理结构化 |
| GPT-5.4 nano | $0.20 | $1.25 | $0.02 | — | 400K | 128K | 工具调用视觉文件推理结构化 |
| GPT-5.4 mini | $0.75 | $4.50 | $0.07 | — | 400K | 128K | 工具调用视觉文件推理结构化 |
| GPT-5.3 Codex | $1.75 | $14.00 | $0.17 | — | 400K | 128K | 工具调用视觉文件推理结构化 |
| GPT-5.4 | $2.50 | $15.00 | $0.25 | — | 1.05M | 128K | 工具调用视觉文件推理结构化 |
| GPT-5.5 | $5.00 | $30.00 | $0.50 | — | 1.05M | 128K | 工具调用视觉文件推理结构化 |
| GPT-5.5 Pro | $30.00 | $180.00 | — | — | 1.05M | 128K | 工具调用视觉文件推理结构化 |
| gpt-oss-20b | $0.03 | $0.14 | — | — | 131K | — | 工具调用推理结构化 |
| GPT-5 Nano | $0.05 | $0.40 | $0.01 | — | 400K | — | 工具调用视觉文件推理结构化 |
| gpt-oss-safeguard-20b | $0.07 | $0.30 | $0.04 | — | 131K | 66K | 工具调用推理 |
| GPT-4.1 Nano | $0.10 | $0.40 | $0.03 | — | 1.05M | 33K | 工具调用视觉文件结构化 |
| GPT-4o-mini | $0.15 | $0.60 | $0.07 | — | 128K | 16K | 工具调用视觉文件结构化 |
| GPT-4o-mini (2024-07-18) | $0.15 | $0.60 | $0.07 | — | 128K | 16K | 工具调用视觉文件结构化 |
| GPT-4o-mini Search Preview | $0.15 | $0.60 | — | — | 128K | 16K | 结构化 |
| GPT-5 Mini | $0.25 | $2.00 | $0.03 | — | 400K | 128K | 工具调用视觉文件推理结构化 |
| GPT-5.1-Codex-Mini | $0.25 | $2.00 | $0.03 | — | 400K | 100K | 工具调用视觉推理结构化 |
| GPT-4.1 Mini | $0.40 | $1.60 | $0.10 | — | 1.05M | 33K | 工具调用视觉文件结构化 |
| GPT-3.5 Turbo | $0.50 | $1.50 | — | — | 16K | 4K | 工具调用结构化 |
| GPT Audio Mini | $0.60 | $2.40 | — | — | 128K | 16K | 工具调用音频结构化 |
| GPT-3.5 Turbo (older v0613) | $1.00 | $2.00 | — | — | 4K | 4K | 工具调用结构化 |
| o3 Mini | $1.10 | $4.40 | $0.55 | — | 200K | 100K | 工具调用文件推理结构化 |
| o3 Mini High | $1.10 | $4.40 | $0.55 | — | 200K | 100K | 工具调用文件推理结构化 |
| o4 Mini | $1.10 | $4.40 | $0.28 | — | 200K | 100K | 工具调用视觉文件推理结构化 |
| o4 Mini High | $1.10 | $4.40 | $0.28 | — | 200K | 100K | 工具调用视觉文件推理结构化 |
| GPT-5 | $1.25 | $10.00 | $0.13 | — | 400K | 128K | 工具调用视觉文件推理结构化 |
| GPT-5 Chat | $1.25 | $10.00 | $0.13 | — | 128K | 16K | 视觉文件结构化 |
| GPT-5 Codex | $1.25 | $10.00 | $0.13 | — | 400K | 128K | 工具调用视觉推理结构化 |
| GPT-5.1 | $1.25 | $10.00 | $0.13 | — | 400K | 128K | 工具调用视觉文件推理结构化 |
| GPT-5.1 Chat | $1.25 | $10.00 | $0.13 | — | 128K | 32K | 工具调用视觉文件结构化 |
| GPT-5.1-Codex | $1.25 | $10.00 | $0.13 | — | 400K | 128K | 工具调用视觉推理结构化 |
| GPT-5.1-Codex-Max | $1.25 | $10.00 | $0.13 | — | 400K | 128K | 工具调用视觉推理结构化 |
| GPT-3.5 Turbo Instruct | $1.50 | $2.00 | — | — | 4K | 4K | 结构化 |
| GPT-5.2 | $1.75 | $14.00 | $0.17 | — | 400K | 128K | 工具调用视觉文件推理结构化 |
| GPT-5.2 Chat | $1.75 | $14.00 | $0.17 | — | 128K | 16K | 工具调用视觉文件结构化 |
| GPT-5.2-Codex | $1.75 | $14.00 | $0.17 | — | 400K | 128K | 工具调用视觉推理结构化 |
| GPT-5.3 Chat | $1.75 | $14.00 | $0.17 | — | 128K | 16K | 工具调用视觉文件结构化 |
| GPT-4.1 | $2.00 | $8.00 | $0.50 | — | 1.05M | — | 工具调用视觉文件结构化 |
| o3 | $2.00 | $8.00 | $0.50 | — | 200K | 100K | 工具调用视觉文件推理结构化 |
| o4 Mini Deep Research | $2.00 | $8.00 | $0.50 | — | 200K | 100K | 工具调用视觉文件推理结构化 |
| GPT Audio | $2.50 | $10.00 | — | — | 128K | 16K | 工具调用音频结构化 |
| GPT-4o | $2.50 | $10.00 | — | — | 128K | 16K | 工具调用视觉文件结构化 |
| GPT-4o (2024-08-06) | $2.50 | $10.00 | $1.25 | — | 128K | 16K | 工具调用视觉文件结构化 |
| GPT-4o (2024-11-20) | $2.50 | $10.00 | $1.25 | — | 128K | 16K | 工具调用视觉文件结构化 |
| GPT-4o Search Preview | $2.50 | $10.00 | — | — | 128K | 16K | 结构化 |
| GPT-5 Image Mini | $2.50 | $2.00 | $0.25 | — | 400K | 128K | 视觉文件推理结构化 |
| GPT-3.5 Turbo 16k | $3.00 | $4.00 | — | — | 16K | 4K | 工具调用结构化 |
| GPT Chat Latest | $5.00 | $30.00 | $0.50 | — | 400K | 128K | 工具调用视觉文件结构化 |
| GPT-4o (2024-05-13) | $5.00 | $15.00 | — | — | 128K | 4K | 工具调用视觉文件结构化 |
| GPT-5.4 Image 2 | $8.00 | $15.00 | $2.00 | — | 272K | 128K | 视觉文件推理结构化 |
| GPT-4 Turbo | $10.00 | $30.00 | — | — | 128K | 4K | 工具调用视觉结构化 |
| GPT-4 Turbo Preview | $10.00 | $30.00 | — | — | 128K | 4K | 工具调用结构化 |
| GPT-5 Image | $10.00 | $10.00 | $1.25 | — | 400K | 128K | 视觉文件推理结构化 |
| o3 Deep Research | $10.00 | $40.00 | $2.50 | — | 200K | 100K | 工具调用视觉文件推理结构化 |
| GPT-5 Pro | $15.00 | $120.00 | — | — | 400K | 128K | 工具调用视觉文件推理结构化 |
| o1 | $15.00 | $60.00 | $7.50 | — | 200K | 100K | 工具调用视觉文件推理结构化 |
| o3 Pro | $20.00 | $80.00 | — | — | 200K | 100K | 工具调用视觉文件推理结构化 |
| GPT-5.2 Pro | $21.00 | $168.00 | — | — | 400K | 128K | 工具调用视觉文件推理结构化 |
| GPT-4 | $30.00 | $60.00 | — | — | 8K | 4K | 工具调用结构化 |
| GPT-5.4 Pro | $30.00 | $180.00 | — | — | 1.05M | 128K | 工具调用视觉文件推理结构化 |
| o1-pro | $150.00 | $600.00 | — | — | 200K | 100K | 视觉文件推理结构化 |
Google 24
去 Google 官方开通 →官网| 模型 | 输入 | 输出 | 缓存读 | 缓存写 | 上下文 | 最大输出 | 能力 |
|---|---|---|---|---|---|---|---|
| Gemini 3.1 Flash-Lite | $0.25 | $1.50 | $0.03 | $0.08 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Gemini 2.5 Flash | $0.30 | $2.50 | $0.03 | $0.08 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Gemini 2.5 Pro | $1.25 | $10.00 | $0.13 | $0.38 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Gemini 3.5 Flash | $1.50 | $9.00 | $0.15 | $0.08 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Gemini 3.1 Pro | $2.00 | $12.00 | $0.20 | $0.38 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Lyria 3 Clip Preview | $0.00 | $0.00 | — | — | 1.05M | 66K | 视觉 |
| Lyria 3 Pro Preview | $0.00 | $0.00 | — | — | 1.05M | 66K | 视觉 |
| Gemma 3 12B | $0.05 | $0.15 | — | — | 131K | 16K | 工具调用视觉结构化 |
| Gemma 3 4B | $0.05 | $0.10 | — | — | 131K | 16K | 视觉结构化 |
| Gemma 3n 4B | $0.06 | $0.12 | — | — | 33K | — | |
| Gemma 4 26B A4B | $0.06 | $0.33 | — | — | 262K | — | 工具调用视觉推理结构化 |
| Gemma 3 27B | $0.08 | $0.16 | — | — | 131K | 16K | 工具调用视觉结构化 |
| Gemini 2.5 Flash Lite | $0.10 | $0.40 | $0.01 | $0.08 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Gemini 2.5 Flash Lite Preview 09-2025 | $0.10 | $0.40 | $0.01 | $0.08 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Gemma 4 31B | $0.12 | $0.36 | $0.09 | — | 262K | 8K | 工具调用视觉推理结构化 |
| Gemini 3.1 Flash Lite Preview | $0.25 | $1.50 | $0.03 | $0.08 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Nano Banana (Gemini 2.5 Flash Image) | $0.30 | $2.50 | $0.03 | $0.08 | 33K | 33K | 视觉结构化 |
| Gemini 3 Flash Preview | $0.50 | $3.00 | $0.05 | $0.08 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Nano Banana 2 (Gemini 3.1 Flash Image Preview) | $0.50 | $3.00 | — | — | 131K | 66K | 视觉推理结构化 |
| Gemma 2 27B | $0.65 | $0.65 | — | — | 8K | 2K | 结构化 |
| Gemini 2.5 Pro Preview 05-06 | $1.25 | $10.00 | $0.13 | $0.38 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Gemini 2.5 Pro Preview 06-05 | $1.25 | $10.00 | $0.13 | $0.38 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Gemini 3.1 Pro Preview Custom Tools | $2.00 | $12.00 | $0.20 | $0.38 | 1.05M | 66K | 工具调用视觉文件音频推理结构化 |
| Nano Banana Pro (Gemini 3 Pro Image Preview) | $2.00 | $12.00 | $0.20 | $0.38 | 66K | 33K | 视觉推理结构化 |
xAI 4
去 xAI 官方开通 →官网| 模型 | 输入 | 输出 | 缓存读 | 缓存写 | 上下文 | 最大输出 | 能力 |
|---|---|---|---|---|---|---|---|
| Grok Build 0.1 | $1.00 | $2.00 | $0.20 | — | 256K | — | 工具调用视觉推理结构化 |
| Grok 4.20 | $1.25 | $2.50 | $0.20 | — | 2M | — | 工具调用视觉文件推理结构化 |
| Grok 4.3 | $1.25 | $2.50 | $0.20 | — | 1M | — | 工具调用视觉推理结构化 |
| Grok 4.20 Multi-Agent | $2.00 | $6.00 | $0.20 | — | 2M | — | 视觉文件推理结构化 |
Meta 12
| 模型 | 输入 | 输出 | 缓存读 | 缓存写 | 上下文 | 最大输出 | 能力 |
|---|---|---|---|---|---|---|---|
| Llama 4 Scout | $0.10 | $0.30 | — | — | 10M | 16K | 工具调用视觉结构化 |
| Llama 4 Maverick | $0.15 | $0.60 | — | — | 1.05M | 16K | 工具调用视觉结构化 |
| Llama 3.1 8B Instruct | $0.02 | $0.03 | — | — | 131K | 16K | 工具调用结构化 |
| Llama 3.2 1B Instruct | $0.03 | $0.20 | — | — | 131K | 60K | |
| Llama 3.2 3B Instruct | $0.05 | $0.34 | — | — | 131K | 80K | |
| Llama 3.3 70B Instruct | $0.10 | $0.32 | — | — | 131K | 16K | 工具调用结构化 |
| Llama 3 8B Instruct | $0.14 | $0.14 | — | — | 8K | — | |
| Llama Guard 4 12B | $0.18 | $0.18 | — | — | 164K | 16K | 视觉 |
| Llama 3.2 11B Vision Instruct | $0.34 | $0.34 | — | — | 131K | 16K | 视觉 |
| Llama 3.1 70B Instruct | $0.40 | $0.40 | — | — | 131K | 16K | 工具调用结构化 |
| Llama Guard 3 8B | $0.48 | $0.03 | — | — | 131K | 131K | |
| Llama 3 70B Instruct | $0.51 | $0.74 | — | — | 8K | 8K | 结构化 |
Mistral 19
去 Mistral 官方开通 →官网| 模型 | 输入 | 输出 | 缓存读 | 缓存写 | 上下文 | 最大输出 | 能力 |
|---|---|---|---|---|---|---|---|
| Mistral Small 2603 | $0.15 | $0.60 | $0.01 | — | 262K | — | 工具调用视觉推理结构化 |
| Mistral Large 2512 | $0.50 | $1.50 | $0.05 | — | 262K | — | 工具调用视觉文件结构化 |
| Mistral Medium 3.5 | $1.50 | $7.50 | — | — | 262K | — | 工具调用视觉文件推理结构化 |
| Mistral Nemo | $0.02 | $0.03 | — | — | 131K | — | 工具调用结构化 |
| Mistral Small 3 | $0.05 | $0.08 | — | — | 33K | 16K | 结构化 |
| Mistral Small 3.2 24B | $0.07 | $0.20 | — | — | 128K | 16K | 工具调用视觉结构化 |
| Ministral 3 3B 2512 | $0.10 | $0.10 | $0.01 | — | 131K | — | 工具调用视觉结构化 |
| Voxtral Small 24B 2507 | $0.10 | $0.30 | $0.01 | — | 32K | — | 工具调用文件音频结构化 |
| Ministral 3 8B 2512 | $0.15 | $0.15 | $0.01 | — | 262K | — | 工具调用视觉结构化 |
| Ministral 3 14B 2512 | $0.20 | $0.20 | $0.02 | — | 262K | — | 工具调用视觉结构化 |
| Saba | $0.20 | $0.60 | $0.02 | — | 33K | — | 工具调用文件结构化 |
| Codestral 2508 | $0.30 | $0.90 | $0.03 | — | 256K | — | 工具调用文件结构化 |
| Mistral Small 3.1 24B | $0.35 | $0.56 | — | — | 128K | 128K | 视觉 |
| Devstral 2 2512 | $0.40 | $2.00 | $0.04 | — | 262K | — | 工具调用文件结构化 |
| Mistral Medium 3 | $0.40 | $2.00 | $0.04 | — | 131K | — | 工具调用视觉文件结构化 |
| Mistral Medium 3.1 | $0.40 | $2.00 | $0.04 | — | 131K | — | 工具调用视觉文件结构化 |
| Mistral Large | $2.00 | $6.00 | $0.20 | — | 128K | — | 工具调用文件结构化 |
| Mistral Large 2407 | $2.00 | $6.00 | $0.20 | — | 131K | — | 工具调用文件结构化 |
| Mixtral 8x22B Instruct | $2.00 | $6.00 | $0.20 | — | 66K | — | 工具调用文件结构化 |
DeepSeek 12
去 DeepSeek 官方开通 →官网| 模型 | 输入 | 输出 | 缓存读 | 缓存写 | 上下文 | 最大输出 | 能力 |
|---|---|---|---|---|---|---|---|
| DeepSeek V4 Flash ≈¥0.67/¥1.33 | $0.10 | $0.20 | $0.02 | — | 1.05M | 131K | 工具调用推理结构化 |
| DeepSeek V3.2 ≈¥1.55/¥2.33 | $0.23 | $0.34 | — | — | 131K | 64K | 工具调用推理结构化 |
| DeepSeek V4 Pro ≈¥2.95/¥5.9 | $0.43 | $0.87 | $0.00 | — | 1.05M | 384K | 工具调用推理结构化 |
| DeepSeek R1 ≈¥4.75/¥16.95 | $0.70 | $2.50 | — | — | 164K | 16K | 工具调用推理结构化 |
| DeepSeek V3 0324 ≈¥1.36/¥5.22 | $0.20 | $0.77 | $0.14 | — | 164K | 16K | 工具调用结构化 |
| DeepSeek V3 ≈¥1.36/¥5.42 | $0.20 | $0.80 | — | — | 131K | 16K | 工具调用结构化 |
| DeepSeek V3.1 ≈¥1.42/¥5.36 | $0.21 | $0.79 | $0.13 | — | 164K | 33K | 工具调用推理结构化 |
| DeepSeek V3.1 Terminus ≈¥1.83/¥6.44 | $0.27 | $0.95 | $0.13 | — | 164K | 33K | 工具调用推理结构化 |
| DeepSeek V3.2 Exp ≈¥1.83/¥2.78 | $0.27 | $0.41 | — | — | 164K | 66K | 工具调用推理结构化 |
| R1 Distill Qwen 32B ≈¥1.97/¥1.97 | $0.29 | $0.29 | — | — | 128K | 33K | 推理结构化 |
| R1 0528 ≈¥3.39/¥14.58 | $0.50 | $2.15 | $0.35 | — | 164K | 33K | 工具调用推理结构化 |
| R1 Distill Llama 70B ≈¥4.75/¥5.42 | $0.70 | $0.80 | — | — | 131K | 16K | 推理 |
阿里通义 46
去 阿里通义 官方开通 →官网| 模型 | 输入 | 输出 | 缓存读 | 缓存写 | 上下文 | 最大输出 | 能力 |
|---|---|---|---|---|---|---|---|
| 通义千问 Qwen3.6 Flash ≈¥1.27/¥7.63 | $0.19 | $1.13 | — | $0.23 | 1M | 66K | 工具调用视觉推理结构化 |
| 通义千问 Qwen3.7 Plus ≈¥2.71/¥10.85 | $0.40 | $1.60 | $0.08 | $0.50 | 1M | 66K | 工具调用视觉推理结构化 |
| 通义千问 Qwen3 Coder Plus ≈¥4.41/¥22.04 | $0.65 | $3.25 | $0.13 | $0.81 | 1M | 66K | 工具调用结构化 |
| 通义千问 Qwen3 Max ≈¥5.29/¥26.44 | $0.78 | $3.90 | $0.16 | $0.97 | 262K | 33K | 工具调用 |
| 通义千问 Qwen3.7 Max ≈¥8.48/¥25.43 | $1.25 | $3.75 | $0.25 | $1.56 | 1M | 66K | 工具调用推理结构化 |
| Qwen2.5 7B Instruct ≈¥0.27/¥0.68 | $0.04 | $0.10 | — | — | 131K | 33K | |
| Qwen3 30B A3B Instruct 2507 ≈¥0.33/¥1.31 | $0.05 | $0.19 | — | — | 131K | 32K | 工具调用结构化 |
| Qwen3 8B ≈¥0.34/¥2.71 | $0.05 | $0.40 | $0.05 | — | 131K | 8K | 工具调用推理结构化 |
| Qwen3.5-Flash ≈¥0.44/¥1.76 | $0.07 | $0.26 | — | — | 1M | 66K | 工具调用视觉推理结构化 |
| Qwen3 Coder 30B A3B Instruct ≈¥0.47/¥1.83 | $0.07 | $0.27 | — | — | 160K | 33K | 工具调用结构化 |
| Qwen3 30B A3B Thinking 2507 ≈¥0.54/¥2.71 | $0.08 | $0.40 | $0.08 | — | 131K | 131K | 工具调用推理结构化 |
| Qwen3 32B ≈¥0.54/¥1.9 | $0.08 | $0.28 | — | — | 131K | 16K | 工具调用推理结构化 |
| Qwen3 VL 8B Instruct ≈¥0.54/¥3.39 | $0.08 | $0.50 | — | — | 256K | 33K | 工具调用视觉结构化 |
| Qwen3 235B A22B Instruct 2507 ≈¥0.61/¥0.68 | $0.09 | $0.10 | — | — | 262K | 16K | 工具调用结构化 |
| Qwen3 Next 80B A3B Instruct ≈¥0.61/¥7.46 | $0.09 | $1.10 | — | — | 262K | 16K | 工具调用结构化 |
| Qwen3 Next 80B A3B Thinking ≈¥0.66/¥5.29 | $0.10 | $0.78 | — | — | 262K | 33K | 工具调用推理结构化 |
| Qwen3 14B ≈¥0.68/¥1.63 | $0.10 | $0.24 | — | — | 132K | 41K | 工具调用推理结构化 |
| Qwen3 235B A22B Thinking 2507 ≈¥0.68/¥0.68 | $0.10 | $0.10 | $0.10 | — | 262K | 262K | 工具调用推理结构化 |
| Qwen3.5-9B ≈¥0.68/¥1.02 | $0.10 | $0.15 | — | — | 262K | 262K | 工具调用视觉推理结构化 |
| Qwen3 VL 32B Instruct ≈¥0.71/¥2.82 | $0.10 | $0.42 | — | — | 262K | 33K | 工具调用视觉 |
| Qwen3 Coder Next ≈¥0.75/¥5.42 | $0.11 | $0.80 | $0.07 | — | 262K | 262K | 工具调用结构化 |
| Qwen3 VL 8B Thinking ≈¥0.79/¥9.25 | $0.12 | $1.36 | — | — | 256K | 33K | 工具调用视觉推理结构化 |
| Qwen3 30B A3B ≈¥0.81/¥3.39 | $0.12 | $0.50 | — | — | 131K | 16K | 工具调用推理结构化 |
| Qwen3 VL 30B A3B Instruct ≈¥0.88/¥3.53 | $0.13 | $0.52 | — | — | 262K | 33K | 工具调用视觉结构化 |
| Qwen3 VL 30B A3B Thinking ≈¥0.88/¥10.58 | $0.13 | $1.56 | — | — | 131K | 33K | 工具调用视觉推理结构化 |
| Qwen3.5-35B-A3B ≈¥0.95/¥6.78 | $0.14 | $1.00 | $0.05 | — | 262K | 262K | 工具调用视觉推理结构化 |
| Qwen3.6 35B A3B ≈¥0.95/¥6.78 | $0.14 | $1.00 | — | — | 262K | 262K | 工具调用视觉推理结构化 |
| Qwen3 Coder Flash ≈¥1.32/¥6.61 | $0.20 | $0.97 | $0.04 | $0.24 | 1M | 66K | 工具调用 |
| Qwen3.5-27B ≈¥1.32/¥10.58 | $0.20 | $1.56 | — | — | 262K | 66K | 工具调用视觉推理结构化 |
| Qwen3 VL 235B A22B Instruct ≈¥1.36/¥5.97 | $0.20 | $0.88 | $0.11 | — | 262K | 16K | 工具调用视觉结构化 |
| Qwen3 Coder 480B A35B ≈¥1.49/¥12.2 | $0.22 | $1.80 | — | — | 1.05M | 66K | 工具调用结构化 |
| Qwen2.5 VL 72B Instruct ≈¥1.7/¥5.09 | $0.25 | $0.75 | — | — | 131K | — | 视觉结构化 |
| Qwen Plus 0728 ≈¥1.76/¥5.29 | $0.26 | $0.78 | — | — | 1M | 33K | 工具调用结构化 |
| Qwen-Plus ≈¥1.76/¥5.29 | $0.26 | $0.78 | $0.05 | $0.33 | 1M | 33K | 工具调用 |
| Qwen3 VL 235B A22B Thinking ≈¥1.76/¥17.63 | $0.26 | $2.60 | — | — | 131K | 33K | 工具调用视觉推理 |
| Qwen3.5 Plus 2026-02-15 ≈¥1.76/¥10.58 | $0.26 | $1.56 | — | — | 1M | 66K | 工具调用视觉推理结构化 |
| Qwen3.5-122B-A10B ≈¥1.76/¥14.1 | $0.26 | $2.08 | — | — | 262K | 262K | 工具调用视觉推理结构化 |
| Qwen3.6 27B ≈¥1.96/¥16.27 | $0.29 | $2.40 | — | — | 262K | 131K | 工具调用视觉推理结构化 |
| Qwen3.5 Plus 2026-04-20 ≈¥2.03/¥12.2 | $0.30 | $1.80 | — | $0.38 | 1M | 66K | 工具调用视觉推理结构化 |
| Qwen3.6 Plus ≈¥2.2/¥13.22 | $0.33 | $1.95 | — | $0.41 | 1M | 66K | 工具调用视觉推理结构化 |
| Qwen2.5 72B Instruct ≈¥2.44/¥2.71 | $0.36 | $0.40 | — | — | 131K | 16K | 工具调用结构化 |
| Qwen3.5 397B A17B ≈¥2.64/¥15.87 | $0.39 | $2.34 | — | — | 262K | 66K | 工具调用视觉推理结构化 |
| Qwen3 235B A22B ≈¥3.08/¥12.34 | $0.46 | $1.82 | — | — | 131K | 8K | 工具调用推理 |
| Qwen2.5 Coder 32B Instruct ≈¥4.47/¥6.78 | $0.66 | $1.00 | — | — | 128K | 33K | |
| Qwen3 Max Thinking ≈¥5.29/¥26.44 | $0.78 | $3.90 | — | — | 262K | 33K | 工具调用推理结构化 |
| Qwen3.6 Max Preview ≈¥7.05/¥42.31 | $1.04 | $6.24 | — | $1.30 | 262K | 66K | 工具调用推理结构化 |
月之暗面 5
去 月之暗面 官方开通 →官网| 模型 | 输入 | 输出 | 缓存读 | 缓存写 | 上下文 | 最大输出 | 能力 |
|---|---|---|---|---|---|---|---|
| Kimi K2.5 ≈¥2.71/¥12.88 | $0.40 | $1.90 | $0.09 | — | 262K | 262K | 工具调用视觉推理结构化 |
| Kimi K2 Thinking ≈¥4.07/¥16.95 | $0.60 | $2.50 | — | — | 262K | 262K | 工具调用推理结构化 |
| Kimi K2.6 ≈¥4.61/¥23.12 | $0.68 | $3.41 | $0.34 | — | 262K | 262K | 工具调用视觉推理结构化 |
| Kimi K2 0711 ≈¥3.86/¥15.59 | $0.57 | $2.30 | — | — | 131K | 33K | 工具调用 |
| Kimi K2 0905 ≈¥4.07/¥16.95 | $0.60 | $2.50 | — | — | 262K | 262K | 工具调用结构化 |
智谱 10
去 智谱 官方开通 →官网| 模型 | 输入 | 输出 | 缓存读 | 缓存写 | 上下文 | 最大输出 | 能力 |
|---|---|---|---|---|---|---|---|
| 智谱 GLM-4.7 ≈¥2.71/¥11.87 | $0.40 | $1.75 | $0.08 | — | 203K | 131K | 工具调用推理结构化 |
| 智谱 GLM-5 ≈¥4.07/¥13.02 | $0.60 | $1.92 | $0.12 | — | 203K | — | 工具调用推理结构化 |
| 智谱 GLM-5.1 ≈¥6.64/¥20.88 | $0.98 | $3.08 | $0.18 | — | 203K | — | 工具调用推理结构化 |
| GLM 4.7 Flash ≈¥0.41/¥2.71 | $0.06 | $0.40 | $0.01 | — | 203K | 16K | 工具调用推理结构化 |
| GLM 4.5 Air ≈¥0.85/¥5.76 | $0.13 | $0.85 | $0.06 | — | 131K | 131K | 工具调用推理 |
| GLM 4.6V ≈¥2.03/¥6.1 | $0.30 | $0.90 | $0.06 | — | 131K | 33K | 工具调用视觉推理 |
| GLM 4.6 ≈¥2.92/¥11.8 | $0.43 | $1.74 | $0.08 | — | 203K | 131K | 工具调用推理结构化 |
| GLM 4.5 ≈¥4.07/¥14.92 | $0.60 | $2.20 | $0.11 | — | 131K | 98K | 工具调用推理 |
| GLM 4.5V ≈¥4.07/¥12.2 | $0.60 | $1.80 | $0.11 | — | 66K | 16K | 工具调用视觉推理 |
| GLM 5 Turbo ≈¥8.14/¥27.12 | $1.20 | $4.00 | $0.24 | — | 262K | 131K | 工具调用推理 |
MiniMax 8
去 MiniMax 官方开通 →官网| 模型 | 输入 | 输出 | 缓存读 | 缓存写 | 上下文 | 最大输出 | 能力 |
|---|---|---|---|---|---|---|---|
| MiniMax M2.7 ≈¥1.83/¥7.32 | $0.27 | $1.08 | $0.05 | — | 205K | 131K | 工具调用推理结构化 |
| MiniMax M3 ≈¥2.03/¥8.14 | $0.30 | $1.20 | $0.06 | — | 1.05M | 512K | 工具调用视觉推理 |
| MiniMax M2.5 ≈¥1.02/¥6.1 | $0.15 | $0.90 | $0.05 | — | 205K | 197K | 工具调用推理结构化 |
| MiniMax-01 ≈¥1.36/¥7.46 | $0.20 | $1.10 | — | — | 1M | 1M | 视觉 |
| MiniMax M2 ≈¥1.73/¥6.78 | $0.26 | $1.00 | $0.03 | — | 205K | 197K | 工具调用推理结构化 |
| MiniMax M2.1 ≈¥1.97/¥6.44 | $0.29 | $0.95 | $0.03 | — | 205K | 197K | 工具调用推理结构化 |
| MiniMax M2-her ≈¥2.03/¥8.14 | $0.30 | $1.20 | $0.03 | — | 66K | 2K | |
| MiniMax M1 ≈¥2.71/¥14.92 | $0.40 | $2.20 | — | — | 1M | 40K | 工具调用推理 |
英伟达 5
去 英伟达 官方开通 →官网| 模型 | 输入 | 输出 | 缓存读 | 缓存写 | 上下文 | 最大输出 | 能力 |
|---|---|---|---|---|---|---|---|
| Nemotron 3 Ultra | $0.50 | $2.50 | $0.15 | — | 1M | 16K | 工具调用推理结构化 |
| Nemotron 3 Super | $0.09 | $0.45 | — | — | 1M | — | 工具调用推理 |
| Nemotron 3 Nano 30B A3B | $0.05 | $0.20 | — | — | 262K | 228K | 工具调用推理 |
| Llama 3.3 Nemotron Super 49B V1.5 | $0.40 | $0.40 | — | — | 131K | 16K | 工具调用推理 |
| Nemotron Nano 9B V2 | $0.04 | $0.16 | — | — | 131K | 16K | 工具调用推理 |
其它厂商 85
| 模型 | 输入 | 输出 | 缓存读 | 缓存写 | 上下文 | 最大输出 | 能力 |
|---|---|---|---|---|---|---|---|
| Jamba Large 1.7 | $2.00 | $8.00 | — | — | 256K | 4K | 工具调用 |
| Aion-1.0-Mini | $0.70 | $1.40 | — | — | 131K | 33K | 推理 |
| Aion-2.0 | $0.80 | $1.60 | $0.20 | — | 131K | 33K | 推理 |
| Aion-RP 1.0 (8B) | $0.80 | $1.60 | — | — | 33K | 33K | |
| Aion-1.0 | $4.00 | $8.00 | — | — | 131K | 33K | 推理 |
| Olmo 3 32B Think | $0.15 | $0.50 | — | — | 66K | 66K | 推理结构化 |
| Nova Micro 1.0 | $0.04 | $0.14 | — | — | 128K | 5K | 工具调用 |
| Nova Lite 1.0 | $0.06 | $0.24 | — | — | 300K | 5K | 工具调用视觉 |
| Nova 2 Lite | $0.30 | $2.50 | — | — | 1M | 66K | 工具调用视觉文件推理 |
| Nova Pro 1.0 | $0.80 | $3.20 | — | — | 300K | 5K | 工具调用视觉 |
| Nova Premier 1.0 | $2.50 | $12.50 | $0.63 | — | 1M | 32K | 工具调用视觉 |
| Magnum v4 72B | $3.00 | $5.00 | — | — | 33K | 2K | |
| Trinity Mini | $0.04 | $0.15 | — | — | 131K | 131K | 工具调用推理结构化 |
| Trinity Large Thinking | $0.22 | $0.85 | $0.06 | — | 262K | 262K | 工具调用推理结构化 |
| Coder Large | $0.50 | $0.80 | — | — | 33K | — | |
| Virtuoso Large | $0.75 | $1.20 | — | — | 131K | 64K | 工具调用 |
| ERNIE 4.5 VL 424B A47B ≈¥2.85/¥8.48 | $0.42 | $1.25 | — | — | 131K | 16K | 视觉推理 |
| UI-TARS 7B ≈¥0.68/¥1.36 | $0.10 | $0.20 | $0.10 | — | 128K | 2K | 视觉 |
| Seed 1.6 Flash ≈¥0.51/¥2.03 | $0.07 | $0.30 | — | — | 262K | 33K | 工具调用视觉推理结构化 |
| Seed-2.0-Mini ≈¥0.68/¥2.71 | $0.10 | $0.40 | — | — | 262K | 131K | 工具调用视觉推理结构化 |
| Seed 1.6 ≈¥1.7/¥13.56 | $0.25 | $2.00 | — | — | 262K | 33K | 工具调用视觉推理结构化 |
| Seed-2.0-Lite ≈¥1.7/¥13.56 | $0.25 | $2.00 | — | — | 262K | 131K | 工具调用视觉推理结构化 |
| Command R7B (12-2024) | $0.04 | $0.15 | — | — | 128K | 4K | 结构化 |
| Command R (08-2024) | $0.15 | $0.60 | — | — | 128K | 4K | 工具调用结构化 |
| Command A | $2.50 | $10.00 | — | — | 256K | 8K | 结构化 |
| Command R+ (08-2024) | $2.50 | $10.00 | — | — | 128K | 4K | 工具调用结构化 |
| Cogito v2.1 671B | $1.25 | $1.25 | — | — | 128K | — | 推理结构化 |
| Rnj 1 Instruct | $0.15 | $0.15 | — | — | 33K | — | 工具调用结构化 |
| MythoMax 13B | $0.06 | $0.06 | — | — | 4K | 4K | 结构化 |
| Granite 4.0 Micro | $0.02 | $0.11 | — | — | 131K | 131K | |
| Granite 4.1 8B | $0.05 | $0.10 | $0.05 | — | 131K | 131K | 工具调用结构化 |
| Mercury 2 | $0.25 | $0.75 | $0.03 | — | 128K | 50K | 工具调用推理结构化 |
| Ling-2.6-flash | $0.01 | $0.03 | $0.00 | — | 262K | 33K | 工具调用结构化 |
| Ling-2.6-1T | $0.07 | $0.63 | $0.01 | — | 262K | 33K | 工具调用结构化 |
| Ring-2.6-1T | $0.07 | $0.63 | $0.01 | — | 262K | 66K | 工具调用推理 |
| Inflection 3 Pi | $2.50 | $10.00 | — | — | 8K | 1K | |
| Inflection 3 Productivity | $2.50 | $10.00 | — | — | 8K | 1K | |
| KAT-Coder-Pro V2 | $0.30 | $1.20 | $0.06 | — | 256K | 80K | 工具调用结构化 |
| LFM2-24B-A2B | $0.03 | $0.12 | — | — | 128K | — | |
| Weaver (alpha) | $0.75 | $1.00 | — | — | 8K | 2K | |
| Phi 4 | $0.07 | $0.14 | — | — | 16K | 16K | 结构化 |
| Phi 4 Mini Instruct | $0.08 | $0.35 | $0.08 | — | 131K | 128K | 结构化 |
| WizardLM-2 8x22B | $0.62 | $0.62 | — | — | 66K | 8K | |
| Morph V3 Fast | $0.80 | $1.20 | — | — | 82K | 38K | |
| Morph V3 Large | $0.90 | $1.90 | — | — | 262K | 131K | |
| Hermes 4 70B | $0.13 | $0.40 | — | — | 131K | — | 推理 |
| Hermes 3 70B Instruct | $0.70 | $0.70 | — | — | 131K | 16K | 结构化 |
| Hermes 3 405B Instruct | $1.00 | $1.00 | — | — | 131K | 16K | 结构化 |
| Hermes 4 405B | $1.00 | $3.00 | — | — | 131K | — | 推理 |
| Auto Router | $-1000000.00 | $-1000000.00 | — | — | 2M | — | 工具调用视觉文件音频推理结构化 |
| Body Builder (beta) | $-1000000.00 | $-1000000.00 | — | — | 128K | — | |
| Fusion | $-1000000.00 | $-1000000.00 | — | — | 128K | — | |
| Pareto Code Router | $-1000000.00 | $-1000000.00 | — | — | 2M | — | |
| Free Models Router | $0.00 | $0.00 | — | — | 200K | — | 工具调用视觉推理结构化 |
| Owl Alpha | $0.00 | $0.00 | — | — | 1.05M | 262K | 工具调用结构化 |
| Perceptron Mk1 | $0.15 | $1.50 | — | — | 33K | 8K | 视觉推理结构化 |
| Sonar | $1.00 | $1.00 | — | — | 127K | — | 视觉 |
| Sonar Deep Research | $2.00 | $8.00 | — | — | 128K | — | 推理 |
| Sonar Reasoning Pro | $2.00 | $8.00 | — | — | 128K | — | 视觉推理 |
| Sonar Pro | $3.00 | $15.00 | — | — | 200K | 8K | 视觉 |
| Sonar Pro Search | $3.00 | $15.00 | — | — | 200K | 8K | 视觉推理结构化 |
| INTELLECT-3 | $0.20 | $1.10 | — | — | 131K | 131K | 工具调用推理结构化 |
| Reka Edge | $0.10 | $0.10 | — | — | 16K | 16K | 工具调用视觉结构化 |
| Reka Flash 3 | $0.10 | $0.20 | — | — | 66K | 66K | 推理 |
| Relace Apply 3 | $0.85 | $1.25 | — | — | 256K | 128K | |
| Relace Search | $1.00 | $3.00 | — | — | 256K | 128K | 工具调用 |
| Llama 3 8B Lunaris | $0.04 | $0.05 | — | — | 8K | 16K | 结构化 |
| Llama 3.3 Euryale 70B | $0.65 | $0.75 | — | — | 131K | 16K | 结构化 |
| Llama 3.1 Euryale 70B v2.2 | $0.85 | $0.85 | — | — | 131K | 16K | 工具调用结构化 |
| Llama 3.1 70B Hanami x1 | $3.00 | $3.00 | — | — | 16K | — | |
| Step 3.5 Flash ≈¥0.61/¥2.03 | $0.09 | $0.30 | $0.02 | — | 262K | 16K | 工具调用推理 |
| Step 3.7 Flash ≈¥1.36/¥7.8 | $0.20 | $1.15 | $0.04 | — | 256K | 256K | 工具调用视觉推理结构化 |
| Switchpoint Router | $0.85 | $3.40 | — | — | 131K | — | 推理 |
| Hy3 preview ≈¥0.43/¥1.42 | $0.06 | $0.21 | $0.02 | — | 262K | — | 工具调用推理 |
| Hunyuan A13B Instruct ≈¥0.95/¥3.86 | $0.14 | $0.57 | — | — | 131K | 131K | 推理结构化 |
| Rocinante 12B | $0.17 | $0.43 | — | — | 33K | 33K | 工具调用结构化 |
| Cydonia 24B V4.1 | $0.30 | $0.50 | $0.15 | — | 131K | 131K | |
| UnslopNemo 12B | $0.40 | $0.40 | — | — | 33K | 33K | 工具调用结构化 |
| Skyfall 36B V2 | $0.55 | $0.80 | $0.25 | — | 33K | 33K | |
| ReMM SLERP 13B | $0.45 | $0.65 | — | — | 6K | 4K | 结构化 |
| Solar Pro 3 | $0.15 | $0.60 | $0.01 | — | 128K | — | 工具调用推理结构化 |
| Palmyra X5 | $0.60 | $6.00 | — | — | 1.04M | 8K | |
| MiMo-V2-Flash ≈¥0.68/¥2.03 | $0.10 | $0.30 | $0.01 | — | 262K | 66K | 工具调用推理 |
| MiMo-V2.5 ≈¥0.95/¥1.9 | $0.14 | $0.28 | $0.00 | — | 1.05M | 131K | 工具调用视觉音频推理 |
| MiMo-V2.5-Pro ≈¥2.95/¥5.9 | $0.43 | $0.87 | $0.00 | — | 1.05M | 131K | 工具调用推理结构化 |
常见问题
100 万 tokens 大约是多少中文字?
token 不等于字。按经验,1 个 token 约对应 0.5~1 个汉字(英文约 0.75 个单词),因此 100 万 tokens 中文大致在 60~100 万字量级、英文约 75 万词,具体随分词与内容而变。各家计费均按 token、不按字数,实际消耗以官方返回的 usage 为准。
为什么 output(输出)价通常比 input(输入)贵?
输出是模型逐 token 自回归生成的,每个 token 都要完整跑一遍前向计算,算力成本高;输入只需一次性并行编码(且常可命中缓存)。所以同一模型的输出价往往是输入价的数倍。
表中的「缓存读 / 缓存写」价是什么?
多数厂商支持「提示词缓存」:把重复的长前缀(系统提示、长文档)缓存起来复用。写入缓存(cache write)略贵于普通输入,但后续命中缓存读取(cache read)远低于普通输入价,适合重复调用同一长上下文的场景。空白表示该模型未提供缓存计价。
价格数据参考 OpenRouter 及各厂商公开页面整理,以 美元 / 百万 tokens 计,可能滞后或有误,请以官方页面为准。 本栏目仅作信息整理,不构成任何采购或投资建议。 标「≈¥」者为按 USD 汇率(1 USD≈¥6.78,2026-06-10)估算的人民币,非官方牌价,仅供参考。 数据更新于 2026-06-10。