Mistral AI 在 Hugging Face 平台正式发布了其 Ministral 3 14B Instruct 模型,这是 Ministral 3 系列中参数规模最大的成员,总参数量达到 140 亿。该模型专为指令遵循任务进行后训练微调,适用于聊天和各类指令型应用场景。

从架构上看,Ministral 3 14B 由两部分构成:一个 135 亿参数的语言模型和一个 4 亿参数的视觉编码器。这使其具备了原生多模态能力,不仅能处理文本,还能分析图像内容并基于视觉信息提供见解。在语言支持方面,该模型覆盖了包括英语、法语、西班牙语、德语、意大利语、葡萄牙语、荷兰语、中文、日语、韩语和阿拉伯语在内的数十种语言。

该模型最突出的定位是 边缘优化。Mistral 明确表示,Ministral 3 系列专为边缘部署设计,能够在广泛的硬件上运行。具体到 14B 版本,它可以在 BF16 精度下装入 32GB 显存,而经过量化后,所需内存或显存更是降至 24GB 以下。这意味着用户可以在本地设备或资源受限的环境中部署这一级别的模型,实现私有化 AI 助手或高级代理功能。Mistral 同时提供了无损的 FP8 版本,并承诺其他格式和量化版本将在后续集合中发布。

在性能方面,Mistral 声称 Ministral 3 14B 具备前沿能力,其表现可与参数规模更大的 Mistral Small 3.2 24B 模型相媲美。官方公布的基准测试数据显示,在推理任务上,Ministral 3 14B 在 AIME25AIME24 评测中分别取得了 0.8500.898 的得分,超越了同尺寸的 Qwen3-14B(思考模式)。在指令遵循场景下,其 Arena Hard 得分为 0.551MATH Maj@1 准确率达到 0.904,均领先于 Qwen3 14B(非思考模式)和 Gemma3-12B-Instruct 等竞品。基础模型在 多语言 MMLU 上的得分也达到了 0.742,显示出均衡的综合能力。

功能层面,Ministral 3 14B Instruct 支持 256k 的大上下文窗口,具备原生函数调用和 JSON 输出能力,被 Mistral 称为拥有“同类最佳的代理能力”。同时,该模型对系统提示词有很强的遵循度,适合构建复杂的 AI 代理应用。

该模型采用 Apache 2.0 开源许可证发布,允许商业和非商业用途的使用与修改,这为企业在私有环境中进行定制和微调提供了便利。Mistral 将 Ministral 3 14B 定位为将先进 AI 能力带入大多数环境的解决方案,其应用场景包括私有聊天助手、本地代理任务以及特定领域的微调。

此次发布进一步丰富了 Mistral 在中小规模模型上的产品矩阵。Ministral 3 系列此前已推出 3B8B 版本,每个版本又细分为基础预训练、指令微调和推理增强三种类型。14B 版本的加入,为需要在性能与部署灵活性之间取得平衡的用户提供了一个新的选择。在 AI 产业日益关注模型效率与推理成本的背景下,这种在较小参数量下实现高性能、并能直接在边缘设备运行的模型,可能对推动 AI 应用从云端向终端延伸产生重要影响。