Mistral AI 在 Hugging Face 平臺正式發佈了其 Ministral 3 14B Instruct 模型,這是 Ministral 3 系列中參數規模最大的成員,總參數量達到 140 億。該模型專為指令遵循任務進行後訓練微調,適用於聊天和各類指令型應用場景。
從架構上看,Ministral 3 14B 由兩部分構成:一個 135 億參數的語言模型和一個 4 億參數的視覺編碼器。這使其具備了原生多模態能力,不僅能處理文本,還能分析圖像內容並基於視覺信息提供見解。在語言支持方面,該模型覆蓋了包括英語、法語、西班牙語、德語、意大利語、葡萄牙語、荷蘭語、中文、日語、韓語和阿拉伯語在內的數十種語言。
該模型最突出的定位是 邊緣優化。Mistral 明確表示,Ministral 3 系列專為邊緣部署設計,能夠在廣泛的硬件上運行。具體到 14B 版本,它可以在 BF16 精度下裝入 32GB 顯存,而經過量化後,所需內存或顯存更是降至 24GB 以下。這意味著用戶可以在本地設備或資源受限的環境中部署這一級別的模型,實現私有化 AI 助手或高級代理功能。Mistral 同時提供了無損的 FP8 版本,並承諾其他格式和量化版本將在後續集合中發佈。
在性能方面,Mistral 聲稱 Ministral 3 14B 具備前沿能力,其表現可與參數規模更大的 Mistral Small 3.2 24B 模型相媲美。官方公佈的基準測試數據顯示,在推理任務上,Ministral 3 14B 在 AIME25 和 AIME24 評測中分別取得了 0.850 和 0.898 的得分,超越了同尺寸的 Qwen3-14B(思考模式)。在指令遵循場景下,其 Arena Hard 得分為 0.551,MATH Maj@1 準確率達到 0.904,均領先於 Qwen3 14B(非思考模式)和 Gemma3-12B-Instruct 等競品。基礎模型在 多語言 MMLU 上的得分也達到了 0.742,顯示出均衡的綜合能力。
功能層面,Ministral 3 14B Instruct 支持 256k 的大上下文窗口,具備原生函數調用和 JSON 輸出能力,被 Mistral 稱為擁有“同類最佳的代理能力”。同時,該模型對系統提示詞有很強的遵循度,適合構建複雜的 AI 代理應用。
該模型採用 Apache 2.0 開源許可證發佈,允許商業和非商業用途的使用與修改,這為企業在私有環境中進行定製和微調提供了便利。Mistral 將 Ministral 3 14B 定位為將先進 AI 能力帶入大多數環境的解決方案,其應用場景包括私有聊天助手、本地代理任務以及特定領域的微調。
此次發佈進一步豐富了 Mistral 在中小規模模型上的產品矩陣。Ministral 3 系列此前已推出 3B 和 8B 版本,每個版本又細分為基礎預訓練、指令微調和推理增強三種類型。14B 版本的加入,為需要在性能與部署靈活性之間取得平衡的用戶提供了一個新的選擇。在 AI 產業日益關注模型效率與推理成本的背景下,這種在較小參數量下實現高性能、並能直接在邊緣設備運行的模型,可能對推動 AI 應用從雲端向終端延伸產生重要影響。