MiniMax正式發佈了其最新一代大語言模型M3,在多語言理解、複雜推理、代碼生成和數學等關鍵評測中,該模型拿出了極具競爭力的成績單。根據官方披露的技術報告,M3在MMLU、HumanEval、GSM8K等主流基準上不僅遠超自家前代產品,還在部分細分場景裡對GPT-4o、Claude 3.5 Sonnet等國際旗艦模型實現了追平或反超。公司強調,M3在模型架構與訓練效率上進行了深度優化,推理成本大幅下降,已同步上線開發者平臺並向部分企業客戶開放API。
然而,伴隨技術亮點的並非全是掌聲。在開源社區與社交媒體上,M3迅速引發激烈討論,大量評論將焦點指向MiniMax半年前捲入的“雷同門”事件。彼時,其發佈的MiniMax-01系列模型被社區第三方技術拆解分析,發現其權重矩陣、層結構乃至輸出風格與DeepSeek-V3存在異常高的相似度,多位研究者公開質疑該系列模型系在開源模型基礎上進行少量蒸餾或微調後重新包裝上線。儘管MiniMax未公開承認存在抄襲,事件仍嚴重削弱了其技術原創性聲譽。因此,當M3以更高姿態亮相時,一部分開發者與行業觀察者選擇先追問“這次是完全自研還是舊戲重演”,而非單純為分數歡呼。
在當前AI產業“五層蛋糕”架構中,MiniMax M3屬於模型層的關鍵玩家,承載著將芯片算力轉化為可供應用層調用的智能能力。從產業意義看,其性能躍進證明中國團隊在追趕全球一流模型的速度上並不落下風,也為下游AI應用降低了推理成本、提升了輸出質量,有望拉動一批新的原生AI產品落地。但硬幣另一面是,模型層競爭的勝負手早已不限於榜單分數。當開源生態日益壯大、企業與企業之間技術代差收窄,開發者社區的信任成為比參數更稀缺的資源。若信任無法重建,即便指標再耀眼,客戶在選擇基座模型時也可能因合規風險、技術債務和生態兼容性而卻步。對於密切關注模型層商業化進程的投資者與產業人士而言,M3的真正考驗不在今天發佈的這一頁PPT,而在於未來三到六個月裡,它能否通過第三方審計、社區復現及頭部客戶的實地部署,親手把丟失的公信力一寸寸掙回來。