Hermes Agent近日上線了名為MoA(Mixture of Agents)的新功能,核心是讓用戶能夠自由組合多個大語言模型,形成一個協同工作的虛擬模型。在Nous Research即將發佈的一項基準測試中,這種混合模型組合的評分已經超過了Opus 4.8GPT-5.5這兩個頂尖閉源模型,引發了業內對多模型協作路線的關注。

該功能上線的背景,是Fable 5Mythos 5等部分頂尖閉源模型因訪問受限而無法被廣泛使用。Nous Research在官方社交平臺上直言:“最強大的模型是受限的,只有少數人才能獲得訪問權限。”這直接點出了當前AI模型獲取的不平等現狀。Hermes Agent聯合創始人Teknium表示,團隊正在測試各種開源模型組合,目標是驗證能否用更便宜的模型達到Opus級別閉源模型的輸出質量。

MoA的技術思路並非憑空出現。早在2024年6月,Together AI就曾發表論文《Mixture-of-Agents Enhances Large Language Model Capabilities》,闡述了多LLM組合的架構:每一層模型都會參考上一層模型的輸出再生成自己的回答,並將模型分為參考模型和聚合模型兩類。Hermes Agent此次上線的功能正是沿用了這一架構——當用戶提出問題時,參考模型先進行分析判斷並給出參考意見,但不執行任何工具調用或命令;隨後由聚合模型綜合各方意見,調用工具完成具體任務。這種設計試圖發揮不同模型的獨特優勢,讓擅長規劃的模型負責思考,讓長於執行的模型負責落地。

在實際使用中,用戶只需在設置中開啟Mixture of Agents選項,即可自由選擇模型進行組合。默認配置為兩個參考模型加一個聚合模型,用戶也可手動添加更多參考模型。

海外博主的實測進一步揭示了該功能的實際表現。在一項使用Three.js開發原力海盜訓練競技場遊戲的測試中,單一glm-5.2模型花費0.38美元、耗時13分鐘完成任務,生成的遊戲在移動速度和流暢度上存在不足。而啟用MoA後,以kimi-k2.6minimax-m3作為參考模型、glm-5.2作為聚合模型,同樣任務花費0.47美元、耗時35分鐘,成本和時間均有所上升,但遊戲在移動速度、流暢度和關卡合理性上明顯更優。

另一項測試則要求生成一個包含火影忍者、海賊王、龍珠等IP的交互式動漫多元宇宙儀表盤。單一GPT-5.5模型耗時近7分鐘完成,儀表盤中間光球的光圈質感稍顯簡單,但交互流暢。當改用三個grok模型作為參考模型、GPT-5.5作為聚合模型時,生成速度反而更快,博主推測這可能得益於grok快速模型的特性。最終生成的儀表盤更具設計質感,中間光球細節豐富,且支持點擊不同星球進行遠近景切換。

這一功能的上線,折射出AI應用層競爭邏輯的潛在轉變。過去,大模型競賽主要圍繞“誰家的單一模型更強”展開,用戶需要在編程、寫作、推理等不同任務間頻繁切換模型。而MoASakana Fugu等編排器模型的思路則截然不同:不再等待一個“萬能模型”的出現,而是讓多個各有所長的模型共同完成一項任務。這種走向“編排”的趨勢,恰好契合了Agent的核心理念——模型提供底層能力,Agent負責組織不同模型協作,讓規劃能力強的模型負責思考,讓執行能力強的模型負責落地。

當然,MoA模式目前仍需承擔更高的推理成本,在部分任務上耗時也會顯著增加,並非所有場景都適合開啟。但隨著推理成本的持續下降和開源模型能力的不斷提升,多模型協作有可能成為未來AI Agent的默認工作方式。對於關注AI應用層的投資者和從業者而言,這一動向意味著價值創造的重心可能從單純的模型能力競賽,逐步向模型編排與協同效率的競爭轉移。