Hermes Agent上線MoA功能，混合模型評分超越Opus 4.8與GPT-5.5

Hermes Agent推出MoA功能，允許用戶組合多種模型，其混合模型評分超過Opus 4.8和GPT-5.5。

Hermes Agent近日上線了名為MoA（Mixture of Agents）的新功能，核心是讓用戶能夠自由組合多個大語言模型，形成一個協同工作的虛擬模型。在Nous Research即將發佈的一項基準測試中，這種混合模型組合的評分已經超過了Opus 4.8和GPT-5.5這兩個頂尖閉源模型，引發了業內對多模型協作路線的關注。

該功能上線的背景，是Fable 5和Mythos 5等部分頂尖閉源模型因訪問受限而無法被廣泛使用。Nous Research在官方社交平臺上直言：“最強大的模型是受限的，只有少數人才能獲得訪問權限。”這直接點出了當前AI模型獲取的不平等現狀。Hermes Agent聯合創始人Teknium表示，團隊正在測試各種開源模型組合，目標是驗證能否用更便宜的模型達到Opus級別閉源模型的輸出質量。

MoA的技術思路並非憑空出現。早在2024年6月，Together AI就曾發表論文《Mixture-of-Agents Enhances Large Language Model Capabilities》，闡述了多LLM組合的架構：每一層模型都會參考上一層模型的輸出再生成自己的回答，並將模型分為參考模型和聚合模型兩類。Hermes Agent此次上線的功能正是沿用了這一架構——當用戶提出問題時，參考模型先進行分析判斷並給出參考意見，但不執行任何工具調用或命令；隨後由聚合模型綜合各方意見，調用工具完成具體任務。這種設計試圖發揮不同模型的獨特優勢，讓擅長規劃的模型負責思考，讓長於執行的模型負責落地。

在實際使用中，用戶只需在設置中開啟Mixture of Agents選項，即可自由選擇模型進行組合。默認配置為兩個參考模型加一個聚合模型，用戶也可手動添加更多參考模型。

海外博主的實測進一步揭示了該功能的實際表現。在一項使用Three.js開發原力海盜訓練競技場遊戲的測試中，單一glm-5.2模型花費0.38美元、耗時13分鐘完成任務，生成的遊戲在移動速度和流暢度上存在不足。而啟用MoA後，以kimi-k2.6和minimax-m3作為參考模型、glm-5.2作為聚合模型，同樣任務花費0.47美元、耗時35分鐘，成本和時間均有所上升，但遊戲在移動速度、流暢度和關卡合理性上明顯更優。

另一項測試則要求生成一個包含火影忍者、海賊王、龍珠等IP的交互式動漫多元宇宙儀表盤。單一GPT-5.5模型耗時近7分鐘完成，儀表盤中間光球的光圈質感稍顯簡單，但交互流暢。當改用三個grok模型作為參考模型、GPT-5.5作為聚合模型時，生成速度反而更快，博主推測這可能得益於grok快速模型的特性。最終生成的儀表盤更具設計質感，中間光球細節豐富，且支持點擊不同星球進行遠近景切換。

這一功能的上線，折射出AI應用層競爭邏輯的潛在轉變。過去，大模型競賽主要圍繞“誰家的單一模型更強”展開，用戶需要在編程、寫作、推理等不同任務間頻繁切換模型。而MoA、Sakana Fugu等編排器模型的思路則截然不同：不再等待一個“萬能模型”的出現，而是讓多個各有所長的模型共同完成一項任務。這種走向“編排”的趨勢，恰好契合了Agent的核心理念——模型提供底層能力，Agent負責組織不同模型協作，讓規劃能力強的模型負責思考，讓執行能力強的模型負責落地。

當然，MoA模式目前仍需承擔更高的推理成本，在部分任務上耗時也會顯著增加，並非所有場景都適合開啟。但隨著推理成本的持續下降和開源模型能力的不斷提升，多模型協作有可能成為未來AI Agent的默認工作方式。對於關注AI應用層的投資者和從業者而言，這一動向意味著價值創造的重心可能從單純的模型能力競賽，逐步向模型編排與協同效率的競爭轉移。

Hermes Agent上線MoA功能，混合模型評分超越Opus 4.8與GPT-5.5

延伸閱讀

相關深度報道

相關每日新聞