火山引擎以一場密集的產品發佈,向生產級AI市場展示了其全面佈局的野心。週二,該公司正式推出豆包大模型2.1系列,涵蓋旗艦版Doubao-Seed-2.1-Pro與輕量版Doubao-Seed-2.1-Turbo,API即日在火山方舟平臺全量上線。與此同時,視頻生成模型Seedance 2.5宣佈將於7月初正式發佈,音頻生成模型1.0版本也同步開啟邀測。這一連串動作標誌著豆包生態正從語言理解向多模態內容生產全面延伸,直接瞄準企業級開發與創作場景。
此次升級的核心看點在於性能與成本的平衡。豆包大模型2.1 Pro的定價為每百萬Tokens輸入6元、輸出30元,而在Coding和Agent等高頻生產場景下,綜合成本可壓縮至每百萬Tokens僅1.96元。這一價格策略極具攻擊性,意在降低企業接入門檻。火山引擎還推出了持續迭代版本Doubao-Seed-Evolving,以每月2至4次的頻率滾動更新,企業無需更換API接入節點即可獲得最新模型能力,這為追求穩定性的企業用戶提供了便利。
在能力層面,豆包大模型2.1 Pro在多項基準測試中展現出與國際頂尖模型對標的實力。在Terminal Bench評測中,其表現與Claude Opus 4.7基本持平;在長程軟件開發基準SWE-Pro上,接近GPT-5.5的水平。在科學計算代碼評測SciCode中,該模型以59.8分超越Claude Opus 4.7和GPT-5.5,該測試覆蓋數理化生材五大學科的真實科研問題,含金量頗高。火山引擎還披露了一個芯片設計案例:模型連續運行近18小時,經歷9輪迭代,完成1303行RTL代碼生成並通過完整工程驗證,展示了生產級Coding交付能力。
Agent能力是此次升級的另一重點。在GDPval基準上,豆包大模型2.1 Pro獲得最高分,該測試集覆蓋9大行業、44種職業的真實經濟價值任務。在2026年6月剛發佈的Agents' Last Exam(ALE)評測中,其表現超越Claude Opus 4.7,該基準涵蓋逾1000項高經濟價值任務,且發佈不久難以被定向優化,更能反映模型泛化能力。工具調用方面,模型在MCP-Atlas評測集上全面超越Claude Opus 4.7與GPT-5.5。一個典型案例是,開發者使用該模型調度超過500個Agent協同作業,累計觸發工具調用上千次,完成逾100棟建築的3D城市構建。
多模態理解能力同樣保持全球領先。圖像理解方面,豆包大模型2.1在MMMU-Pro等榜單上全面超越GPT-5.5、Claude Opus 4.7和Gemini 3.1 Pro。視頻時序理解上,在TOMATO與LVBench兩項基準中大幅領先Gemini 3.1 Pro。GUI Agent方面,移動端能力大幅領先,桌面端接近Claude Opus 4.7。火山引擎展示了一個端到端視頻剪輯案例:模型一次性處理逾兩小時長視頻,自動完成解說稿生成、片段定位、音頻合成及字幕輸出,全程無需人工干預。
多模態版圖的拓展不止於此。據披露,視頻生成模型Seedance 2.5已處於內測尾聲,預計7月初正式發佈。新模型支持單段視頻生成時長最高30秒,鏡頭連貫性大幅提升,並支持最多50個全模態素材聯合輸入,官方稱其為全球最多。音頻生成模型1.0則支持文本及參考音頻等多模態輸入,可端到端生成包含多角色對白、背景音樂和環境音效的完整音頻作品,單次支持2分鐘創作,API即日開啟邀測,並計劃接入剪映、即夢、番茄等產品。
商業化層面,火山引擎總裁譚待披露了最新數據:截至今年6月,豆包大模型日均Token調用量已突破180萬億,較去年增長超10倍。在中國公有云MaaS服務市場,火山引擎以49.5%的市場份額位居第一。這些數字背後是國內AI應用需求的爆發式增長,也反映出豆包生態在企業市場的滲透速度。合作伙伴方面,WPS表示該模型在PPT生成、表格交付等辦公核心任務上形成穩定可用鏈路;得到反映其在業務規則遵循上實現零違規;Unity(團結引擎)則認為其在腳本邏輯類任務上的單次能力上限高於頂尖模型。火山引擎還表示,豆包產品即將接入2.1 Pro,服務數億用戶的辦公與生產力場景。
從產業視角看,火山引擎這一系列動作將直接影響國內企業AI採購格局。以極低價格提供對標國際旗艦的能力,配合高頻迭代與多模態覆蓋,豆包大模型正在將AI基礎設施的競爭從單純的參數比拼拉向成本、易用性與生態整合的綜合較量。對於算力產業鏈而言,Token調用量的爆發式增長意味著推理需求將持續攀升,這對上游芯片與雲基礎設施供應商構成長期利好。而對於應用層開發者,更低的調用成本和更穩定的工具鏈支持,有望加速AI原生應用的湧現。