字節跳動旗下雲服務平臺火山引擎在近日的 FORCE 大會上,一口氣推出了五款全新 AI 模型,其中最引人注目的是視頻生成模型 Seedance 2.5。該模型計劃於 7 月初正式上線,其核心突破在於能夠一次性生成最長 30 秒的連續視頻片段,且包含完整的場景切換與節奏變化,完全無需後期拼接。

這一能力直擊當前 AI 視頻生成領域的一大痛點。此前多數模型生成的視頻時長較短,或需通過多次生成再拼接來實現較長內容,導致畫面連貫性與敘事節奏難以保證。Seedance 2.5 的單鏡頭 30 秒生成,意味著它可以更自然地講述一個完整的小故事或展示一段有起承轉合的產品演示,大幅降低了後期剪輯的門檻。

除了時長突破,該模型在多模態輸入上也展現出高度靈活性。它可同時接收多達 50 個額外輸入,包括參考圖像、音頻等。這對於需要多角色、多元素協同的電影級場景構建尤為實用。用戶還能在視頻生成後對其進行編輯,同時保持整體視覺風格與畫面質感不變,這為創意迭代提供了更大的空間。

與 Seedance 2.5 一同亮相的還有 Seedance 2.0 的升級版,後者現已支持原生 4K 分辨率與 10-bit 色深,畫質表現向專業影視標準靠攏。在語言模型方面,豆包 2.1 Pro 的定價策略頗具攻擊性——據火山引擎披露,其使用成本比 AnthropicClaude Opus 4.6 低了約 80%。這一定價無疑將加劇企業級大模型市場的價格競爭,尤其對成本敏感的中小開發者和初創公司具有吸引力。

圖像與音頻領域同樣有新品補位。Seedream 5.0 Pro 圖像模型與 Seed-Audio 1.0 音頻模型的推出,使字節跳動的 AI 模型矩陣進一步覆蓋了從文本、圖像、音頻到視頻的全模態生成能力。火山引擎作為字節跳動的 to B 出口,將這些模型以雲服務形式提供給企業客戶,其戰略意圖十分清晰:在消費端之外,搶佔企業級 AI 應用的市場份額。

從產業視角看,Seedance 2.5 的發佈將 AI 視頻生成的競爭推向了新階段。連貫性、時長與多模態控制的提升,直接關係到廣告短片、社交媒體內容、電商展示乃至影視預演等場景的實用化程度。當單次生成即可產出可直接投放的 30 秒素材時,內容生產的工作流將被顯著壓縮。

值得注意的是,字節跳動此次並未孤立地發佈一款視頻模型,而是以“全家桶”形式更新了語言、圖像、音頻、視頻四條產品線。這種協同打法,意在構建一個相互增強的模型生態——語言模型理解需求、圖像模型生成素材、視頻模型整合動態、音頻模型補齊聲音,最終為企業提供一站式 AI 內容生產方案。

在成本側,豆包 2.1 Pro 的激進定價也傳遞出明確信號:中國雲廠商在大模型服務上的價格戰遠未結束。對於 AI 產業投資者而言,這意味著模型層的商業化仍處於早期圈地階段,盈利能力尚未成為首要目標,規模與生態黏性才是當前競爭的關鍵變量。