xAI釋出Grok Imagine 1.5：圖片轉720p影片

xAI推出影像轉影片模型預覽版，支援720p解析度及多片段拼接。

來源:The Decoder · 2026-06-04 04:04 ET · #模型

字號

xAI 近日為旗下 Grok 平台推送了一項重要更新，釋出了名為“grok-imagine-video-1.5-preview”的影像轉影片模型。該模型允許使用者上傳一張靜態圖片，並配合文本描述，即可生成一段具有電影質感的動態影片，解析度最高支援 720p。更引人注目的是，系統具備將多個生成片段自動拼接為更長連續場景的能力，這為創作者提供了更靈活的敘事工具。

此次更新並非 xAI 在多媒體生成領域的首次嘗試。此前，Grok 已整合 Aurora 影像生成模型，能夠根據文本創作和編輯圖片。而本次新增的影片生成功能，則讓 Grok 在多模態內容創作上邁出了關鍵一步。據公開資訊，該模型目前處於預覽階段，主要面向 X 平台上的 Grok 使用者開放，具體訪問許可權可能與訂閱層級相關。xAI 並未公佈該模型的技術架構細節或訓練資料來源，但強調其在生成連貫性和視覺質量上的提升。

從產業背景看，AI 影片生成已成為大模型廠商爭奪的下一個高地。OpenAI 的 Sora、Runway 的 Gen 系列、以及國內的可靈等產品，都在推動文本或影像到影片的生成能力向更高解析度、更長時長和更精細控制演進。xAI 此次以 720p 解析度切入，雖未達到部分競品的 1080p 標準，但其與 X 平台社交生態的深度繫結，可能形成差異化優勢。使用者可在社交場景中即時創作並分享影片內容，降低了使用門檻。

在“五層蛋糕”框架下，這一動態直接作用於最頂層的應用環節，並反向拉動模型層的迭代需求。對於 AI 產業投資者而言，這反映出 xAI 正試圖通過多模態應用增強 Grok 的使用者粘性，從而在馬斯克的商業生態中佔據更核心的流量入口。影片生成對算力的消耗遠高於文本和影像，若該功能獲得廣泛採用，可能間接推動對底層基礎設施和晶片層的需求，但短期內其商業化路徑和成本控制仍是觀察重點。此外，xAI 在模型能力上能否持續縮小與 OpenAI 等對手的差距，將影響市場對其獨立融資及估值的預期。

xAI釋出Grok Imagine 1.5：圖片轉720p影片

延伸閱讀

相關深度報道

相關每日新聞