Ideogram 4.0 開源釋出，原生 2K 解析度與文字渲染提升

Ideogram釋出4.0版文生圖模型，開源權重，原生2K解析度，在DesignArena排名領先。

來源:The Decoder · 2026-06-03 14:34 ET · #模型

字號

AI 影像生成領域的開源陣營迎來一次重要升級。Ideogram 正式釋出其文本到影像模型的 4.0 版本，並以開放權重形式向社群提供。新模型最顯著的特徵是支援原生 2K 解析度 輸出，並引入了 邊界框控制 功能，讓使用者能更精準地指定畫面中物體的位置。同時，模型在文字渲染方面做了專項強化，解決了此前影像模型在生成清晰、準確文字時常出現的扭曲或模糊問題。

在衡量模型綜合能力的 DesignArena 排行榜上，Ideogram 4.0 的表現引發了關注。它目前在所有開源模型中排名第一，將 Stability AI 等競爭對手甩在身後。不過，排在其前面的仍是來自 OpenAI 和谷歌的閉源系統，這表明頂尖閉源模型在整體質量上依然保有優勢，但開源陣營的追趕速度不可小覷。

值得注意的是，儘管模型權重開放，Ideogram 對商業使用設定了付費門檻。這意味著開發者可以自由研究、微調模型，但如果要將它用於商業產品，必須購買許可證。這種“開放權重加商業授權”的模式，正成為越來越多 AI 公司平衡社群貢獻與商業回報的選擇。

從產業角度看，Ideogram 4.0 的釋出直接作用於黃仁勳“五層蛋糕”框架中的 應用層。更強大的開源影像模型降低了高質量視覺內容創作的門檻，將推動廣告、設計、媒體等下游應用的創新。同時，原生 2K 解析度意味著單張影像生成需要更多計算資源，這對上游的 基礎設施層 和 晶片層 構成持續的需求拉動。開源模型在特定指標上逼近閉源系統，也加劇了應用層創業公司的競爭——當基礎能力不再是壁壘時，產品體驗、工作流整合與垂直場景深耕變得更為關鍵。

Ideogram 4.0 開源釋出，原生 2K 解析度與文字渲染提升

延伸閱讀

相關深度報道

相關每日新聞