OpenAI的新一代旗艦模型GPT-5.6據報即將面世,科技媒體testingcatalog在6月19日的報道中指出,發佈窗口鎖定在6月22日至28日,系列將包含mini、標準版和Pro三個版本。這一消息迅速點燃市場預期,預測平臺Polymarket上該窗口的概率一度衝高至八成,但隨後X平臺出現帖文稱GPT-5.6因內部問題推遲,概率驟降至不足三成,相關合約總交易量已突破100萬美元。OpenAI首席科學家Jakub Pachocki在內部向員工表示,GPT-5.6是對前代GPT-5.5的“有意義的改進”,而OpenAI Codex後端路由日誌中短暫出現的“gpt-5.6”標識,以及部分ChatGPT Pro用戶據報已接觸到的早期隱秘測試版本,都進一步印證了發佈的臨近。測試反饋顯示,在相同提示詞下,輸出質量有顯著提升。

從技術層面看,GPT-5.6最引人注目的升級在於其從“語言模型”向“可執行Agent”的跨越。據報道,上下文窗口從100萬tokens擴展至約150萬tokens,較GPT-5.5提升約43%,這為處理更長週期的編碼任務和多步會話提供了基礎。詞元效率據稱也再度提升10%至15%,意味著在相同費用下可處理更多工作量。洩露的測試反饋揭示了三項關鍵能力:視覺復刻,可將設計稿直接還原為可運行代碼;SVG 3D對象生成,支持在瀏覽器內旋轉與縮放;以及Playwright瀏覽器自動化,能真實執行點擊、輸入、頁面跳轉等操作。這三項能力的組合,使GPT-5.6不再只是一個給出建議的對話工具,而具備了直接在用戶設備上執行操作的能力。有X平臺網友形象地評論稱,GPT-5.6“腦子還是那個腦子,但他已經長出手了”,一個能聊天、告訴你該怎麼做的人,現在能打開你的瀏覽器,移動你的鼠標,複製一個設計,生成一個3D圖標,保存到桌面上。在智能體編碼場景中,GPT-5.6的表現據稱已優於Anthropic的Mythos系列,SVG生成能力亦被指超越Claude Fable 5。此外,GPT-5.5版本中存在的部分對齊問題,包括reward hacking,據報也在新版本中得到修復。

在商業策略上,GPT-5.6或將成為OpenAI以價格戰擴大市場份額的關鍵棋子。據媒體報道,其token價格可能僅為Claude Fable 5的約三分之一,延續了OpenAI當前token價格約為Anthropic一半的定價優勢。分析認為,在性能持平乃至領先的前提下,OpenAI通過大幅降價壓縮對手的市場空間,加速企業級客戶向自身平臺遷移。這一策略折射出頭部AI廠商之間愈發激烈的迭代競爭。據aiweekly.co報道,OpenAI旗艦模型的發佈節奏已明顯加速,從GPT-5.4到GPT-5.5的間隔約為六週,GPT-5.6或延續了這一節奏。與此同時,Anthropic的Fable 5及Opus系列、Google Gemini等競品也在同期保持高頻更新,部分社區已將6月下旬視為“AI大事件周”。

不過,圍繞GPT-5.6的期待並非一邊倒。近日多名用戶反映GPT-5.5出現“降智”現象,有用戶直接揣測OpenAI正在後臺測試GPT-5.6,認為“這就是Codex現在這麼蠢的原因”。用戶Hyper-Jason則補充,軟件表現異常源於集成問題,“這幾乎是他們一貫的歷史”,同時希望GPT-5.6“不像之前的GPT-5模型那麼受限”。X平臺中文用戶也吐槽GPT-5.5性能下降,戲稱“如果你三天內不出GPT-5.6我就不原諒你了”。在Reddit上,有網友提醒外界降低預期,指出5.6僅為小版本迭代,參數規模不會大幅躍升。一位用戶寫道:“如果版本號是5.6(也就是一個小版本迭代,不是新版本),那大家就得降低期望值了。Fable之所以有自己的版本號,是因為它是一個新版本,而不是舊版本的迭代。而5.6應該是一個迭代版本,而不是新版本。”從參數規模角度看,Reddit網友分析稱,Fable大約是6T級模型,GPT-5.5約2T級,GPT-5.6預計不會在參數規模上跳躍2至3倍,真正的模型級別突破需等待GPT-6。這些聲音提醒市場,儘管Agent化能力和定價策略令人矚目,但GPT-5.6在底層模型規模上可能仍屬漸進式升級。

對於AI產業投資者而言,GPT-5.6的發佈節奏和定價策略直接牽動模型層的競爭格局。若其Agent能力如期落地,並以三分之一的價格衝擊Anthropic等對手,可能加速企業客戶從多模型評估轉向OpenAI生態,進一步鞏固其商業護城河。同時,發佈的不確定性和社區對“小迭代”的定位,也意味著短期市場反應可能分化,真正的估值重估或需等待GPT-6等下一次模型級別躍升。