在 6 月 8 日的科技早報中,多條重磅消息勾勒出 AI 產業正加速逼近臨界點。

AGI 時間表:2030 年的奇點預警

Google DeepMind 首席執行官德米斯·哈薩比斯在 Google I/O 大會上給出了一個具體的時間預測:通用人工智能(AGI)將在 2030 年前後到來,誤差不超過一年。他將這一時刻比作技術「奇點」——一個突破後便無法回頭的關鍵節點。哈薩比斯認為,這場變革的衝擊力將達到工業革命的十倍速度與十倍強度,而人類目前正站在「奇點的山腳下」。

與常見的聊天機器人升級敘事不同,哈薩比斯強調 AGI 的核心價值在於科學發現。谷歌正通過「Gemini for Science」等工具,將 AI 應用於藥物研發、氣象預測等領域,試圖解決重大人類挑戰。這一觀點將 AGI 的競爭從單純的模型能力比拼,拉向了更深遠的科研基礎設施層面。

NVIDIA Vera Rubin 量產:HBM4 成本激增背後的供應鏈隱憂

英偉達的下一代平臺 Vera Rubin 確認進入量產階段,其技術規格令人矚目:採用第六代 HBM4 內存,單顆容量 36GB,帶寬達 2TB/s,較 HBM3E 提升超過 60%,同時功耗降低 15%。然而,光鮮的性能背後是急劇攀升的成本。HBM4 內存在整個平臺中的成本佔比從此前的 9% 飆升至 26%,導致單機架物料成本達到 780 萬美元。

這一成本結構變化將供應鏈風險推到了臺前。目前 HBM 市場由 SK 海力士(份額超 50%)、三星(47%-49%)和美光(10%-16%)三巨頭牢牢掌控,高度集中的格局帶來了系統性風險。為應對激增的需求,SK 海力士已計劃未來五年將晶圓產能翻倍。2024 年第一季度,全球 AI 服務器出貨量同比增長 109.6%,配備 HBM 內存的服務器佔比已超七成,這直接推高了數據中心硬件成本。與此同時,AMD MI300X 和 Intel Gaudi3 等競爭產品也在推動技術迭代與成本優化,試圖在英偉達主導的市場中撕開缺口。

OpenAI 的超級應用轉型:從問答工具到任務執行系統

面對 140 億美元的虧損和上市壓力,估值達 8520 億美元的 OpenAI 正對 ChatGPT 進行根本性改造。其戰略目標是將 ChatGPT 升級為一款整合編程工具與 AI 智能體的「超級應用」,核心在於提升 Codex 編程工具的地位,並引入具備複雜指令理解、任務規劃、工具調用與自我修正能力的智能體功能,實現從被動問答到主動執行任務的轉變。

這一轉型瞄準的是高利潤的企業市場。OpenAI 計劃將企業客戶收入佔比從 40% 提升至 50%,以支撐其高估值並應對來自 Anthropic 的激烈競爭。值得注意的是,Anthropic 在 2026 年 5 月的企業採用率已達到 34.4%,首次超越 OpenAI 的 32.3%。OpenAI 此次升級,意在通過差異化產品守住金融、科技等高價值企業客戶陣地。

其他值得關注的動向

Anthropic 的未發佈模型 Oceanus 意外出現在 API 代理服務中,其定價高達當前旗艦模型 Claude Opus 的三倍,輸入與輸出 token 每百萬分別收費 16 美元和 80 美元。此次洩露事件暴露了 AI 模型安全測試環節的漏洞,並可能影響該公司即將推進的上市計劃。

Google 則推出了 TurboQuant 壓縮算法,通過向量量化技術將大語言模型的 KV 緩存從 32 位壓縮至 3 位,實現內存佔用減少 6 倍且保持零精度損失。該技術使 AI 推理速度提升 8 倍,單位 token 成本下降 30% 至 50%,大幅降低了大模型在手機、汽車等邊緣設備上的本地部署門檻。

此外,英國 NHS 向 50.5 萬名員工開放微軟 365 Copilot 權限,早期數據顯示每人每日可節省 43 分鐘行政時間。特斯拉 AI 基礎設施副總裁拉吉·傑加納坦在任職 13 年後正式離職,將加入雲基礎設施服務商 Chronoscale 擔任 CTO,其曾主導搭建 FSD 神經網絡底層架構和全球頂尖 GPU 集群。OpenAI 自研芯片項目核心成員 Clive Chan 則轉投 Anthropic,顯示兩家頭部 AI 公司間的人才競爭進一步加劇。

這些事件共同指向一個趨勢:AI 產業正從模型能力的單點突破,轉向成本結構、供應鏈安全、應用形態與人才儲備的全方位較量。