讀懂AI時代 Read AI Time 讀懂AI時代 Read AI Time 简体
今日導讀

今日芯片與模型層同步發力:博通與OpenAI聯合推出Jalapeño推理芯片,九個月完成流片,強化定製AI芯片格局;梁文鋒團隊發佈DSpark論文,使DeepSeek推理速度提升60%以上,直接降低大模型推理成本。同時,IBM推出0.7nm芯片引發命名爭議,折射先進工藝真實進展的行業共識危機。

新聞條目(3)

字號
今日快訊(6)↓
模型

梁文鋒團隊發佈DSpark論文,DeepSeek推理速度提升60%以上

DeepSeek創始人梁文鋒掛名發表新論文《DSpark:基於置信度調度的推測解碼與半自迴歸生成》,提出將投機解碼與動態置信度調度結合,在不犧牲回答質量的前提下,將模型生成速度提升60%至80%,高峰併發下的吞吐量提高51%以上。該方案通過優先驗證高置信度token,減少GPU算力浪費,有望根治DeepSeek長期被詬病的服務器卡頓與宕機問題,並進一步壓低推理成本。

為什麼重要該技術直接降低大模型推理成本,可能引發API降價或免費額度提升,同時開源訓練框架DeepSpec將拉低全行業推理成本基準線,影響AI應用層的經濟模型。

虎嗅

芯片

IBM發佈0.7nm芯片引爭議,工程師指命名脫離物理尺寸

IBM於2026年6月25日宣佈推出全球首款0.7納米芯片,採用NanoStack三維堆疊架構,在指甲蓋大小面積集成近1000億個晶體管,性能提升50%、能效改善70%。但多位工程師指出,該命名僅為營銷標籤,實際結構中納米片厚度約5納米、層間距9納米,並無0.7nm物理尺寸。馬斯克呼籲改用“原子數量”定義製程節點,引發行業對納米命名體系脫節的廣泛討論。

為什麼重要該事件折射出芯片製程命名與物理尺寸長期脫節的行業共識危機,直接影響投資者對先進工藝技術進展的真實判斷,並牽動臺積電、三星等代工廠未來技術路線與商業化路徑的評估。

虎嗅

芯片基礎設施

博通與OpenAI推出Jalapeño推理芯片,九個月完成流片

博通與OpenAI聯合發佈定製AI推理芯片Jalapeño,專為大語言模型工作負載設計。該芯片是多代AI計算平臺的首款產品,從設計到流片僅用約九個月,體現雙方軟硬件協同開發的高效。對關注博通(AVGO)的投資者而言,Jalapeño為其AI基礎設施角色增添了新維度。

為什麼重要此舉強化博通在定製AI芯片領域的地位,並深化其與OpenAI的綁定,對AI算力供應鏈格局產生直接影響。

Yahoo Finance — AVGO 頭條

今日快訊(6)

↑ 新聞條目(3)

市場動態、友商消息等一行快訊,點擊進原文。