知名半導體研究作者Vikram SekarAustin Lyon在6月30日的一檔節目中提出,AI推理工作負載正經歷結構性變化,數據中心硬件生態可能迎來重塑。

他們指出,隨著推理任務被“解耦”為預填充解碼等更精細的環節,過去依賴單一通用GPU的“一刀切”模式不再是最優解。這種技術趨勢為各類芯片廠商打開了機會之門。

具體而言,像高通這樣的大型半導體公司,或專注於AI的初創企業,可以針對解碼等特定任務研發專用硬件。這些芯片無需替代英偉達GPU,而是可以在同一數據中心內與GPU混合搭配、協同工作,各自處理最擅長的負載部分。

這一觀點若成立,意味著英偉達在AI推理領域“通吃一切”的局面可能被打破。市場將從單一供應商主導,轉向一個更多元、更異構的算力架構。對於產業鏈而言,這既可能分散採購集中度,也為專用芯片設計公司提供了切入高增長市場的路徑。

不過,該討論目前屬於行業觀察者的前瞻性判斷,而非已落地的市場現實。推理工作負載的解耦程度、專用芯片的生態成熟度,以及數據中心客戶對混合架構的接受意願,仍是決定這一趨勢能否兌現的關鍵變量。