英偉達在Computex 2024期間正式推出面向個人電腦的新型處理器RTX Spark,並在隨後面向國內市場的溝通中詳細解讀了其技術架構。RTX Spark是一顆系統級芯片,集成了基於Blackwell架構的RTX GPU與一顆擁有20核心的Grace CPU,兩者通過NVIDIA NVLink-C2C芯片互連實現高帶寬耦合。其中CPU部分由聯發科與英偉達聯合設計,採用Arm指令集。GPU內置6144個CUDA核心和支持FP4精度的第五代Tensor Core,整體AI算力達到1 Petaflop,並支持最高128GB的統一內存,從根本上緩解了CPU與GPU之間的數據搬運瓶頸。

在實際負載方面,RTX Spark可在本地流暢運行參數規模達120B、上下文窗口100萬token的大語言模型,允許用戶在PC上部署複雜的AI代理。創意場景中,它能實時渲染超過90GB的大型3D場景,編輯12K 4:2:2格式視頻並生成4K AI視頻。遊戲表現上,該芯片可驅動1440p分辨率下的3A大作以超過100 FPS的幀率運行。英偉達還為RTX Spark加入了新的安全基元與NVIDIA OpenShell固件,從硬件層面強化了設備安全與可管理性。

這一設計將原本用於數據中心的Grace CPU帶入消費PC,聯發科的參與則反映出英偉達對Arm PC生態的加速投入。此前雙方已在汽車芯片領域合作,此次聯手被視為英偉達回應AI PC算力需求的關鍵一步,意圖將強大的本地推理能力普惠至個人用戶。

從產業視角看,RTX Spark位於“五層蛋糕”的芯片層,向下帶動Arm IP授權與先進封裝需求,向上則直接賦能模型層與應用層。本地運行大模型的能力讓個人設備可以承擔原本依賴雲端的智能任務,不僅可能改變PC軟件的交互形態,還可能對雲端推理的成本結構產生遠期影響。同時,英偉達通過聯發科的Arm設計經驗,在x86主導的PC市場中開闢了Arm路線,與高通驍龍X系列、蘋果M系列形成競爭。對於英偉達自身,將CUDA生態從服務器延伸至PC,有助於鞏固其在AI開發者社區的粘性,也讓其在邊緣AI設備上的芯片拼圖更加完整。儘管Arm PC尚需在遊戲兼容性和外設生態上持續完善,但RTX Spark已為“AI PC”的算力基建提供了一個極具想象力的硬件藍圖。