NVIDIA與微軟正在讓個人AI代理成為 Windows PC 的原生能力。雙方在最新的開發者日上公佈了一套端到端工具,使創作者和開發者能夠在搭載RTX GPU的Windows設備上構建、優化並運行AI代理,無需依賴雲端 API。
這套工具鏈的核心是將微軟的ONNX Runtime、DirectML後端與NVIDIA的CUDA和TensorRT加速深度整合。開發者既可以使用微軟的AI Toolkit將來自Hugging Face或Azure的模型轉換為針對RTX GPU優化的格式,也可以通過NVIDIA NIM微服務快速部署本地化代理。在量化、剪枝等技術的加持下,即使是130億參數級別的大模型也能流暢運行在消費級顯卡上。目前,包括主流的代碼生成、視頻編輯、內容總結等代理場景均已得到演示支持。
此前,微軟已推出Copilot+PC的概念,而此次與NVIDIA的合作進一步將其具象化為可動手構建的開發生態。微軟方面明確表示,相關能力將在未來集成到面向用戶的Copilot+PC體驗中,意味著最終消費者也會在系統層面直接調用這些高度個性化的AI代理。
對AI產業而言,這標誌著模型部署正從“雲端單中心”向“雲-端混合”加速裂變。在黃仁勳提出的“五層蛋糕”框架中,這一事件同時撥動了芯片層和應用層的齒輪:本地推理將放大對消費級GPU和高性能NPU的持續需求,讓RTX 40系列或未來芯片的“邊緣算力”敘事更紮實;也催生出大量原生Windows AI應用,可能重複智能手機系統催生APP生態的路徑。對微軟來說,這是強化Windows在AI時代操作系統的地位;對NVIDIA,則是將數據中心外的每一塊RTX顯卡變成其軟件生態的延伸。開發工具的平民化,正把AI代理從實驗室拽進每個人的任務欄。