輝達微軟聯手推出代理AI統一堆疊

輝達與微軟在Microsoft Build宣佈合作，為開發者提供從Windows到雲端到本地的Agentic AI統一部署堆疊。

來源:NVIDIA Blog · 2026-06-02 15:00 ET · #基礎設施 #應用

字號

輝達與微軟在 Microsoft Build 大會上公佈了一項重磅合作：雙方將聯手推出面向代理式 AI 的統一開發與部署堆疊，覆蓋 Windows 終端裝置、Azure 雲服務以及本地資料中心。該方案的目標是讓開發者能夠使用一致的介面和工具鏈，輕鬆構建能自主規劃、呼叫工具並執行長時間推理的智慧代理應用。

根據合作內容，輝達將其 NVIDIA NIM 推理微服務、NeMo 等模型最佳化框架、TensorRT-LLM 以及 cuDNN 等加速庫與微軟的平台深度整合。在雲側，開發者可通過 Azure AI Foundry 直接呼叫經輝達最佳化的模型，並在虛擬機器上獲得高效的推理效能；在邊緣側，雙方計劃在 Windows 作業系統中原生整合輝達的 AI 執行時，讓數億台 PC 也能穩定運行復雜的代理工作流。同時，針對本地離線場景，也提供了一套從模型部署到安全沙箱的完整解決方案。

這一合作的直接背景是，AI 產業正從以生成內容為主的階段，邁向需要複雜推理與行動能力的“代理時代”。但代理式 AI 對延遲、安全、上下文管理的要求遠高於聊天機器人，單一模型或單個雲平台難以單獨滿足。輝達在 GPU 和 CUDA 領域近乎獨佔的硬體生態，加上微軟橫跨操作系-統、雲端計算和開發工具的平台優勢，兩者的結合相當於把算力、軟體和部署環境打包成“交鑰匙”工程，可大幅降低企業入場門檻。

從產業鏈視角審視，此次聯手同時觸動了“五層蛋糕”中的晶片、基礎設施、模型和應用四個層級。對輝達來說，這不僅是向企業推理市場滲透的新通道，還可能催生消費級顯示卡在本地執行代理 AI 的需求，從而拓寬其 GPU 的銷售場景。對微軟而言，將代理能力深度嵌入 Windows 和 Azure，有望強化其作為企業級 AI 平台的地位，並與 Copilot 系列產品產生協同。市場觀察人士認為，此類合作會加速推理算力的消耗，並可能推動下一波企業 AI 資本開支週期，但實際拉動效應仍取決於代理應用的規模化落地速度與推理成本的最佳化程度。

輝達微軟聯手推出代理AI統一堆疊

延伸閱讀

相關深度報道

相關每日新聞