英偉達與微軟在 Microsoft Build 大會上公佈了一項重磅合作:雙方將聯手推出面向代理式 AI 的統一開發與部署堆棧,覆蓋 Windows 終端設備、Azure 雲服務以及本地數據中心。該方案的目標是讓開發者能夠使用一致的接口和工具鏈,輕鬆構建能自主規劃、調用工具並執行長時間推理的智能代理應用。

根據合作內容,英偉達將其 NVIDIA NIM 推理微服務、NeMo 等模型優化框架、TensorRT-LLM 以及 cuDNN 等加速庫與微軟的平臺深度整合。在雲側,開發者可通過 Azure AI Foundry 直接調用經英偉達優化的模型,並在虛擬機上獲得高效的推理性能;在邊緣側,雙方計劃在 Windows 操作系統中原生集成英偉達的 AI 運行時,讓數億臺 PC 也能穩定運行復雜的代理工作流。同時,針對本地離線場景,也提供了一套從模型部署到安全沙箱的完整解決方案。

這一合作的直接背景是,AI 產業正從以生成內容為主的階段,邁向需要複雜推理與行動能力的“代理時代”。但代理式 AI 對延遲、安全、上下文管理的要求遠高於聊天機器人,單一模型或單個雲平臺難以單獨滿足。英偉達在 GPU 和 CUDA 領域近乎獨佔的硬件生態,加上微軟橫跨操作系-統、雲計算和開發工具的平臺優勢,兩者的結合相當於把算力、軟件和部署環境打包成“交鑰匙”工程,可大幅降低企業入場門檻。

從產業鏈視角審視,此次聯手同時觸動了“五層蛋糕”中的芯片、基礎設施、模型和應用四個層級。對英偉達來說,這不僅是向企業推理市場滲透的新通道,還可能催生消費級顯卡在本地運行代理 AI 的需求,從而拓寬其 GPU 的銷售場景。對微軟而言,將代理能力深度嵌入 Windows 和 Azure,有望強化其作為企業級 AI 平臺的地位,並與 Copilot 系列產品產生協同。市場觀察人士認為,此類合作會加速推理算力的消耗,並可能推動下一波企業 AI 資本開支週期,但實際拉動效應仍取決於代理應用的規模化落地速度與推理成本的優化程度。