一個由華為技術公司牽頭的聯合研究團隊近日公佈了一項重要進展:他們成功對DeepSeek的V4-Pro模型進行了全參數後訓練。V4-Pro是一個參數規模達到1.6萬億的巨型模型,而此次訓練的核心算力完全由華為自研的昇騰910C AI芯片提供,共動用了約1000顆芯片。這一消息由科技媒體Tom's Hardware率先報道,迅速在AI產業界引發關注。
所謂“後訓練”,通常指在模型完成大規模預訓練之後,通過有監督微調、強化學習或偏好對齊等技術,進一步提升模型在特定任務上的表現和安全性。對1.6萬億參數級別的模型進行全參數後訓練,意味著需要同時更新模型的所有權重,這對算力集群的規模、穩定性和通信效率提出了極高要求。
華為昇騰910C是其AI芯片系列的最新成員,旨在對標業界頂尖的AI訓練芯片。此前,業界對於國產AI芯片能否勝任千億乃至萬億參數級別模型的訓練任務,一直存在觀望和疑慮。此次實踐提供了一個具體的案例:在真實的大模型工作負載下,由昇騰芯片組成的集群不僅完成了訓練,而且處理的是全參數更新,這比部分參數微調的技術難度更大。
從產業角度看,這一事件在“五層蛋糕”框架中,直接觸及了芯片和基礎設施兩層。它表明,圍繞非英偉達體系構建的AI算力底座,正在從理論走向實用。對於DeepSeek而言,其模型在異構算力平臺上得到驗證,也拓寬了自身的部署和優化路徑。
當然,這只是一次研究團隊公佈的技術成果,距離大規模商業化部署仍有距離。訓練效率、成本、軟件生態的成熟度以及長期穩定性,都是後續需要持續觀察的維度。但無論如何,它向市場傳遞了一個信號:在通往萬億參數模型的道路上,算力供給的多元化正在加速成為現實。