華為團隊用昇騰910C完成DeepSeek 1.6萬億引數模型後訓練

華為團隊稱用1000塊昇騰910C完成DeepSeek V4-Pro的1.6萬億引數後訓練

來源:Tom's Hardware · 2026-06-06 08:00 ET · #模型 #晶片

字號

一個由華為技術公司牽頭的聯合研究團隊近日公佈了一項重要進展：他們成功對DeepSeek的V4-Pro模型進行了全引數後訓練。V4-Pro是一個引數規模達到1.6萬億的巨型模型，而此次訓練的核心算力完全由華為自研的昇騰910C AI晶片提供，共動用了約1000顆晶片。這一訊息由科技媒體Tom's Hardware率先報道，迅速在AI產業界引發關注。

所謂“後訓練”，通常指在模型完成大規模預訓練之後，通過有監督微調、強化學習或偏好對齊等技術，進一步提升模型在特定任務上的表現和安全性。對1.6萬億引數級別的模型進行全引數後訓練，意味著需要同時更新模型的所有權重，這對算力叢集的規模、穩定性和通訊效率提出了極高要求。

華為昇騰910C是其AI晶片系列的最新成員，旨在對標業界頂尖的AI訓練晶片。此前，業界對於國產AI晶片能否勝任千億乃至萬億引數級別模型的訓練任務，一直存在觀望和疑慮。此次實踐提供了一個具體的案例：在真實的大模型工作負載下，由昇騰晶片組成的叢集不僅完成了訓練，而且處理的是全引數更新，這比部分引數微調的技術難度更大。

從產業角度看，這一事件在“五層蛋糕”框架中，直接觸及了晶片和基礎設施兩層。它表明，圍繞非輝達體系構建的AI算力底座，正在從理論走向實用。對於DeepSeek而言，其模型在異構算力平台上得到驗證，也拓寬了自身的部署和最佳化路徑。

當然，這只是一次研究團隊公佈的技術成果，距離大規模商業化部署仍有距離。訓練效率、成本、軟體生態的成熟度以及長期穩定性，都是後續需要持續觀察的維度。但無論如何，它向市場傳遞了一個訊號：在通往萬億引數模型的道路上，算力供給的多元化正在加速成為現實。

華為團隊用昇騰910C完成DeepSeek 1.6萬億引數模型後訓練

延伸閱讀

相關深度報道

相關每日新聞