中科曙光在6月15日正式發佈新一代通用高性能計算平臺,核心亮點是首次搭載國產百核級通用CPU。根據披露的規格,該平臺FP64雙精度浮點算力達到10TFLOPS,整體性能指標被描述為首次達到國際廠商旗艦級水平,這對長期關注國產計算生態的觀察者而言是一個值得注意的節點。

在具體性能提升上,平臺HPL雙精度浮點性能較上一代提升近2倍,STREAM訪存性能提升近1倍。這兩個指標分別對應大規模科學計算與數據吞吐能力,是衡量高性能計算平臺實際可用性的關鍵維度。訪存性能的翻倍增長,意味著在處理AI訓練中常見的大規模稀疏數據或高併發數據流時,數據搬運效率有了明顯改善。

更值得關注的是系統級協同設計。中科曙光強調了“算—存—網”三級協同架構,並披露了自研scaleFabric高速互聯網絡的關鍵參數:端到端時延低至0.93微秒,單子網支持11.4萬卡組網。在大規模並行計算場景下,節點間通信延遲往往是制約整體效率的“通信牆”,0.93微秒的時延與超過11萬卡的組網能力,表明該平臺在擴展性上試圖直接應對萬卡級集群的互聯挑戰。

從產業角度看,這一發布發生在國產算力底座加速建設的背景下。當前AI大模型訓練對雙精度算力與大規模組網的需求持續攀升,而此前國產平臺在這兩項指標上與國際旗艦產品存在代差。此次中科曙光將雙精度算力推至10TFLOPS並公開互聯網絡的具體時延與規模,為國內AI基礎設施的自主供應提供了新的選項。不過,實際部署中的穩定性、軟件生態適配以及量產成本,仍是後續需要觀察的環節。