中科曙光在6月15日正式发布新一代通用高性能计算平台,核心亮点是首次搭载国产百核级通用CPU。根据披露的规格,该平台FP64双精度浮点算力达到10TFLOPS,整体性能指标被描述为首次达到国际厂商旗舰级水平,这对长期关注国产计算生态的观察者而言是一个值得注意的节点。
在具体性能提升上,平台HPL双精度浮点性能较上一代提升近2倍,STREAM访存性能提升近1倍。这两个指标分别对应大规模科学计算与数据吞吐能力,是衡量高性能计算平台实际可用性的关键维度。访存性能的翻倍增长,意味着在处理AI训练中常见的大规模稀疏数据或高并发数据流时,数据搬运效率有了明显改善。
更值得关注的是系统级协同设计。中科曙光强调了“算—存—网”三级协同架构,并披露了自研scaleFabric高速互联网络的关键参数:端到端时延低至0.93微秒,单子网支持11.4万卡组网。在大规模并行计算场景下,节点间通信延迟往往是制约整体效率的“通信墙”,0.93微秒的时延与超过11万卡的组网能力,表明该平台在扩展性上试图直接应对万卡级集群的互联挑战。
从产业角度看,这一发布发生在国产算力底座加速建设的背景下。当前AI大模型训练对双精度算力与大规模组网的需求持续攀升,而此前国产平台在这两项指标上与国际旗舰产品存在代差。此次中科曙光将双精度算力推至10TFLOPS并公开互联网络的具体时延与规模,为国内AI基础设施的自主供应提供了新的选项。不过,实际部署中的稳定性、软件生态适配以及量产成本,仍是后续需要观察的环节。