在 Computex 2026 上,一家由前英特尔和 Barefoot Networks 高管创立的初创公司 Delos Data 展示了一套模块化服务器平台,试图为 AI 芯片初创企业扫清通往机架级系统的主要障碍。当前,与英伟达和 AMD 在芯片设计上竞争已属不易,而机架级架构的兴起进一步抬高了门槛——企业不仅要设计芯片,还需攻克将六七十个 AI 加速器集成进单一机架所需的机械、散热与供电工程,让整个机架如同一块巨型 GPU 般工作。

Delos Data 的方案从外观上更像一台交换机而非 GPU 服务器,其核心思路是将复杂的内部互联网络标准化、模块化。该机箱配备了 36 个 OSFP 端口,系统中央的四个 OAM 插槽各分配 9 个端口。OAM 是一种开放插槽标准,常见于需要超越标准 PCIe 卡所能提供的互联带宽与供电能力的高性能加速器。以 200 Gbps SerDes 计算,每个芯片可获得 3.6 TB/s 的互联带宽,与英伟达最新的 Rubin GPU 持平。

采用 OSFP 接口意味着客户可以使用标准的直连铜缆或可插拔光模块,并根据所需的扩展域规模选择交换机。尽管 OSFP 通常与以太坊关联,但实际上用户可以通过它运行几乎任何协议,包括 UALink、Ultra Ethernet、PCIe 或其他定制协议。从部署角度看,这些系统会像其他超大规模数据中心系统一样布线,只是密度要高得多。

对于寻求机架级参考设计的 AI 芯片初创公司而言,Delos 并非唯一选择。例如,亚马逊云科技似乎正在将英伟达的 MGX 形态改造用于其 Trainium 3 机架系统,而 AMD 的 Helios 机架已成为 OCP 标准。理论上,这两种设计更易于维护,但 Delos 认为其模块化设计提供了更大的灵活性。公司首席技术官 Dan Daly 在展会期间表示,用户可以根据需要插入的线缆数量,灵活构建从单一加速器到上百个加速器的扩展域,甚至可以接入不同类型交换机,包括更简单的交换机甚至光电路交换机。

利用博通或 Marvell 的现有数据包交换机,这种设计在单层网络结构下即可支持 512 至 1024 个加速器,具体取决于使用 200 Gbps 还是 100 Gbps SerDes。若采用多层网络结构、光电路交换机或二维/三维环面拓扑,计算域还能进一步扩展,且全程使用现成组件。不过,OSFP 虽简化了连接,但在更大规模计算域中若需使用可插拔光学器件,功耗可能成为问题。这正是英伟达迟迟未拥抱光学扩展的原因之一——铜缆虽传输距离有限,但功耗仅为光学方案的一小部分。Delos 首席执行官 Ed Doe 透露,公司已在探索采用近封装或共封装光学器件、通过 MPO 型连接器替代 OSFP 的系统版本。

Delos 的野心不止于硬件。任何从事大规模网络部署的人都清楚,物理拓扑与逻辑拓扑——即设备在网络中的实际通信方式——会因工作负载不同而差异巨大。为此,Delos 开发了一套软件编排平台,用于促进这些交换网络或网状网络的配置与监控,能够在链路故障时动态重新路由流量。在 Computex 现场,这套被命名为 Nonstop AI 网络的软件平台进行了演示,参观者可以随机拔掉链路,观察网络自动检测并自我修复的过程。据称,该公司还有更多产品正在研发中,外界猜测一款基于商用芯片设计的高基数交换机可能会与其 Nonstop AI 系统形成互补。

对于 AI 产业而言,Delos 的出现折射出一个重要趋势:随着机架级系统成为大模型训练与推理的主流形态,基础设施层的创新正从单一的芯片性能竞赛,向系统级工程与网络架构延伸。如果这类模块化平台能够成熟落地,将显著降低新玩家进入高性能 AI 算力市场的资金与技术门槛,可能催生更多基于非英伟达或非 AMD 芯片的机架级方案,从而丰富整个 AI 基础设施的供给结构。不过,这一路径仍面临功耗、生态兼容性以及大规模部署验证等现实挑战,其实际影响力有待市场检验。