d-Matrix Corsair推理平台量产，应对AI推理需求激增

d-Matrix宣布其数据中心AI推理加速器Corsair已投入量产，将向优先客户发货。

AI推理芯片初创公司d-Matrix于2026年6月9日宣布，其Corsair推理加速平台已进入全面量产阶段，并将在今年夏季开始向优先客户批量发货。这一消息发布之际，市场对低延迟推理硬件的需求正因智能体AI工具的爆发而急剧升温——2025年末Claude Code和OpenClaw等产品的突破，将推理工作负载推到了传统纯GPU基础设施难以承受的水平。

Corsair平台的核心设计思路是异构计算。在当前的AI推理流程中，GPU擅长处理计算密集型的“预填充”阶段，而Corsair加速器则专注于“解码”阶段——即逐个生成token的过程。两者在同一机架内协同工作，可将模型响应速度提升超过10倍，同时大幅压缩计算和能源成本。d-Matrix创始人兼CEO Sid Sheth表示，Corsair正是为“AI推理时代”而生，面向智能体AI、交互式编码和实时语音助手等对延迟极度敏感的应用场景。

从供应链角度看，d-Matrix在Corsair的设计之初就将可预测性作为核心要求。该芯片基于台积电成熟的N6工艺节点制造，由台积电与Alchip Technologies合作生产，具备可靠的大规模制造能力。与许多依赖HBM内存和CoWoS先进封装的AI加速器不同，Corsair采用基于SRAM的存内计算小芯片架构，搭配有机基板和LP-DDR5内存技术，刻意避开了供应链中常见的瓶颈环节。这一设计选择不仅简化了制造流程，也让d-Matrix能够更准时地履行客户承诺。

除了芯片本身，d-Matrix还推出了SquadRack参考设计，这是一套与Arista、博通和超微合作构建的机架级推理解决方案。SquadRack集成了Corsair推理加速器、JetStream高速网络和Aviator软件栈，专为前沿AI实验室和大型云服务商对低延迟、全天候推理的需求而打造。值得注意的是，该方案无需液冷，可在标准数据中心环境中快速部署，几天内即可完成安装。今年4月，d-Matrix收购了GigaIO的数据中心业务，进一步增强了其在机架级系统集成和现场运营方面的能力。

从产业格局来看，Corsair的量产释放出一个清晰信号：AI基础设施正从“GPU一家独大”走向多元异构架构。超大规模云商和前沿AI实验室越来越倾向于采用解耦式计算策略，将不同工作负载分配给最适合的硬件。这种趋势不仅关乎性能提升，也涉及成本优化——在“优质token经济”的驱动下，企业和个人用户愿意为更快速、更互动的AI体验付费，而Corsair这类专用推理加速器恰好切入了GPU在解码阶段效率不足的空白地带。

d-Matrix目前仅向经过筛选的合格客户提供Corsair平台，具体定价未公开。随着产品在今年夏季开始规模交付，市场将密切关注其在实际部署中的表现，以及它对英伟达等GPU巨头在推理市场地位的潜在影响。

d-Matrix Corsair推理平台量产，应对AI推理需求激增

延伸阅读

相关深度报道

相关每日新闻