AI推理芯片初创公司d-Matrix于2026年6月9日宣布,其Corsair推理加速平台已进入全面量产阶段,并将在今年夏季开始向优先客户批量发货。这一消息发布之际,市场对低延迟推理硬件的需求正因智能体AI工具的爆发而急剧升温——2025年末Claude Code和OpenClaw等产品的突破,将推理工作负载推到了传统纯GPU基础设施难以承受的水平。
Corsair平台的核心设计思路是异构计算。在当前的AI推理流程中,GPU擅长处理计算密集型的“预填充”阶段,而Corsair加速器则专注于“解码”阶段——即逐个生成token的过程。两者在同一机架内协同工作,可将模型响应速度提升超过10倍,同时大幅压缩计算和能源成本。d-Matrix创始人兼CEO Sid Sheth表示,Corsair正是为“AI推理时代”而生,面向智能体AI、交互式编码和实时语音助手等对延迟极度敏感的应用场景。
从供应链角度看,d-Matrix在Corsair的设计之初就将可预测性作为核心要求。该芯片基于台积电成熟的N6工艺节点制造,由台积电与Alchip Technologies合作生产,具备可靠的大规模制造能力。与许多依赖HBM内存和CoWoS先进封装的AI加速器不同,Corsair采用基于SRAM的存内计算小芯片架构,搭配有机基板和LP-DDR5内存技术,刻意避开了供应链中常见的瓶颈环节。这一设计选择不仅简化了制造流程,也让d-Matrix能够更准时地履行客户承诺。
除了芯片本身,d-Matrix还推出了SquadRack参考设计,这是一套与Arista、博通和超微合作构建的机架级推理解决方案。SquadRack集成了Corsair推理加速器、JetStream高速网络和Aviator软件栈,专为前沿AI实验室和大型云服务商对低延迟、全天候推理的需求而打造。值得注意的是,该方案无需液冷,可在标准数据中心环境中快速部署,几天内即可完成安装。今年4月,d-Matrix收购了GigaIO的数据中心业务,进一步增强了其在机架级系统集成和现场运营方面的能力。
从产业格局来看,Corsair的量产释放出一个清晰信号:AI基础设施正从“GPU一家独大”走向多元异构架构。超大规模云商和前沿AI实验室越来越倾向于采用解耦式计算策略,将不同工作负载分配给最适合的硬件。这种趋势不仅关乎性能提升,也涉及成本优化——在“优质token经济”的驱动下,企业和个人用户愿意为更快速、更互动的AI体验付费,而Corsair这类专用推理加速器恰好切入了GPU在解码阶段效率不足的空白地带。
d-Matrix目前仅向经过筛选的合格客户提供Corsair平台,具体定价未公开。随着产品在今年夏季开始规模交付,市场将密切关注其在实际部署中的表现,以及它对英伟达等GPU巨头在推理市场地位的潜在影响。