AI推理芯片初創公司d-Matrix於2026年6月9日宣佈,其Corsair推理加速平臺已進入全面量產階段,並將在今年夏季開始向優先客戶批量發貨。這一消息發佈之際,市場對低延遲推理硬件的需求正因智能體AI工具的爆發而急劇升溫——2025年末Claude Code和OpenClaw等產品的突破,將推理工作負載推到了傳統純GPU基礎設施難以承受的水平。
Corsair平臺的核心設計思路是異構計算。在當前的AI推理流程中,GPU擅長處理計算密集型的“預填充”階段,而Corsair加速器則專注於“解碼”階段——即逐個生成token的過程。兩者在同一機架內協同工作,可將模型響應速度提升超過10倍,同時大幅壓縮計算和能源成本。d-Matrix創始人兼CEO Sid Sheth表示,Corsair正是為“AI推理時代”而生,面向智能體AI、交互式編碼和實時語音助手等對延遲極度敏感的應用場景。
從供應鏈角度看,d-Matrix在Corsair的設計之初就將可預測性作為核心要求。該芯片基於臺積電成熟的N6工藝節點製造,由臺積電與Alchip Technologies合作生產,具備可靠的大規模製造能力。與許多依賴HBM內存和CoWoS先進封裝的AI加速器不同,Corsair採用基於SRAM的存內計算小芯片架構,搭配有機基板和LP-DDR5內存技術,刻意避開了供應鏈中常見的瓶頸環節。這一設計選擇不僅簡化了製造流程,也讓d-Matrix能夠更準時地履行客戶承諾。
除了芯片本身,d-Matrix還推出了SquadRack參考設計,這是一套與Arista、博通和超微合作構建的機架級推理解決方案。SquadRack集成了Corsair推理加速器、JetStream高速網絡和Aviator軟件棧,專為前沿AI實驗室和大型雲服務商對低延遲、全天候推理的需求而打造。值得注意的是,該方案無需液冷,可在標準數據中心環境中快速部署,幾天內即可完成安裝。今年4月,d-Matrix收購了GigaIO的數據中心業務,進一步增強了其在機架級系統集成和現場運營方面的能力。
從產業格局來看,Corsair的量產釋放出一個清晰信號:AI基礎設施正從“GPU一家獨大”走向多元異構架構。超大規模雲商和前沿AI實驗室越來越傾向於採用解耦式計算策略,將不同工作負載分配給最適合的硬件。這種趨勢不僅關乎性能提升,也涉及成本優化——在“優質token經濟”的驅動下,企業和個人用戶願意為更快速、更互動的AI體驗付費,而Corsair這類專用推理加速器恰好切入了GPU在解碼階段效率不足的空白地帶。
d-Matrix目前僅向經過篩選的合格客戶提供Corsair平臺,具體定價未公開。隨著產品在今年夏季開始規模交付,市場將密切關注其在實際部署中的表現,以及它對英偉達等GPU巨頭在推理市場地位的潛在影響。