韩国AI芯片初创公司Rebellions正在将内存技术作为其产品路线图的核心支点,并以此为基础探索首次公开募股的可能性。公司首席执行官朴成贤在接受《EE Times》采访时表示,作为一家同时获得三星与SK海力士支持的韩国企业,Rebellions在探索以内存为中心的架构方面拥有独特优势。

这一战略选择与当前AI产业的技术演进方向高度吻合。随着大规模语言模型进入部署阶段,内存容量与带宽在大型AI推理加速器设计中的重要性急剧上升。Rebellions于2024年发布的第二代AI加速器Rebel,集成了四个计算芯粒,在300瓦功耗下可提供1 POPS的FP16算力,并配备144GB的HBM4e内存。这使得内存的供应链安全与经济性成为决定产品竞争力的关键因素。

朴成贤指出,行业正在从通用内存向多个方向分化。巨大的KV缓存需求需要HBM与高带宽闪存的组合来满足容量要求,而纵向扩展与横向扩展方案则需要专门的内存架构与内存池化技术。与此同时,行业也在探索定制化HBM的实现方式。Rebellions原本计划在其下一代架构中使用3D SRAM堆叠,但现已转向与SK海力士及三星合作开发3D堆叠DRAM。公司正在共同设计HBM内存与逻辑芯片,定制HBM有望集成用于快速令牌解码的逻辑单元,不过行业目前仍在摸索应在基础芯片中放入哪些逻辑。

在商业化落地方面,Rebel芯片目前主要在韩国本土与中东市场部署。朴成贤强调,在技术讨论之外,确保供应链安全才是当前最重要的事项,而Rebellions恰好能够保障全部内存供应。近期中东地区的地缘政治波动并未削弱该区域对AI基础设施的投资雄心,沙特阿美等关键参与者的AI战略仍在持续推进。朴成贤观察到,此前在该区域占据主要地位的Groq近期出现变化,这使中东市场开始向韩国硬件生态靠拢,寻求更多非英伟达的算力选项。在沙特阿拉伯,主权AI意味着英伟达与非英伟达硬件、美国与非美国硬件共存的异构计算平台,训练与推理并未被单一厂商锁定。

电信行业是Rebellions的另一个关键市场。公司迄今最大规模的部署位于SK电讯,一个多机架的第一代芯片集群正部分驱动SK电讯的AI助手Adot,该服务提供电话摘要等韩国特色功能,日均API调用量高达5000万次,是韩国最大的令牌消耗方。Rebellions的硬件还通过韩国电信以NPU即服务的形式提供基础设施支持。

从资本市场视角看,AI芯片公司Cerebras上月的大规模上市,为Rebellions这类企业提供了新的估值锚点,同时也将投资者与客户的注意力进一步聚焦到低延迟推理以及内存技术与供应链上。朴成贤认为,如果说一年前芯粒是行业热词,那么如今的关键词已变为内存与以内存为中心的架构,这正是公司吸引金融投资者的核心原因。尽管Rebellions近期已完成CXL与以太网I/O芯片的流片,但关于是否将计算芯粒作为独立产品推向市场,公司仍在评估,因为围绕芯粒的产业生态仍在演变,初创公司需要更清晰地判断合作伙伴与竞争格局。