2026亚马逊云科技中国峰会上,国内大模型企业月之暗面的B端业务负责人黄震昕对外披露了公司与亚马逊云科技的深度合作细节,并释放出明确的全球化信号。他直言,月之暗面正致力于探索智能上限,希望在未来的竞争中“能和海外那三家模型掰一掰手腕”。

黄震昕用“飞轮式合作”来定义双方关系。一方面,月之暗面从亚马逊云科技采购遍布全球的云基础设施与算力服务,以支撑其模型运行与业务扩展;另一方面,Kimi的模型与API正全面嵌入亚马逊云科技的平台与渠道,借此直接触达全球数百万活跃企业客户。这种双向绑定,让月之暗面既能获得稳定可靠的底层资源,又能迅速打开海外市场局面。

双方的合作已覆盖从基础设施到垂直行业的四个层面。在基础设施层,Kimi借助亚马逊云科技的全球数据中心与网络,确保模型服务又快又稳。在平台服务层,Kimi多个模型已登陆Amazon SageMaker,让开发者能直接进行训练与推理;同时,Amazon Bedrock已接入Kimi K2.5开源模型,未来还将接入更多最新模型,用户无需自行管理基础设施即可使用。在业务合作层,Kimi官方API上线AWS Marketplace,全球客户可通过该数字软件市场实现一键使用、按量付费。黄震昕透露,当前大模型硬件资源供不应求,Kimi会对新上线的Marketplace渠道提供重点资源倾斜,保障其拥有充足稳定的TPM(每分钟Token配额)供给。在垂直行业层,双方联合打造面向金融、医疗、制造等场景的解决方案,将Kimi的核心模型能力无缝嵌入企业真实业务流程。

黄震昕强调,月之暗面自2023年3月成立起便定位为全球化公司,专注于生产力场景而非娱乐。其B端业务比重正不断增加,面向企业客户构建了从基础模型(如K2.7 CodeK2.6K2.5)到丰富API,再到开箱即用产品(如Kimi Agent集群Kimi CodeKimi ClawKimi Work)的完整体系。技术上,Kimi将视觉理解、编程与Agent能力融合于单一模型,在预训练阶段即混合视觉与文本数据。其Visual-to-Code功能可将视觉动效直接转化为代码,近期与字节Trae合作推出的Visual Debug功能,更允许程序员通过录屏截图标注bug,由模型快速修复。

谈及近期大模型服务价格波动,黄震昕分析,核心原因在于全球算力成本上涨,跟不上Token需求的激增。他认为,用户对最高性能Token有溢价支付意愿,而模型厂商正通过Cache优化、推理优化等技术努力拉低实际成本,两股力量同时在起作用。Kimi自研的KVCache中心化解耦架构Mooncake,将Cache命中率推高至92.5%,使K2.7-code模型的有效输入价格降低74%。在输出效率上,高速版K2.7-code-highspeed的输出速度可达约180tokens/s,短上下文场景更可达260tokens/s,实现“十几秒输出200行代码”。黄震昕建议,评估模型价格不能只看输入输出单价,更要关注Cache命中率,命中率九十多与七八十相比,成本可能相差数倍。

在底层架构创新上,月之暗面团队虽仅有300多人,却致力于解决Scaling Law中的卡点。2025年,其首次大规模应用Muon二阶优化器,让10T数据发挥出20T的效用,Token效率翻倍,该技术已被GLMDeepSeek V4等模型采用。其发布的Kimi Linear架构,将模型扩大10倍时原本指数级膨胀的Token成本压缩为线性增长。2026年初,Kimi开源的“注意力残差”技术,更引来OpenAI推理之父Jerry Tworek的点评,称“深度学习的2.0时代正在到来”。黄震昕认为,基模厂商不能只看现有基准测试,必须向更底层的前沿技术看。

通过与亚马逊云科技的全面绑定,月之暗面正试图在海外市场复制其在国内的增长曲线。黄震昕坦言,亚马逊云科技在海外的品牌与合规优势明显,Kimi希望借此让收入迎来更快更好的上升曲线。这条路径能否帮助国产大模型在巨头林立的全球市场中站稳脚跟,将是接下来产业观察的关键看点。