2026亞馬遜雲科技中國峰會上,國內大模型企業月之暗面的B端業務負責人黃震昕對外披露了公司與亞馬遜雲科技的深度合作細節,並釋放出明確的全球化信號。他直言,月之暗面正致力於探索智能上限,希望在未來的競爭中“能和海外那三家模型掰一掰手腕”。

黃震昕用“飛輪式合作”來定義雙方關係。一方面,月之暗面從亞馬遜雲科技採購遍佈全球的雲基礎設施與算力服務,以支撐其模型運行與業務擴展;另一方面,Kimi的模型與API正全面嵌入亞馬遜雲科技的平臺與渠道,藉此直接觸達全球數百萬活躍企業客戶。這種雙向綁定,讓月之暗面既能獲得穩定可靠的底層資源,又能迅速打開海外市場局面。

雙方的合作已覆蓋從基礎設施到垂直行業的四個層面。在基礎設施層,Kimi藉助亞馬遜雲科技的全球數據中心與網絡,確保模型服務又快又穩。在平臺服務層,Kimi多個模型已登陸Amazon SageMaker,讓開發者能直接進行訓練與推理;同時,Amazon Bedrock已接入Kimi K2.5開源模型,未來還將接入更多最新模型,用戶無需自行管理基礎設施即可使用。在業務合作層,Kimi官方API上線AWS Marketplace,全球客戶可通過該數字軟件市場實現一鍵使用、按量付費。黃震昕透露,當前大模型硬件資源供不應求,Kimi會對新上線的Marketplace渠道提供重點資源傾斜,保障其擁有充足穩定的TPM(每分鐘Token配額)供給。在垂直行業層,雙方聯合打造面向金融、醫療、製造等場景的解決方案,將Kimi的核心模型能力無縫嵌入企業真實業務流程。

黃震昕強調,月之暗面自2023年3月成立起便定位為全球化公司,專注於生產力場景而非娛樂。其B端業務比重正不斷增加,面向企業客戶構建了從基礎模型(如K2.7 CodeK2.6K2.5)到豐富API,再到開箱即用產品(如Kimi Agent集群Kimi CodeKimi ClawKimi Work)的完整體系。技術上,Kimi將視覺理解、編程與Agent能力融合於單一模型,在預訓練階段即混合視覺與文本數據。其Visual-to-Code功能可將視覺動效直接轉化為代碼,近期與字節Trae合作推出的Visual Debug功能,更允許程序員通過錄屏截圖標註bug,由模型快速修復。

談及近期大模型服務價格波動,黃震昕分析,核心原因在於全球算力成本上漲,跟不上Token需求的激增。他認為,用戶對最高性能Token有溢價支付意願,而模型廠商正通過Cache優化、推理優化等技術努力拉低實際成本,兩股力量同時在起作用。Kimi自研的KVCache中心化解耦架構Mooncake,將Cache命中率推高至92.5%,使K2.7-code模型的有效輸入價格降低74%。在輸出效率上,高速版K2.7-code-highspeed的輸出速度可達約180tokens/s,短上下文場景更可達260tokens/s,實現“十幾秒輸出200行代碼”。黃震昕建議,評估模型價格不能只看輸入輸出單價,更要關注Cache命中率,命中率九十多與七八十相比,成本可能相差數倍。

在底層架構創新上,月之暗麵糰隊雖僅有300多人,卻致力於解決Scaling Law中的卡點。2025年,其首次大規模應用Muon二階優化器,讓10T數據發揮出20T的效用,Token效率翻倍,該技術已被GLMDeepSeek V4等模型採用。其發佈的Kimi Linear架構,將模型擴大10倍時原本指數級膨脹的Token成本壓縮為線性增長。2026年初,Kimi開源的“注意力殘差”技術,更引來OpenAI推理之父Jerry Tworek的點評,稱“深度學習的2.0時代正在到來”。黃震昕認為,基模廠商不能只看現有基準測試,必須向更底層的前沿技術看。

通過與亞馬遜雲科技的全面綁定,月之暗面正試圖在海外市場複製其在國內的增長曲線。黃震昕坦言,亞馬遜雲科技在海外的品牌與合規優勢明顯,Kimi希望藉此讓收入迎來更快更好的上升曲線。這條路徑能否幫助國產大模型在巨頭林立的全球市場中站穩腳跟,將是接下來產業觀察的關鍵看點。