月之暗面发布Kimi K2.7 Code编程模型，token消耗直降30%

月之暗面开源1.1万亿参数编程模型Kimi K2.7 Code，长程任务token消耗减少30%。

月之暗面在6月12日正式推出并开源了其最新的编程模型Kimi K2.7 Code，将参数规模提升至1.1万亿，并提供了256K的超长上下文窗口。这一发布标志着该公司在AI辅助编程赛道上的又一次重要迭代，其核心改进并非单纯追求基准跑分，而是聚焦于解决开发者在实际长程编程任务中遇到的效率与成本痛点。

此次更新的最大亮点在于对“过度思考”问题的针对性优化。在以往的长上下文编程场景中，模型常因不必要的反复推敲而产生大量冗余token，既拖慢了响应速度，也推高了使用成本。K2.7 Code通过改进推理机制，在长程任务中的平均token消耗直接减少了30%。这意味着开发者在处理复杂项目时，能用更低的成本获得更果断、更直接的代码生成结果。

从官方公布的基准测试数据来看，K2.7 Code相较于前代K2.6在多项编程和Agent测试中取得了10%至31.5%不等的提升，进步显著。不过，若将视线放宽至全球顶尖模型，它距离GPT-5.5（xhigh）和Opus 4.8（xhigh）等竞品仍存在一定差距。这反映出国内大模型厂商在编程这一垂直领域正加速追赶，但技术壁垒依然存在。

在商业化落地上，月之暗面采取了较为务实的定价策略。K2.7 Code已同步上线Kimi API开放平台，其标准输入和输出价格与K2.6保持一致，分别为每百万token 6.5元和27元；仅命中缓存的输入价格小幅上调0.2元至1.3元。同时，Kimi Code Plan的默认模型也直接升级为K2.7 Code。值得注意的是，该模型须在开启思考模式下才能发挥最佳性能，若手动关闭，API会报错并回退至K2.6模型，这在一定程度上限定了使用方式。

此外，月之暗面还预告了下周一将推出Kimi K2.7 Code高速版。该版本输出速度可达普通版的5到6倍，常规编程场景下约180 Token/s，短上下文场景更可飙至260 Token/s，但价格也相应翻倍。高速版在Kimi Code Plan中的用量消耗为普通版的3倍。这种“标准版控成本、高速版抢体验”的双轨策略，与近期国内多家大模型厂商推高速模型的趋势相吻合，反映出在编程这类高频交互场景中，响应速度本身已成为用户体验的关键组成部分。

智东西在模型上线后进行了初步实测，测试环境为VS Code配合Kimi Code插件。在复刻mac OS风格操作系统demo的前端任务中，K2.7 Code展现出更为果断的决策风格，没有在简单任务上花费过多无谓的思考时间，生成速度较快，使得开发者能够快速迭代。最终生成的demo完成度不错，拥有完整的开机动画和基本功能，但在生成与苹果logo相关的SVG动画时效果欠佳。在另一个开发“智能体小镇”复刻版的任务中，模型先撰写了一份结构清晰的PRD文档，随后在连续30多分钟的迭代后交付了完整可用的项目，文件架构清晰，基本功能实现。整体体验下来，过去那种在简单任务上反复自我质疑、长篇大论思考再动手的问题得到了明显改善。

从产业视角看，K2.7 Code的发布不仅是一次模型性能的常规升级，更折射出AI编程工具竞争正从单纯的基准分数比拼，转向对实际开发流程中成本、速度与体验的综合优化。token消耗的显著下降直接关联到开发者的API调用成本，而高速版的推出则回应了市场对实时交互效率的迫切需求。对于关注AI应用层与模型层的投资者而言，这种以开发者体验为核心的迭代路径，或许比单纯的榜单排名更能预示产品的长期竞争力。

月之暗面发布Kimi K2.7 Code编程模型，token消耗直降30%

延伸阅读

相关深度报道

相关每日新闻