代码模型赛道热闹不停。
月之暗面放出Kimi K2.7 Code,这也是Kimi K2系列首款专攻代码领域的专项模型。

新模型代码能力、Agent能力全面进阶,改善了长程任务里“过度思考”的问题,平均Token消耗直接减少30%,长周期复杂任务的成功率也再上新台阶。
Kimi新品一出,热度也是真烫,不少玩家第一时间上手试了一把,把跟GPT 5.5的对比实测都整出来了——
对比纯原生编写HTML5 Canvas物理模拟程序的能力。
第一个任务是模拟弹簧摆在伸缩线圈上运动,第二个任务是模拟1公斤的物体与10万公斤的物体发生碰撞,前两个任务两位选手的表现相当。
下一个任务是让22个球在一个旋转的六边形中运动,两款模型呈现出截然不同的效果。
Kimi K2.7这边的小球会随着滚筒的转动同步滑动,GPT 5.5那里的小球在滚筒里自由弹跳……
只不过,Kimi K2.7 Code的开销更少。
三个任务下来,最终Kimi K2.7 Code消耗了52.4k Token,成本仅0.28美元;
GPT-5.5消耗了23.4k Token,成本为0.93美元。
结合基准榜单成绩,这款新模型的综合实力还真值得一看。
机器学习工程领域突出
在官方交出的答卷里,相较前代Kimi K2.6,K2.7 Code实现全方位提升。
在纯代码能力测试里,Kimi Code Bench v2得分提升21.8%,Program-Bench上涨 11%;尤其在机器学习工程领域优势突出,MLS Bench Lite成绩增幅高达31.5%。

Agent能力同样进步显著,在多款专项测试中整体性能提升约10%,多工具联动、自动化任务执行更加稳定。

除了官方测评,各大行业热门基准榜单也印证了它的能力。
在侧重复杂算法与数学证明的ErdosBench中,Kimi K2.7 Code综合排名全网第二,仅次于 Claude Fable 5 max。

在开发者关注度最高的代码类榜单中,它更是拿下SWE-bench、Terminal-Bench 2.1两大榜单开源模型第一名,同时位列Vibe Code Bench第三名、ProgramBench第二名。
对比旧版本,它在Vibe Code Bench的得分从37.89%提升至47.21%。

更值得一提的是,在一份由Weco团队发布的,覆盖7款前沿模型的自主研究任务综合测评中,Kimi K2.7 Code也交出了亮眼答卷。
这项测试从机器学习工程、提示工程与算法发现三大维度,对模型在成本约束下的科研辅助能力进行了全面评估。
在最终的整体得分里,它以0.747分紧随 Claude Fable 5、Gemini 3.1 Pro、GPT-5.5、Gemini 3.5 Flash之后,超过了Claude Opus 4.8,排在第五位。

在机器学习工程这一专项上,K2.7 Code表现更好,拿下第一名。
还有个小发现是,Fable 5在这个专项上的表现一般,可能是成本过高的缘故……

实测对比
光看成绩单还不够,再来看看各种实测场景。
一位开发者分享了Kimi K2.7 Code一镜到底生成的黑洞物理模拟视频,成品效果细节拉满,光、引力透镜、星场效果都相当还原。

还有Kimi K2.6 vs Kimi K2.7 Code,给了一模一样的提示词,让它们用纯HTML Canvas、零外部库实现“一封信烧成灰烬”的动画。
K2.6这边只有模糊的灰烟,燃烧边缘生硬,纸张几乎没有焦痕和动态变化。
K2.7 Code火焰分层清晰,纸张边缘有不规则的燃烧轮廓,前方还有焦痕、碳化变黑的细节;余烬颗粒从烧着的部分脱落,连火星的渐变都做了出来。

和自己对比还不够,GPT 5.5和Claude Opus 4.8也得拉出来溜溜。
GMI Cloud选取洛伦兹吸引子、太阳系、水波三大经典物理场景展开实测。
Kimi K2.7 Code尤其在水波渲染上,呈现出最逼真的效果,水面波光粼粼,涟漪扩散自然,光影反射也做得十分细腻。
而GPT 5.5和Claude Opus 4.8的画面更像一块僵硬的蓝布,没有水面的质感。
这种物理渲染效果,不仅能表现模型的代码能力,更能直观展现它在复杂物理场景下的理解与实现能力。
亮眼的实战表现搭配亲民的使用成本,也让这款模型竞争力拉满。
根据官方定价规则,Kimi K2.7 Code每1M Token标准输入价格6.5 元、输出价格27元,和前代K2.6保持一致,缓存输入低至1.3元。
特别提醒,使用Kimi K2.7 Code必须开启思考模式(Thinking)。
目前Kimi API和Kimi Code均默认开启该模式,如果手动关闭,API会直接报错,Kimi Code则会自动回退到 K2.6 版本,这一点大家在使用时需要多加留意~
另外,6倍高速版Kimi K2.7 Code也要来了!
参考链接:
[1]https://x.com/mark_k/status/2066150260636872715?s=20
[2]https://x.com/zhengyaojiang
[3]https://x.com/noctus91/status/2066058980179538353
[4]https://x.com/stevibe/status/2065464159358370064
[5]https://x.com/atomic_chat_hq/status/2065581878279549090
本文来自转载量子位 ,观点仅代表作者本人,发现AI平台仅提供信息存储空间服务。
如若转载,请联系原作者;如有侵权,请联系编辑删除。

微信扫一扫

