全网实测Kimi K2.7 Code!黑洞、燃烧动画、水波渲染全卷起来了

代码模型赛道热闹不停。

月之暗面放出Kimi K2.7 Code,这也是Kimi K2系列首款专攻代码领域的专项模型。

文章配图-1

新模型代码能力、Agent能力全面进阶,改善了长程任务里“过度思考”的问题,平均Token消耗直接减少30%,长周期复杂任务的成功率也再上新台阶。

Kimi新品一出,热度也是真烫,不少玩家第一时间上手试了一把,把跟GPT 5.5的对比实测都整出来了——

对比纯原生编写HTML5 Canvas物理模拟程序的能力。

第一个任务是模拟弹簧摆在伸缩线圈上运动,第二个任务是模拟1公斤的物体与10万公斤的物体发生碰撞,前两个任务两位选手的表现相当。

下一个任务是让22个球在一个旋转的六边形中运动,两款模型呈现出截然不同的效果。

Kimi K2.7这边的小球会随着滚筒的转动同步滑动,GPT 5.5那里的小球在滚筒里自由弹跳……

只不过,Kimi K2.7 Code的开销更少。

三个任务下来,最终Kimi K2.7 Code消耗了52.4k Token,成本仅0.28美元;

GPT-5.5消耗了23.4k Token,成本为0.93美元。

结合基准榜单成绩,这款新模型的综合实力还真值得一看。

机器学习工程领域突出

在官方交出的答卷里,相较前代Kimi K2.6,K2.7 Code实现全方位提升。

在纯代码能力测试里,Kimi Code Bench v2得分提升21.8%,Program-Bench上涨 11%;尤其在机器学习工程领域优势突出,MLS Bench Lite成绩增幅高达31.5%。

文章配图-1

Agent能力同样进步显著,在多款专项测试中整体性能提升约10%,多工具联动、自动化任务执行更加稳定。

文章配图-1

除了官方测评,各大行业热门基准榜单也印证了它的能力。

在侧重复杂算法与数学证明的ErdosBench中,Kimi K2.7 Code综合排名全网第二,仅次于 Claude Fable 5 max。

文章配图-1

在开发者关注度最高的代码类榜单中,它更是拿下SWE-bench、Terminal-Bench 2.1两大榜单开源模型第一名,同时位列Vibe Code Bench第三名、ProgramBench第二名。

对比旧版本,它在Vibe Code Bench的得分从37.89%提升至47.21%。

文章配图-1

更值得一提的是,在一份由Weco团队发布的,覆盖7款前沿模型的自主研究任务综合测评中,Kimi K2.7 Code也交出了亮眼答卷。

这项测试从机器学习工程、提示工程与算法发现三大维度,对模型在成本约束下的科研辅助能力进行了全面评估。

在最终的整体得分里,它以0.747分紧随 Claude Fable 5、Gemini 3.1 Pro、GPT-5.5、Gemini 3.5 Flash之后,超过了Claude Opus 4.8,排在第五位。

文章配图-1

在机器学习工程这一专项上,K2.7 Code表现更好,拿下第一名。

还有个小发现是,Fable 5在这个专项上的表现一般,可能是成本过高的缘故……

文章配图-1

实测对比

光看成绩单还不够,再来看看各种实测场景。

一位开发者分享了Kimi K2.7 Code一镜到底生成的黑洞物理模拟视频,成品效果细节拉满,光、引力透镜、星场效果都相当还原。

文章配图-1

还有Kimi K2.6 vs Kimi K2.7 Code,给了一模一样的提示词,让它们用纯HTML Canvas、零外部库实现“一封信烧成灰烬”的动画。

K2.6这边只有模糊的灰烟,燃烧边缘生硬,纸张几乎没有焦痕和动态变化。

K2.7 Code火焰分层清晰,纸张边缘有不规则的燃烧轮廓,前方还有焦痕、碳化变黑的细节;余烬颗粒从烧着的部分脱落,连火星的渐变都做了出来。

文章配图-1

和自己对比还不够,GPT 5.5和Claude Opus 4.8也得拉出来溜溜。

GMI Cloud选取洛伦兹吸引子、太阳系、水波三大经典物理场景展开实测。

Kimi K2.7 Code尤其在水波渲染上,呈现出最逼真的效果,水面波光粼粼,涟漪扩散自然,光影反射也做得十分细腻。

而GPT 5.5和Claude Opus 4.8的画面更像一块僵硬的蓝布,没有水面的质感。

这种物理渲染效果,不仅能表现模型的代码能力,更能直观展现它在复杂物理场景下的理解与实现能力。

亮眼的实战表现搭配亲民的使用成本,也让这款模型竞争力拉满。

根据官方定价规则,Kimi K2.7 Code每1M Token标准输入价格6.5 元、输出价格27元,和前代K2.6保持一致,缓存输入低至1.3元。

特别提醒,使用Kimi K2.7 Code必须开启思考模式(Thinking)。

目前Kimi API和Kimi Code均默认开启该模式,如果手动关闭,API会直接报错,Kimi Code则会自动回退到 K2.6 版本,这一点大家在使用时需要多加留意~

另外,6倍高速版Kimi K2.7 Code也要来了!

参考链接:

[1]https://x.com/mark_k/status/2066150260636872715?s=20

[2]https://x.com/zhengyaojiang

[3]https://x.com/noctus91/status/2066058980179538353

[4]https://x.com/stevibe/status/2065464159358370064

[5]https://x.com/atomic_chat_hq/status/2065581878279549090

本文来自转载量子位 ,观点仅代表作者本人,发现AI平台仅提供信息存储空间服务。
如若转载,请联系原作者;如有侵权,请联系编辑删除。

(0)
评测组小编的头像评测组小编
未上真车,AI先当教练,2026届高考生,将成为首批“原生AI司机”?
上一篇 2小时前
DeepMind震撼报告:四条通往超级人工智能之路
下一篇 2小时前



扫码关注我们,了解最新AI资讯~

相关推荐

发表回复

登录后才能评论