Kimi K2.7 Code 发布了，有人已经替换 Claude Code / Codex 了吗?

aohan0905 · 2026-06-12T15:38:10Z

刚刚看到 Kimi 发布了 K2.7 Code 。官方给的数据： Kimi Code Bench v2 +21.8% Program Bench +11.0% MLS Bench Lite +31.5% 推理 Token 消耗降低 30% 有没有已经体验过的大佬说说感受？

kimi

Code

benchmark

27 replies • 2026-06-13 11:23:37 +08:00

1

cuebyte

14h 27m ago

Kimi 的思考一直是一个痛点，会在同一个地方反复思考多次，浪费 tokens ，降低输出质量。
不知道这一版有多大进步。

2

yuhaofe

14h 24m ago

@cuebyte 降 30%说的就是这点，不过没实测，蹲个测评

3

feelapi

14h 19m ago

贵

4

aohan0905

OP

14h 16m ago

@feelapi 我也发现了, 不到十分钟, 199 档 5h 花了 15%, 是 coding plan 额度降了吗?

5

kneo

14h 12m ago via Android

@cuebyte 这不和 deepseek 一样吗？

6

qian33

14h 6m ago

@aohan0905 意思是 coding plan 不耐用了吗 🤣

7

aohan0905

OP

14h 2m ago

@qian33 至少体感是的, 我没准确看时间, 写了个计划, 开了 goal, 然后看下面 hud active 7m 的时候, 消耗了 20% 左右

8

herozzm

14h 2m ago

2

不要相信国产，试都不用试，这点时间可以干点别的

9

aohan0905

OP

14h 0m ago

@qian33 我重新确定了下, 看控制台是这样, 然后 5h 额度花了接近 25%?
```
● ✓ Goal complete.
Worked 1 turn over 11m00s, using 4.4M tokens.
```

10

Alwaysonline

13h 54m ago

Kimi 有买 199 元的套餐，唯一的好处就是用来写前端页面，比 Codex 要漂亮些。

11

python35

13h 50m ago

1

我曾经试过写一个在家里 openwrt 上的 captive portal 系统做黑白名单、基于页面的授权码、对接 radius 系统、防火墙放行等功能，基于 cc 的 glm5.1 和 deepseek v4 pro 都没写成功，最后是 codex 写成功了，可以正常使用，至此投入 o 家的怀抱，开了 5x pro, 国产的确实还有差距；如果你们有 openwrt 也可以试试写写看

12

qian33

13h 4m ago

@aohan0905 那消耗过大了感觉 199 套餐也要不够用了

13

ebushicao

13h 0m ago

1

我打开 kimi 官网，还没看到 kimi-k2.7 ，倒是弹出一个 kimi 信用卡... 就不能先把模型能力搞上去吗...

14

JasonYip

12h 45m ago via Android

@python35 国模需要有一个详细的 spec 能够执行的比较好，如果想省钱可以 chatbox 和 gpt 聊清楚然后生成详细的 spec ，让国模去做，其实效果还可以

15

Ericcccccccc

12h 26m ago

2

gpt 5.5 的好用我只能说是有目共睹，这种不是跑分啥的可以植入的印象

16

wengjin456123

6h 16m ago via iPhone

1

我感觉挺好用的，199 套餐也够用，比我的 codex plus 量大的多，2.7 code 明显好用一些，工具调用 skill 调用也很积极，思考也没 2.6 那样很久很久

17

ilikexff

5h 58m ago

虽然相信国产,但是实力真的是硬伤,每一个过程模型出来的时候,口号都喊的牛逼哄哄的,不是碾压这个就是吊打那个,各种所谓的专业测评成绩粉漂亮,但是当你真实的使用的时候发现,还是依托💩

18

billzhuang

5h 57m ago

1

@ilikexff 你这叫啥相信

19

Absofknglutely

5h 47m ago

你这叫啥相信

20

win8en

5h 39m ago via Android

1

@ilikexff 这个里面没有小粉红，不要怕大胆点，没必要带前面那一句😂

21

maolon

5h 27m ago

我更好奇是 composer 2.5 强还是 2.7 code 强，
要是 2.7 code 还比不过 composer 2.5 这个 k2.5 的继续训练版本就搞笑了

22

iorilu

5h 18m ago

跑分是跑分, 实际干活另一回事

23

XProxyAi

5h 11m ago

除了 SOTA 别的不建议用，浪费钱的同时还在浪费生命

24

ebushicao

3h 34m ago

刚看到 opencode go 订阅能用 Kimi K2.7 Code 就直接开始测试了，结果上来就拉了个大的。
在一个刚初始化的 pnpm workspace 下，默认有一个 packages 目录。我的提示词是“使用 pnpm create vite 选择 react-ts 模板创建一个 web 项目，web 项目直接放在根目录 web 文件夹，移除 packages”，deepseek-v4-flash 都能正确完成的事，直接给我把 pnpm-workspace.yaml 删了，还问我要不要删除根目录的 package.json 和 node_modules 。

再结合我一打开 kimi 官网给我弹什么 AI 信用卡，我觉得 kimi 拉完了。

25

Blutbad

2h 48m ago

目前下来我觉得还行，给我做报告用的 html 页面比 2.6 快多了。2.6 经常深度思考开始套娃,一个跳转都能把页面干崩溃了，还修不好
。

26

aohan0905

OP

2h 47m ago via iPhone

@Blutbad 认同，2.7 感觉要比 2.6 体感上好不少

27

mashimaroinfo1

2h 45m ago

@JasonYip 一样, 早试过了。

一线模型强思考下写的 spec, 国模无法遵守。

核心问题是国模的理解水平极差。在这个前提下, 你编程多强, 数学多好, 都没有意义。因为无法根据用户指令发挥出来。这根本就是一个语文问题。