刚刚看到 Kimi 发布了 K2.7 Code 。
官方给的数据:
- Kimi Code Bench v2 +21.8%
- Program Bench +11.0%
- MLS Bench Lite +31.5%
- 推理 Token 消耗降低 30%
有没有已经体验过的大佬说说感受?
刚刚看到 Kimi 发布了 K2.7 Code 。
官方给的数据:
有没有已经体验过的大佬说说感受?
1
cuebyte 14h 27m ago
Kimi 的思考一直是一个痛点,会在同一个地方反复思考多次,浪费 tokens ,降低输出质量。
不知道这一版有多大进步。 |
3
feelapi 14h 19m ago
贵
|
7
aohan0905 OP @qian33 至少体感是的, 我没准确看时间, 写了个计划, 开了 goal, 然后看下面 hud active 7m 的时候, 消耗了 20% 左右
|
8
herozzm 14h 2m ago 不要相信国产,试都不用试,这点时间可以干点别的
|
9
aohan0905 OP @qian33 我重新确定了下, 看控制台是这样, 然后 5h 额度花了接近 25%?
``` ● ✓ Goal complete. Worked 1 turn over 11m00s, using 4.4M tokens. ``` |
10
Alwaysonline 13h 54m ago
Kimi 有买 199 元的套餐,唯一的好处就是用来写前端页面,比 Codex 要漂亮些。
|
11
python35 13h 50m ago 我曾经试过写一个在家里 openwrt 上的 captive portal 系统做黑白名单、基于页面的授权码、对接 radius 系统、防火墙放行等功能, 基于 cc 的 glm5.1 和 deepseek v4 pro 都没写成功,最后是 codex 写成功了,可以正常使用, 至此投入 o 家的怀抱,开了 5x pro, 国产的确实还有差距; 如果你们有 openwrt 也可以试试写写看
|
13
ebushicao 13h 0m ago 我打开 kimi 官网,还没看到 kimi-k2.7 ,倒是弹出一个 kimi 信用卡... 就不能先把模型能力搞上去吗...
|
14
JasonYip 12h 45m ago via Android
@python35 国模需要有一个详细的 spec 能够执行的比较好,如果想省钱可以 chatbox 和 gpt 聊清楚然后生成详细的 spec ,让国模去做,其实效果还可以
|
15
Ericcccccccc 12h 26m ago gpt 5.5 的好用我只能说是有目共睹,这种不是跑分啥的可以植入的印象
|
16
wengjin456123 6h 16m ago via iPhone 我感觉挺好用的,199 套餐也够用,比我的 codex plus 量大的多,2.7 code 明显好用一些,工具调用 skill 调用也很积极,思考也没 2.6 那样很久很久
|
17
ilikexff 5h 58m ago
虽然相信国产,但是实力真的是硬伤,每一个过程模型出来的时候,口号都喊的牛逼哄哄的,不是碾压这个就是吊打那个,各种所谓的专业测评成绩粉漂亮,但是当你真实的使用的时候发现,还是依托💩
|
18
billzhuang 5h 57m ago @ilikexff 你这叫啥相信
|
19
Absofknglutely 5h 47m ago
你这叫啥相信
|
21
maolon 5h 27m ago
我更好奇是 composer 2.5 强还是 2.7 code 强,
要是 2.7 code 还比不过 composer 2.5 这个 k2.5 的继续训练版本就搞笑了 |
22
iorilu 5h 18m ago
跑分是跑分, 实际干活另一回事
|
23
XProxyAi 5h 11m ago
除了 SOTA 别的不建议用,浪费钱的同时 还在浪费生命
|
24
ebushicao 3h 34m ago
刚看到 opencode go 订阅能用 Kimi K2.7 Code 就直接开始测试了,结果上来就拉了个大的。
在一个刚初始化的 pnpm workspace 下,默认有一个 packages 目录。我的提示词是“使用 pnpm create vite 选择 react-ts 模板创建一个 web 项目,web 项目直接放在根目录 web 文件夹,移除 packages”,deepseek-v4-flash 都能正确完成的事,直接给我把 pnpm-workspace.yaml 删了,还问我要不要删除根目录的 package.json 和 node_modules 。 再结合我一打开 kimi 官网给我弹什么 AI 信用卡,我觉得 kimi 拉完了。 |
25
Blutbad 2h 48m ago
目前下来我觉得还行,给我做报告用的 html 页面比 2.6 快多了。2.6 经常深度思考开始套娃,一个跳转都能把页面干崩溃了,还修不好
。 |
27
mashimaroinfo1 2h 45m ago
@JasonYip 一样, 早试过了。
一线模型强思考下写的 spec, 国模无法遵守。 核心问题是国模的理解水平极差。在这个前提下, 你编程多强, 数学多好, 都没有意义。因为无法根据用户指令发挥出来。这根本就是一个语文问题。 |