neteroster's recent timeline updates
neteroster

neteroster

V2EX member #191331, joined on 2016-09-11 21:01:55 +08:00
Today's activity rank 567
Per neteroster's settings, the topics list is hidden
Deals info, including closed deals, is not hidden
neteroster's recent replies
虽然所有人都打满可能会赔钱,但拿 API 当成本显然不对,而且订阅制的假设就在于不是所有人都会打满
3 days ago
Replied to a topic by Jensond macOS macOS 27 已知问题汇总
@SuzhaharCan 不是全屏闪烁,就只是窗口边缘闪几秒,而且是从最小化情况拉出来才会这样,首次启动软件打开的窗口不会,就很神秘
3 days ago
Replied to a topic by Jensond macOS macOS 27 已知问题汇总
> 新的 Liquid Glass 外接显示器,外接 4K 显示器 UI 上有时候会出现窗口边缘毛边闪烁

我的 26 内屏一直有这个问题...
3 days ago
Replied to a topic by hansonl 程序员 1 个 gpt pro 账号有多少并发 rpm
如果你说的是 codex ,很高,前段时间有人测过 pro 20x ,能打 50 并发以上,rpm 不太确定
有点幽默了,这次是纯误封,可以看 status.openai.com 和相关负责人 X 上的发言
8 days ago
Replied to a topic by w568w OpenAI 我的 GPT 5.5 怎么和你们的不一样?
@w568w 那我很怀疑是你的 harness 问题了,GPT 在各种 bench 和体验反馈都是执行强,deepswe 有案例分析,原文
```
GPT implements exactly what's asked
On DeepSWE, GPT-5.5 has the lowest rate of missing stated behaviors of any configuration in the chart; GPT-5.4 sits just behind it.

GPT reads the prompt and the visible repository contract literally, and produces a patch that honors both. The behavior is consistent across runs: when several GPT trials attempt the same task, they tend to converge on the same interpretation of the prompt, suggesting this precision is a stable trait rather than per-run luck.

A natural follow-up would be to examine whether this precision comes paired with related stylistic traits, like overly defensive code, surplus error handling, or other markers of a tightly instruction-anchored coding style.
```
8 days ago
Replied to a topic by w568w OpenAI 我的 GPT 5.5 怎么和你们的不一样?
@neteroster 还有一个和工程代码没那么相关的就是 opus 世界知识现在似乎已经是御三家最差了,5.5 长尾世界知识已经有半步 Gemini 水平了(甚至例如 ACG QA 这类以前 GPT 差的离谱的领域),再加上最前沿的数理知识/推理水平,导致写起研究类实验代码非常舒适,我不知道其他细分领域是否也会有这样的情况,但就我自己做数学交叉方向的经验来看,只要涉及数学推理的代码我只能相信 GPT 系列
8 days ago
Replied to a topic by w568w OpenAI 我的 GPT 5.5 怎么和你们的不一样?
5.5 是执行的神,opus 是规划的神,我不明白有什么冲突的

opus 无论 4.6,4.7,4.8 执行就是不行,我真的不明白,一份十分明确的 spec 给进去执行出来就还是会有明确漏项或者矛盾的地方,5.5 甚至 5.4 就完全不会有这种问题(这就是为啥 5.5 在 deepswe 之类的 bench 表现如此之好)

opus 的优点就是偏好对齐,还有讨论方案,这些微妙的地方,5.x 完全不行
23 年左右是要接码注册的,也许你那时候用了接码平台自己忘了

目前无法更换,如果 Codex 需要二验就等不了
11 days ago
Replied to a topic by wcwcxiaobin 程序员 有没有比 whisper large v3 更准更强的
那太多了,中文的话豆包,多语言的话

elevenlabs ,soniox
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3016 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 07:25 · PVG 15:25 · LAX 00:25 · JFK 03:25
♥ Do have faith in what you're doing.