maolon's recent timeline updates
maolon

maolon

V2EX member #442547, joined on 2019-09-22 10:16:39 +08:00
Today's activity rank 699
maolon's recent replies
我更好奇是 composer 2.5 强还是 2.7 code 强,
要是 2.7 code 还比不过 composer 2.5 这个 k2.5 的继续训练版本就搞笑了
所以 claude 才不允许除了 claude desktop 和 claude code 以外的产品使用他的订阅,哪怕你要程序化调用(比如-p ) 15 号后都不给你用自己的订阅的 quota 。
openai 他现在是追赶者,那当然有的牌都要打出来,更何况他还要打 api 价格战呢,你可以算算到时的补贴倍数。
1 day ago
Replied to a topic by ximaoyang WWDC 苹果 WWDC2026 拉完了
我就搞不懂了,苹果为什么要急。苹果坐拥全世界数量最大的个人终端入口,你 agent 再牛逼还不得运行在一个硬件上,这个硬件至少 5 年内依然是智能手机。

苹果走端侧 + 端侧硬件优先策略,本身 apple silicon 在手机上就是领先的芯片,gemini 就算 coding 和 agent 能力不行他也是目前多模态(音,文字,图像,视频)支持的最全最优秀的模型,和苹果需要的能力完全一致。你 fable 和 5.5 再强也不支持原生音视频啊。

再说端侧模型这个市场上竞争很激烈吗,并没有好吧,现在国产都在玩 1T+模型,a 和 oai 玩 5T+的,端侧里就 qwen 和 gemma 这两个主要玩家。
用户 ID 397 谢谢老板
为什么不用 batch api 来做,就算只走各家官方的 batch api ,价格正常来说也是普通 api 的 1/10 ,基本等于全程缓存的价格
5.5 = 5.4 X 2
5.4 = 5.3 / 5.2 X 1.7
这个用量你就算吧,5.2 时代的 plus 都不能站起来蹬
@stormtrooperx5 是的,快,好,便宜,而且算 auto complete 那一栏的 quota ,相当耐用
这两周已经连续重置 3 次了,每次都是我差不多蹬完 x20 的时候就 reset 了,我只能说一声:
怎么感觉对 RAG 定义都不同大家在各谈各的?
又不是非得加 embedding 然后向量搜索才叫 rag ,通过外部信息搜索最后注入 context 用于增强回答的都算 rag 啊,你用向量是 rag ,你直接 grep 搜文件也是 rag ,你 bm25 搜关键词还是 rag ,你把资料放图里然后搜图依然是 rag ,甚至你把这些步骤交给 agent 来自由选择组装叫 agentic rag
只不过现在很多人觉得这词不够新, 喜欢叫 context engineering
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3002 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 29ms · UTC 07:26 · PVG 15:26 · LAX 00:26 · JFK 03:26
♥ Do have faith in what you're doing.