文章最后更新于 2026年4 月29日
4 月中旬开始,Claude Opus 4.7、GPT-5.5、Grok 4.3、Kimi K2.6、Qwen 3.6 扎堆冒出来,厂商们像是在玩命。
我抓取了X和Reddit的帖子,总结成这个月报。
怎么把这些玩意儿变成自己工作流的一部分?
Claude Opus 4.7:把自己的肌肉记忆喂给了它
4.7 发布当天我就把主力位切过去了。以前用 4.6 跑复杂代码,总觉得像是在带实习生,得盯着他怕他半路跑偏。现在的 4.7 在长任务上的稳定性明显上了一个台阶。
我现在很少写那种几千字的 Prompt,太累。直接建 Project。
把平时写东西的烂习惯、常用的报告模板、甚至说话的语气全塞进去,让它生成一个专属的 Skill。
现在写周报,我直接丢一段语音过去:“按我平时的路子,重点放前三,下一步用项目符号列清楚。”它吐出来的东西,比我自己写的还像我。积累几次之后,我会让 AI 执行一次进化学习,这其实就是一个正向飞轮。
与其每天研究怎么写复杂的指令,不如把你的工作流固化成 AI 的本能。
至于那个交互式图表功能,分析数据时直接在对话框里出图,不用切到 Excel 乱翻,确实救了老命。
GPT-5.5:长跑运动员
GPT-5.5 在我这儿主要负责跑那种得干几个小时的体力活。
它在多步执行上确实长脑子了。我试过让它处理一整套文档集,它能自己规划步骤、调用工具去验证数据、最后吐出一份深度分析。这种长时程 Agent 任务,它比其他模型更耐操。
但我习惯让 Claude 交叉检查它的输出。两个模型打架,总能打出最靠谱的方案。
Kimi & Qwen:大规模搬砖的首选
Kimi K2.6 的 Agent Swarm 真的狠。一个指令拉起几百个子 Agent 并行干活,连着跑 12 小时都不带喘的。
如果用它做前端重构,从拆需求到写代码、测试,一条龙跑下来,省了几天的功夫。
Qwen 3.6 则是省钱。量化后的版本跑在家里那台老机器上,成本几乎是零。极致质量找 Claude,大批量搬砖直接切到国产模型,这是最现实且可行的组合。
权限给得过大,会自杀
Agent 从玩具变成了工具。
配合 Cursor 或 WorkBeaver,用嘴就能指挥电脑。但得提醒一句:
有人给 Coding Agent 开了全权限,结果那 AI 几个指令下去,直接把公司数据库连同备份全物理删除了。
我现在所有的 Agent 都关在隔离沙盒里,权限卡得死死的。先走 Co-pilot 模式跑熟了,确定它不造反再慢慢放权。
给打算下场的人几句实话
- 别迷信单一模型。 复杂推理和写作找 Claude,长流程任务找 GPT-5.5,大规模处理或本地跑找 Qwen。
- 别再琢磨那些花里胡哨的 Prompt。 关键是把你的风格和要求固化成 Skill。
- 本地部署一定要搞。 Qwen 这种量化版在消费级显卡上跑得飞起,隐私和成本优势太明显了。
- 给 AI 操作权限前,先想想它要是发疯了你能不能接得住。
真正能提高效率的,是那些愿意把 AI 塞进自己工作系统的人

