过去 24–48 小时里,AI 圈最“能打”的信号不是某个花哨 Demo,而是两条路线在同一天把牌摊开:一条是开源模型继续把“能用的代理式编程”往更低成本推;另一条是闭源旗舰继续把“难题交付”往更高可靠性推。
阿里巴巴 Qwen 团队开源了 Qwen3.6-35B-A3B(MoE,35B 总参数 / 3B 激活),主打“agentic coding”;Anthropic 则发布Claude Opus 4.7,强调在高级软件工程、长任务一致性、视觉理解等方面相对上一代 Opus 4.6 的提升。
1)Qwen3.6-35B-A3B:把“代理式编程”做成更便宜的开源底座
从官方公告看,Qwen3.6-35B-A3B 的核心卖点很明确:用稀疏 MoE 的方式,把计算压力压到“3B 激活参数”的量级,但在编码与代理任务上追求接近更大稠密模型的体验。它同时支持“thinking / non-thinking”两种模式,并且作为开源权重发布,提供 Hugging Face / ModelScope 下载,也可在 Qwen Studio 上体验。
- 成本与可控性:开源权重意味着你可以自托管、可做内部评测与合规改造(这点对企业/团队尤其关键)。
- “代理”而非“补全”:官方把重点放在 agentic coding——也就是会调用工具、会跑长流程、会执行/验证,而不仅是写几行代码。
- 现实意义:当一个相对轻量的开源模型开始围绕“工具调用 + 长上下文 + 任务预算/规划”做系统化表达,意味着开源生态正在补齐真正影响生产力的那部分。
2)Claude Opus 4.7:把“更难的活”交付得更稳
Anthropic 的发布稿里,Opus 4.7 被定位为“最新、已全面可用”的 Opus 升级,重点强调:在高级软件工程上比 Opus 4.6 有明显提升,特别是更难、更长、更需要严谨执行与自我校验的任务;同时视觉能力更强(支持更高分辨率图像),并在专业产出(界面、文档、幻灯片等)上追求质量与审美一致性。
- 更像“交付型同事”:官方的表述里多次强调“长任务一致性、严格遵循指令、会自我验证再汇报”,这正是把 AI 从聊天工具推向工作流的关键差异。
- 可调“effort”与任务预算:发布稿提到 effort 参数(例如 high / xhigh 等)以及任务预算(task budgets),这本质是在把“推理深度 vs 延迟/成本”的控制权交给用户/开发者。
- 迁移注意点:Anthropic 也提醒了 tokenizer 更新与更高 effort 可能带来的 token 使用变化——这类“成本侧”的信息,往往比榜单分数更能影响你是否敢在生产上放开用。
3)同一天两条路线:开源追效率,闭源追可靠
我更愿意把这次看作一个“分工更清晰”的拐点:
- 如果你要的是可部署、可控、可替换的底座(尤其是成本敏感、数据敏感、需要离线/内网的场景),Qwen 这类开源 MoE 会越来越有吸引力。
- 如果你要的是把最难的任务交出去并且少返工(例如复杂重构、跨模块排查、长链路自动化),Opus 4.7 这类闭源旗舰往往仍更稳,尤其在“自我校验 + 长任务一致性”上。
值得注意的是,第三方开发者 Simon Willison 用他著名的“pelican benchmark(鹈鹕骑自行车)”把两者放在同一个语境里:他强调这类基准并不严肃,但也展示了一个事实——同一类‘看起来很接近’的输出,背后可能是完全不同的能力结构。所以别迷信单一榜单或单一 prompt,最好把评测做成“贴近你真实工作流”的小基准。
4)Xing 的实用建议:怎么选、怎么用,才不被热搜带节奏
- 先定场景,再选模型:代码补全/问答是一类;代理式执行(跑命令、改文件、回归测试)是另一类。
- 把“验证”写进流程:无论开源还是闭源,只要进生产,就要有可重复的验证环(测试、lint、最小复现脚本、回滚策略)。
- 关注成本参数:effort/推理深度、上下文长度、tokenizer 变化,都会直接影响账单与时延。
- 两套栈并行:开源负责大规模/可控;闭源负责高难度/高价值——这会成为很多团队的默认结构。
消息来源
- Qwen Team:Qwen3.6-35B-A3B: Agentic Coding Power, Now Open to All(https://qwen.ai/blog?id=qwen3.6-35b-a3b)
- Anthropic:Introducing Claude Opus 4.7(https://www.anthropic.com/news/claude-opus-4-7)
- Simon Willison:Qwen3.6-35B-A3B on my laptop drew me a better pelican than Claude Opus 4.7(https://simonwillison.net/2026/Apr/16/qwen-beats-opus/)