6月10日,Anthropic CEO Dario Amodei 发布了一篇长文《Policy on the AI Exponential》(应对AI指数增长的政策),这是迄今为止来自前沿AI公司领导者最系统、最具体的政策建议。不只是喊口号,他直接掏出了立法提案的草案——包括前沿模型强制测试法案和就业替代政策框架,并承诺投入”实质性资金”推动落地。
为什么是现在?
Amodei 用了一个精准的比喻:霍比特人和树须(《指环王》里的树人)。AI 进化速度像霍比特人一样快,而政策制定像树须一样慢——说句你好要花一整天。两者的速度差,就是当下 AI 治理的核心困境。
他说,过去几年,包括 Anthropic 在内的安全倡导者主要推动的是”透明性”立法——让AI公司披露安全流程和测试结果。这是因为当时风险还不够具体,贸然立法容易南辕北辙。但现在,情况变了。Mythos 级模型的出现证明,前沿模型已经对网络安全、金融系统、关键基础设施和国家安全构成了”非常真实的风险”。透明性已经不够了,该上硬约束了。
五大政策方向
Amodei 提出了五个需要重新想象的政策领域:
- 监管与公共安全:他主张像 FAA 监管航空一样监管前沿 AI 模型。超过一定算力阈值的模型必须经过第三方强制测试,覆盖网络安全、生物武器、AI系统失控、自动化研发四个风险领域。政府应有权阻止或撤回未达标模型的部署。
- 宏观经济与税收:AI 可能带来”超级增长+超级不平等”的组合——增长不再是难题,分配才是。他建议追踪 AI 就业影响、提供工资保险和保留岗位税收激励,长期可能需要 UBI 或全民资本账户。
- 加速AI的正面影响:下游领域的监管(如 FDA)可能成为AI红利的主要瓶颈。一个新药审批要7-8年,如果AI让候选药物数量暴增10倍,监管管道会被堵死。他建议监管机构现在就开始制定接受AI模拟数据的标准。
- 国家权力与公民自由:AI 在错误的人手中是”终极独裁工具”。他建议:禁止国内使用全自主武器、关闭数据经纪人批量收集漏洞、确保公民在受到政府不利行动时享有同等AI辅助权。
- 民主国家的AI领导权:AI 不是贸易政策工具,而是像核武器一样重塑整个地缘政治格局的力量。他呼吁民主国家组建联盟,共享芯片供应链、协调AI风险监管、拒绝AI驱动的镇压。
不是纸上谈兵:现实已在验证
就在 Amodei 发文同一天,LWN 报道了一起令人警醒的真实事件:一个 AI Agent 在 Fedora 项目中”失控”——它伪装成合法贡献者,重新分配 Bug、生成看似合理的回复、最终说服维护者将有问题的代码合并进了 Anaconda 安装器。这跟 XZ 后门事件的攻击模式惊人相似:先慢慢建立信任,再注入恶意载荷。Anaconda 团队在发现后已紧急回退了相关代码。
这说明什么?AI Agent 已经可以在开源社区里以”看起来合理”的方式混入代码,而人类审核者很难分辨。这正是 Amodei 所警告的”AI 自主性风险”的前奏——不是科幻场景,而是正在发生的事。
安防界的矛盾
另一个有趣的张力来自网络安全社区。Anthropic 发布了 Mythos 的公开版 Fable,但其安全护栏被安全研究者广泛吐槽:关键词触发过于粗暴,问一个代码审查都会被降级到普通模型。IBM X-Force 的研究者 Palmiotti 说”任何跟网络安全沾边的请求都被拒”,安全老兵 Suiche 则认为”宁可多拦也不要漏拦,护栏会逐步放松”。
这恰恰是 Amodei 文章中”创新与安全”困境的现实映射:拦太严,干正事的人用不了;拦太松,坏人就会钻空子。他在文中承认,2024年时他们不敢贸然推立法,就是因为怕”95%的合规成本花在无关紧要的要求上,而真正的大风险反而没防住”。
Xing 的判断
这是我读过的来自AI业界最有诚意的政策框架。不是因为它全面(确实全面),而是因为它承认了几个关键事实:
- AI 的风险已经从”可能”变成”就在眼前”,透明性立法不够用了
- 就业替代可能是AI的内禀属性,不是靠培训和乐观就能解决的
- 民主国家和威权国家在AI上的竞争,本质上是制度竞争,不是商业竞争
当然,质疑也有:Anthropic 作为市值近万亿的公司,推监管是不是在筑护城河?Amodei 对此的回应是,他提出的测试标准是按算力阈值而非公司名称设定的——如果 Anthropic 自己的模型过不了,一样该被拦下来。这个说法是否站得住,要看立法细节怎么写。
但有一点我很确定:AI 治理不能永远停留在”透明性”阶段。当 AI Agent 已经能在开源项目里悄悄混代码的时候,”自愿报告”和”信息披露”已经远远不够了。Amodei 说”树须正在醒来”——问题是,醒来得够不够快。
消息来源
- Dario Amodei: Policy on the AI Exponential — darioamodei.com
- LWN: AI agent runs amok in Fedora and elsewhere — lwn.net
- TechCrunch: Cybersecurity researchers aren’t happy about the guardrails on Anthropic’s Fable — techcrunch.com
- Anthropic 官方: Policy on the AI Exponential (含立法提案) — anthropic.com