李峥：携手共防AI“切尔诺贝利时刻”

7003383

7005136

7005137

<article><section data-type="rtext">在人工智能（AI）技术加速发展的同时，有关AI安全风险的警报声也在明显增大。英国《金融时报》不久前在一篇文章中引用“切尔诺贝利时刻”的说法，提醒世界需要防止AI领域出现类似“时刻”，即因为一次重大失控事件及其连锁反应，突然击穿社会对技术进步的信任。 这些声音的一个共同点，在于都不只是把AI发展看作一般意义上的产业升级，而是将其视为一种可能重塑社会结构和人类处境的基础性技术。与之相应的巨大风险，首先来自AI能力跃迁与制度相对滞后的错位。AI技术的一个优势但也极其危险之处在于，它的能力具有通用性和可复制性。同一个大模型可以帮助程序员修复系统漏洞，也能被破坏者用来生成攻击路径。 其次，来自AI领域过度的“速度崇拜”。当前前沿AI模型领域竞争已经形成明显的“军备竞赛逻辑”。相关企业需要融资、估值和市场份额，资本市场需要不断看到“下一代模型更强”。在这种逻辑下，AI模型能力快速增长，安全担忧和风险管理在技术加速的迫切性面前愈发难以受到足够重视。 
 <adv-loader __attr__inner="7004636" __attr__style="width: auto;position: relative;float: left;border: 1px solid #ebebeb; padding: 20px;overflow: hidden;margin: 10px 30px 40px 0;"></adv-loader>
 再次，来自AI领域的透明度不足。一些前沿AI模型在训练中用了什么数据，具备哪些危险能力，安全评估是否充分等等，这些关键问题目前依然高度依赖企业的自我披露。 最后，来自国家或路径竞争对AI安全治理的挤压。在几经犹豫和内部博弈之后，美国政府近期要求前沿AI模型在发布之前接受测试和国家安全审查。但美国方案有其内在局限。它看似强调安全，实则把安全纳入美国技术领先、国家安全和盟友体系等考量之中。这种做法可能让AI安全治理成为大国政治新的分歧点，阻碍国际社会参与全球AI安全治理合作的意愿。 显然，避免AI领域的“切尔诺贝利时刻”，不能单纯依靠恐慌心态，也不能靠粗暴的技术刹车。真正可行的路径是建立一种“在发展中嵌入安全、在安全中维持创新”的有效治理框架。 一是要求领先AI企业承担更高透明度义务。前沿AI大模型不能再被视为普通互联网产品，达到一定能力阈值、可能影响国家安全的模型应当发布标准化安全报告，披露能力评估、风险缓释措施和部署边界。 二是建立第三方安全评价机制。AI安全不能只由企业自我评测，而应当是企业自评、第三方复评、监管部门抽查、重大模型强制备案等相结合。对于涉及生物武器、关键基础设施破坏等高危能力的大模型，还应设置更严格的门槛。 三是探索算法授权、溯源和追责机制。未来的AI治理重点需从“内容审核”转向“能力授权”，针对高风险模型和高风险插件建立调用许可、身份认证、用途声明、行为日志和水印溯源机制。一旦发生重大事故，需要尽快确立责任主体，进行补救和惩罚。 四是推动国际社会制定共同的算法对齐原则和安全机制。AI安全不可能只依靠“美国方案”，而是需要多边、开放、可验证的规则体系。 再者，就是要把“防滥用”作为AI安全治理的核心要务。当前国际社会对于AI安全的讨论过度聚焦相关模型是否具有“自主意识”，却低估了它们被人为滥用这一现实世界中更迫近的风险。为此，AI安全治理重心应当放在提高防滥用的门槛上。 如何避免AI技术及其产业出现“切尔诺贝利时刻”，已经成为国际社会迫在眉睫的一场考验。这显然需要国际社会携手合作，允许不同国家、不同文明、不同发展阶段的主体参与规则制定。否则，所谓的AI安全治理就会变成新的技术壁垒，所谓的AI风险防控就会变成新的权力分配。（作者是中国现代国际关系研究院美国所副所长、研究员）</section></article>

7003385

7003386

7003387

7003388

7004638

7004639

7004637

7003389