
随着AI办公技术的普及,安全问题逐渐成为悬在企业与政府头顶的达摩克利斯之剑。近日,一场由美国政府主导、Anthropic参与的机密测试结果被谨慎披露:其旗舰模型Mythos在短短数小时内就定位了美国高度机密政府计算机系统的多处漏洞。这不仅是最新科技的一次炫技,更让整个行业重新审视AI办公工具的双刃剑属性——当模型能快速发现漏洞时,它是否也能被滥用来发起攻击?这场测试背后,又隐藏着怎样的技术博弈与监管角力?
一场机密系统的“压力测试”
美国政府官员以匿名方式向美联社透露,Anthropic与美国多家情报机构合作,将其Mythos模型投入了一场针对最高安全等级系统的漏洞检测演练。结果令人震惊:模型仅耗时数小时就找出了若干系统漏洞,而按传统方法,这类审计往往需要安全专家团队耗费数周甚至数月。
需要强调的是,该官员明确表示,这并不意味着模型能在同等时间内利用这些漏洞发动实际攻击。从技术角度看,漏洞发现与漏洞利用是两个难度层级截然不同的任务——前者依赖模式识别与代码分析,后者则需要构造精确的载荷并绕过多层防御机制。但即便如此,数小时发现机密系统漏洞的能力,已经足以让网络安全界感到不安。
这一测试隶属于Anthropic的Project Glasswing项目。该项目原本旨在联合科技巨头保护全球关键软件系统,同时防范Mythos模型一旦被滥用可能给公共安全、国家安全与经济带来的破坏性后果。有趣的是,该项目的防御性初衷,却在测试结果公布后引发了更多关于“进攻性AI”的忧虑。正如美国网络司令部负责人所暗示的,这种能力如果落入不当之手,后果不堪设想。
值得注意的是,测试结果并非首次公开。弗吉尼亚州民主党联邦参议员马克·沃纳早在6月11日的参议院听证会上就提及了此事,称“这款工具仅用数小时,就几乎攻破了我们的全部机密系统,而非耗费数周”。这段话来自美国国家安全局兼网络司令部最高负责人乔舒亚·拉德上将的信息传递。从政界到军界,对Mythos模型的关注程度可见一斑。

Mythos模型:AI办公领域的双刃剑
Mythos模型是Anthropic推出的顶级AI系统,属于其最新科技产品线的旗舰型号。与面向大众开放的简化版Fable 5不同,Mythos 5在网络安全能力上进行了深度强化,尤其擅长代码审计与漏洞挖掘。这种能力使其在AI办公领域具有独特价值:企业可以用它来检测内部系统的安全缺陷,提升开发与运维的安全水位。
然而,同样的能力也带来了巨大风险。在AI Agent技术的加持下,Mythos不仅能发现漏洞,还能生成可利用的攻击代码。这正是政府和产业界最担忧的地方——当AI办公工具具备了“攻击者思维”,传统的安全边界可能瞬间崩溃。
但Anthropic团队对此有不同看法。他们认为,漏洞发现能力的提升本身就是安全防御进步的表现。就像AI画图工具可以快速生成设计图一样,Mythos只是在自动化安全审计这个垂直领域做到了极致。问题的关键不在于能力本身,而在于谁在使用、如何使用。
目前,Anthropic对Mythos 5的访问权限实施了严格管控,仅限经过审查的企业和研究机构使用。但这种“自我设限”能否真正阻止恶意利用?大模型训练的普遍性意味着,类似的漏洞挖掘能力未来可能在其他模型上复现。这场“猫鼠游戏”才刚刚开始。
白宫指令下的技术博弈
尽管测试展示了Mythos模型的安全价值,但Anthropic与特朗普政府之间的关系却在持续恶化。白宫本月早些时候发布一项指令,要求Anthropic禁止外籍人员使用其两款最新AI模型:Fable 5与Mythos 5。这一指令下发的十天前,美国总统特朗普签署行政令,建立了一整套联邦政府审查框架:顶尖先进AI系统对外公开发布前,政府可开展最长30天的国家安全风险评估。
虽然行政令写明参与审查遵循自愿原则,但实际执行中,Anthropic面临巨大压力。公司最终选择关闭所有客户对这两款模型的访问权限。Anthropic公开表示,政府担忧的潜在安全风险不足以支撑这番管控措施。这背后其实是两种理念的碰撞:政府倾向于“先审后发”,企业则主张“能力开放,责任管控”。
从AI办公的角度看,这一事件给所有开发者敲响了警钟:即使你的模型在企业数字化转型中能发挥巨大作用,也可能因“过度强大”而遭遇监管铁拳。正如AI工具导航中收录的数百种AI应用,它们的安全合规门槛正在被重新定义。
业界联名抗议:限制不如拥抱
白宫的指令一出,立即引发了一系列连锁反应。一批网络安全企业高管联名呼吁政府撤销该指令,称这种限制措施反而会让美国的对手获益更多。联名信来自Adobe、英伟达等上百家企业的网络安全专家与行业负责人,信中明确指出:Mythos系列模型确实擅长查找软件缺陷、生成攻击代码,但并非只有它具备这类能力。
多名联名签署人表示,他们日常会使用其他基础大模型与开源模型开展安全审计和技术培训。这些模型同样具备漏洞发现能力,只是精度和效率可能不如Mythos。信中还警告,在美国对手网络技术飞速发展的当下,若无充分合理依据就剥夺美国顶尖的网络防御工具,无异于自断臂膀。
这一观点与众多AI办公从业者的想法不谋而合。与其限制工具,不如建立能力分级、用途限制和伦理审查的三道防线。比如抠图工具可以用于正版图片处理,也可以用于伪造证件——但监管部门不会因此禁掉所有抠图软件,而是要求平台方实施实名认证和行为审计。同样的逻辑应该适用于AI安全工具。
AI办公安全:从检测到防御的进化
Mythos模型的这次测试,实际上揭示了一个更深层的趋势:AI办公安全正在从被动响应走向主动检测。过去,企业依赖安全团队手动审计代码,效率低下且容易遗漏。而现在,AI图片生成甚至可以用来生成网络拓扑的可视化分析图,帮助安全专家更直观地理解系统弱点。
但真正的进化在于:AI不仅仅用于“找漏洞”,还开始参与“建防御”。比如,基于Mythos模型的检测结果,安全团队可以自动生成补丁建议,甚至利用文生图技术生成漏洞利用链的可视化文档,加速修复流程。这种闭环能力,正是AI办公工具从“辅助”走向“主导”的标志。
当然,这也带来了新问题:如果AI能同时生成攻击代码,那么使用同一模型的企业是否面临“助攻对手”的风险?答案在于访问控制和数据隔离。Anthropic对Mythos 5的严格管控,其实就是一种“可信任环境”的实践。未来,AI办公安全平台可能会普遍采用“沙盒+分级授权”的架构,确保能力只服务于防御目的。
未来展望:监管与创新的平衡
回看整个事件,核心矛盾在于:当AI办公工具的能力快速逼近甚至超越人类专家时,监管如何跟上?政府希望建立前置审查,企业呼吁事后问责,而学术界则担心过度限制会扼杀创新。
一个可能的出路是建立“能力等级认证”体系。就像枪支管制中的持枪证,不同等级的AI模型需要对应不同级别的安全审核。例如,漏洞挖掘能力达到Mythos级别的模型,必须向政府备案使用方信息,并接受定期安全检查。而对于通用型AI办公助手(如文档摘要、表格处理等),则可以大幅降低监管门槛。
另一个值得关注的点是国际合作。网络安全无国界,单边限制只会导致技术外流。如果美国严格限制Mythos的出口,其他国家的开发者完全可以用开源模型复现类似能力。届时,美国企业不仅失去了领先优势,还无法监控这些海外的AI安全工具——这才是真正的安全风险。
对于每一个正在使用AI办公工具的用户来说,这场“Mythos测试”都是一个提醒:技术本身没有善恶,但使用技术的人必须为自己选择负责。当我们为AI的高效欢呼时,也要时刻警醒其潜在的破坏力。这或许就是AI办公时代最需要建立的共识。