杏彩·体育世界杯(中国)官方网站 为什么全球央行接连预警Anthropic最新大模子

发布日期:2026-05-28 09:05    点击次数:92

杏彩·体育世界杯(中国)官方网站 为什么全球央行接连预警Anthropic最新大模子

21世纪经济报谈记者肖潇

欧洲央行(ECB)往往举办按期会议,但就一个问题临时开会的情况很特别。当地时分5月26日,欧洲央行进犯召开了一场汇聚安全会议,提醒各大银行:最新大模子Mythos正在要挟金融系统,银行需要大幅加速安全时弊的开发。

不单欧洲,自Mythos本年4月发布以来,全球监管层一直在忙着发出警报。先是好意思国财政部长和好意思联储主席进犯召开闭门会议,随后英国、日本、加拿大、德国等监管部门也运转把AI汇聚安全列入金融明白议题。

Mythos被视为AnthropicClaude家具线迄今才能最强的模子,在发现和期骗软件时弊上的发达显耀飞升。Anthropic提醒其还是“发现躲闪了几十年的高危时弊,包括通盘主流操作系统和浏览器”,与此同期,“这种时弊可能对经济、大家安全和国度安全变成严重后果”。

不少东谈主把Mythos形色为汇聚安全领域的“奥本海默时刻”。出于安全计议,Anthropic第一次落拓模子公开,而是启动了名为玻璃之翼(ProjectGlasswing)的名目——仅向微软、苹果、摩根大通等12家好意思国巨头提供造访权,提早检测要道步调的时弊,先把防火墙码高。

但这也让莫得造访权的地区产生了新的着急。“欧洲银行无法使用Mythos模子,好意思国银行应该尽快与欧元区共享训戒。”欧洲央行监管委员会高层在媒体采访中催促谈。

发展和安全再次成为牢牢贴合的硬币两面:一面是猛涨的AI风险,另一面是越来越显然的本事差距,全球金融机构发轫感受到压力。

不外,由于大多数东谈主没法战役Mythos的真实情况,当今还弗成细目汇聚安全到底会被怎样颠覆。英国东谈主工智能安全接头所(AISI)以为,当今弗成断言AI随即就会击垮互联网,但不错深信的是,东谈主们弗成再把关联风险视为“几年后的问题”了,当下恰是一个要道凝视窗口期。

有哪些提醒?

4月7日,Mythos官宣问世本日,好意思国华盛顿片刻召开了一场闭门会议,参会的有好意思国财政部长贝森特、好意思联储主席鲍威尔,以及来自花旗、摩根士丹利和高盛等大型金融机构的高管。

多家外媒随后走漏,这场会议的议题就是评估Mythos对银行系统率来的冲击,以及金融机构需要启动里面大模子测试。

雷同的进犯会议,在接下来两个月席卷全球政府高层:

4月12日,英国央行、英国金融市集行动监管局和国度汇聚安全中心临时召开圆桌会议,核查Mythos可能走漏的要道信息系统时弊,条目各机构以“10倍紧迫性”礼聘行动加强汇聚凝视。

4月17日,加拿大央行两次主握金融明白会议,将Mythos等AI驱动的汇聚障碍列为重心议题。

4月末,日本财务大臣和日本三大银行会面,秘书缔造并吞专组来搪塞金融风险,并但愿能在两周内得回Mythos的使用权。

新加坡汇聚安全局致函本国所相要道信息基础步调机构的高层,条目它们再行评估AI汇聚障碍对现存安全体系的影响。

多种派头闪现了一个信号:AI汇聚障碍正在成为庞大的金融风险。银行不仅因为资金蚁集而容易成为汇聚障碍的梦想所在,也因为底层的往复系统、清理系统、客户数据库、身份考据模块,往往竖立在繁密的第三方软件生态之上,其中不少中枢架构还是运行了数十年。

“若是某家大型软件供应商发布了一个补丁,那么障碍者很有可能在短短30分钟内,就通过逆向工程找出这个补丁原本要开发的时弊。是以补丁一朝发布,银行必须竖立一套经过,确保比现时市集快得多的速率开发时弊。”欧洲央行监管委员会副主席弗兰克·埃尔德森在采访中暗意。

在他看来,当务之急是提高时弊的修补速率。尤其关于渊博依赖传统IT架构运行的金融机构,是一次安全大考。

为什么是Mythos?

不同于面向往往阔绰者的聊天大模子,Mythos专长于编程,是Claude家具线的最新升级,也被视为最强Claude模子。

本事敷陈炫耀,在软件工程测试SWE-benchVerified上,Mythos得分93.9%,上一代模子Opus4.6是80.8%;在汇聚安全才能评估CyberGym测试中,Mythos得分83.1%,也远高于Opus4.6的66.6%。

环球体育官网登录入口

Anthropic在博客中强调,公司并莫得有意测验Mythos的汇聚安全用途,但当模子的编程、推理和自主执行才能同步增强后,它当然会得回更强的时弊发现与期骗才能。换句话说,安全风险捕捉是模子才能全体擢升的副家具。

这种才能对汇聚安全到底意味着什么?Anthropic在自我敷陈中提到,Mythos在往常几周发现了数千个零日时弊——零日时弊指极其危机的过失,开发东谈主员必须在零日内开发。这些时弊粉饰险些通盘主流操作系统和浏览器。

其中一个最受存眷的案例来自操作系统OpenBSD。Anthropic称,Mythos发现了一个还是潜伏27年的时弊。自1998年发布以来,OpenBSD一直被视为业内安全加固进度最高的操作系统之一,亦然全球渊博防火墙和要道步调的地基。

更值得担忧的是,Mythos找到时弊后,杏彩·体育世界杯(中国)官方网站能进一步执行障碍。Anthropic里面测试写谈,Mythos生成时弊期骗代码的胜仗率达到72.4%,前一代Opus4.6的胜仗率险些为零。

汇聚安全是攻防两边的均衡术,故意于障碍者的本事,也故意于凝视者。“咱们信赖,遒劲的本事才能最终会使凝视方比障碍方受益更多。但若是前沿实验室发布这些模子不够严慎,短期内障碍方就可能会占据上风——尤其是过渡期,场地会很交加。”Anthropic写谈。

玻璃之翼(ProjectGlasswing)的计谋正竖立在这种判断上:Anthropic最终决定,Mythos造反直面向公众灵通,而是优先向一部分大型机构提供造访权。在才能全面扩散前,先让凝视方抢跑一步。

但这种作念法激发了新的担忧,若是发轫进的本事才能只向少数东谈主灵通,本事差距也会成为一种安全风险。

首批得回Mythos权限的有12家中枢谐和伙伴和40多家要道基础步调机构,险些全由好意思国科技与金融巨头组成,包括亚马逊、苹果、谷歌、英伟达、想科、摩根大通、Linux基金会等。除了好意思国,英国事咫尺独一证据得回Mythos预览版的政府,其渠谈来自接头机构英国东谈主工智能安全接头所(AISI)。

欧洲央行和监管机构尤其感到劳苦,因为他们被远离使用Mythos。欧洲央行监管着欧元区约111家最大的银行,摩根大通等华尔街大型银行的子公司还是得回了Mythos的测试版块,但欧洲监管方却无法平直战役。

“通盘关联机构王人应该得回此类本事,幸免竞争误解。”德国央行行长只可在4月的公开演讲中号令。

需要垂危吗?

由于大多数东谈主于今无法平直战役Mythos,外界关于它真实才能的判断,以及AI到底会不会颠覆汇聚安全,莫得东谈主能够给出明确谜底。

不少东谈主把Mythos形色为汇聚安全领域的“奥本海默时刻”,值得垂危的外部案例确乎不少。

比如一家汇聚安全公司Calif的接头东谈主员,期骗Mythos的早期版块,在macOS中发现两个此前未被纪录的时弊。这两个时弊可被串联期骗形成障碍旅途,进而获取权限,不错绕过苹果发轫进的内存齐全性保护机制;若是再诱骗其他障碍妙技,致使可能透顶限度一台Mac开采。

英国东谈主工智能安全接头所(AISI)同期拿到了Mythos和GPT5.5模子,其最新测试敷陈炫耀,Mythos之后,ChatGPT5.5还是成为第二个具备全自动汇聚障碍才能的大模子。

敷陈里有一个要道方针叫“CyberTimeHorizon(汇聚障碍时分跨度)”,用来揣度AI能集会、自主完成多永劫分的东谈主类使命,时分跨度越长,意味着AI离真的的全自动黑客越近。2025年11月,团队测度这个方针每8个月会翻倍一次;到了本年2月,数字还是裁减到4.7个月;Mythos出现后,进化周期又压缩了。

但另一种怀疑声不异存在:Mythos的风险被夸大了,它很可能是AI行业常见的炒作营销。

开源用具curl的创举东谈主丹尼尔·斯坦伯格就公开抒发过质疑。通过Linux基金会,curl蜿蜒得回了Mythos对curl代码库的分析收尾。敷陈宣称发现五个时弊,但斯坦伯格后续核查发现,唯有一个是真及时弊;三个是API文档早已阐扬的问题,另一个则仅仅往往Bug。

在斯坦伯格看来,AI的才能确乎在擢升,但距离窜改性遏制仍有距离。

雷同判断也出当今Mozilla的测试中。Mozilla往常弥远使用GPT-4和Sonnet3.5对Firefox进行安全分析,但一直受困于高误报率,很难真梗直范畴插足使用。比较之下Mythos的才能擢升是显然的,其一次性识别出了271个潜在时弊。

但Mozilla同期强调,这离真实的汇聚障碍还有一定距离,因为大多数情况下,单个时弊并不及以攻破复杂的凝视架构。更庞大的是,Mythos并莫得发现东谈主类看穿不了的安全时弊,仅仅速率和收尾大大擢升了。

一个细节也能阐扬问题。Mozilla团队会让Mythos生成补丁提议动作参考,但最终完成开发使命的仍然是东谈主类工程师,团队还莫得发现能够透顶自动化科罚的阵势。

AISI对此的最终判断是:AI正在快速接近自主执行复杂障碍经过的范围,而这种进化速率,显然快于传统安全行业的顺应速率,留给败北方的缓冲时分不会太长。

这概况才是激发震恐的根源,当下恰是一个要道窗口期,谁能更快竖立凝视体系,谁就能在改日拉开差距。

进一步说,谜底不仅仅谁能凝视Mythos,更是谁有才能造出下一个Mythos。在第三方模子评估榜单ArtificialAnalysis中,编程模子榜单的前十名被Claude、Cursor、ChatGPT轮替承包杏彩·体育世界杯(中国)官方网站,国内智谱的GLM-5.1为第十六名,KimiK2.6、DeepSeekV4也在前二十名。一些分析以为,中好意思之间前沿大模子的本事差距正在消弱。