杏彩·体育世界杯(中国)官方网站为什么全球央行接连预警Anthropic最新大模子

发布日期：2026-05-28 09:05 点击次数：92

21世纪经济报谈记者肖潇

欧洲央行（ECB）往往举办按期会议，但就一个问题临时开会的情况很特别。当地时分5月26日，欧洲央行进犯召开了一场汇聚安全会议，提醒各大银行：最新大模子Mythos正在要挟金融系统，银行需要大幅加速安全时弊的开发。

不单欧洲，自Mythos本年4月发布以来，全球监管层一直在忙着发出警报。先是好意思国财政部长和好意思联储主席进犯召开闭门会议，随后英国、日本、加拿大、德国等监管部门也运转把AI汇聚安全列入金融明白议题。

Mythos被视为AnthropicClaude家具线迄今才能最强的模子，在发现和期骗软件时弊上的发达显耀飞升。Anthropic提醒其还是“发现躲闪了几十年的高危时弊，包括通盘主流操作系统和浏览器”，与此同期，“这种时弊可能对经济、大家安全和国度安全变成严重后果”。

不少东谈主把Mythos形色为汇聚安全领域的“奥本海默时刻”。出于安全计议，Anthropic第一次落拓模子公开，而是启动了名为玻璃之翼（ProjectGlasswing）的名目——仅向微软、苹果、摩根大通等12家好意思国巨头提供造访权，提早检测要道步调的时弊，先把防火墙码高。

但这也让莫得造访权的地区产生了新的着急。“欧洲银行无法使用Mythos模子，好意思国银行应该尽快与欧元区共享训戒。”欧洲央行监管委员会高层在媒体采访中催促谈。

发展和安全再次成为牢牢贴合的硬币两面：一面是猛涨的AI风险，另一面是越来越显然的本事差距，全球金融机构发轫感受到压力。

不外，由于大多数东谈主没法战役Mythos的真实情况，当今还弗成细目汇聚安全到底会被怎样颠覆。英国东谈主工智能安全接头所(AISI)以为，当今弗成断言AI随即就会击垮互联网，但不错深信的是，东谈主们弗成再把关联风险视为“几年后的问题”了，当下恰是一个要道凝视窗口期。

有哪些提醒？

4月7日，Mythos官宣问世本日，好意思国华盛顿片刻召开了一场闭门会议，参会的有好意思国财政部长贝森特、好意思联储主席鲍威尔，以及来自花旗、摩根士丹利和高盛等大型金融机构的高管。

多家外媒随后走漏，这场会议的议题就是评估Mythos对银行系统率来的冲击，以及金融机构需要启动里面大模子测试。

雷同的进犯会议，在接下来两个月席卷全球政府高层：

4月12日，英国央行、英国金融市集行动监管局和国度汇聚安全中心临时召开圆桌会议，核查Mythos可能走漏的要道信息系统时弊，条目各机构以“10倍紧迫性”礼聘行动加强汇聚凝视。

4月17日，加拿大央行两次主握金融明白会议，将Mythos等AI驱动的汇聚障碍列为重心议题。

4月末，日本财务大臣和日本三大银行会面，秘书缔造并吞专组来搪塞金融风险，并但愿能在两周内得回Mythos的使用权。

新加坡汇聚安全局致函本国所相要道信息基础步调机构的高层，条目它们再行评估AI汇聚障碍对现存安全体系的影响。

多种派头闪现了一个信号：AI汇聚障碍正在成为庞大的金融风险。银行不仅因为资金蚁集而容易成为汇聚障碍的梦想所在，也因为底层的往复系统、清理系统、客户数据库、身份考据模块，往往竖立在繁密的第三方软件生态之上，其中不少中枢架构还是运行了数十年。

“若是某家大型软件供应商发布了一个补丁，那么障碍者很有可能在短短30分钟内，就通过逆向工程找出这个补丁原本要开发的时弊。是以补丁一朝发布，银行必须竖立一套经过，确保比现时市集快得多的速率开发时弊。”欧洲央行监管委员会副主席弗兰克·埃尔德森在采访中暗意。

在他看来，当务之急是提高时弊的修补速率。尤其关于渊博依赖传统IT架构运行的金融机构，是一次安全大考。

为什么是Mythos？

不同于面向往往阔绰者的聊天大模子，Mythos专长于编程，是Claude家具线的最新升级，也被视为最强Claude模子。

本事敷陈炫耀，在软件工程测试SWE-benchVerified上，Mythos得分93.9%，上一代模子Opus4.6是80.8%；在汇聚安全才能评估CyberGym测试中，Mythos得分83.1%，也远高于Opus4.6的66.6%。

环球体育官网登录入口

Anthropic在博客中强调，公司并莫得有意测验Mythos的汇聚安全用途，但当模子的编程、推理和自主执行才能同步增强后，它当然会得回更强的时弊发现与期骗才能。换句话说，安全风险捕捉是模子才能全体擢升的副家具。

这种才能对汇聚安全到底意味着什么？Anthropic在自我敷陈中提到，Mythos在往常几周发现了数千个零日时弊——零日时弊指极其危机的过失，开发东谈主员必须在零日内开发。这些时弊粉饰险些通盘主流操作系统和浏览器。

其中一个最受存眷的案例来自操作系统OpenBSD。Anthropic称，Mythos发现了一个还是潜伏27年的时弊。自1998年发布以来，OpenBSD一直被视为业内安全加固进度最高的操作系统之一，亦然全球渊博防火墙和要道步调的地基。

更值得担忧的是，Mythos找到时弊后，杏彩·体育世界杯(中国)官方网站能进一步执行障碍。Anthropic里面测试写谈，Mythos生成时弊期骗代码的胜仗率达到72.4%，前一代Opus4.6的胜仗率险些为零。

汇聚安全是攻防两边的均衡术，故意于障碍者的本事，也故意于凝视者。“咱们信赖，遒劲的本事才能最终会使凝视方比障碍方受益更多。但若是前沿实验室发布这些模子不够严慎，短期内障碍方就可能会占据上风——尤其是过渡期，场地会很交加。”Anthropic写谈。

玻璃之翼（ProjectGlasswing）的计谋正竖立在这种判断上：Anthropic最终决定，Mythos造反直面向公众灵通，而是优先向一部分大型机构提供造访权。在才能全面扩散前，先让凝视方抢跑一步。

但这种作念法激发了新的担忧，若是发轫进的本事才能只向少数东谈主灵通，本事差距也会成为一种安全风险。

首批得回Mythos权限的有12家中枢谐和伙伴和40多家要道基础步调机构，险些全由好意思国科技与金融巨头组成，包括亚马逊、苹果、谷歌、英伟达、想科、摩根大通、Linux基金会等。除了好意思国，英国事咫尺独一证据得回Mythos预览版的政府，其渠谈来自接头机构英国东谈主工智能安全接头所(AISI)。

欧洲央行和监管机构尤其感到劳苦，因为他们被远离使用Mythos。欧洲央行监管着欧元区约111家最大的银行，摩根大通等华尔街大型银行的子公司还是得回了Mythos的测试版块，但欧洲监管方却无法平直战役。

“通盘关联机构王人应该得回此类本事，幸免竞争误解。”德国央行行长只可在4月的公开演讲中号令。

需要垂危吗？

由于大多数东谈主于今无法平直战役Mythos，外界关于它真实才能的判断，以及AI到底会不会颠覆汇聚安全，莫得东谈主能够给出明确谜底。

不少东谈主把Mythos形色为汇聚安全领域的“奥本海默时刻”，值得垂危的外部案例确乎不少。

比如一家汇聚安全公司Calif的接头东谈主员，期骗Mythos的早期版块，在macOS中发现两个此前未被纪录的时弊。这两个时弊可被串联期骗形成障碍旅途，进而获取权限，不错绕过苹果发轫进的内存齐全性保护机制；若是再诱骗其他障碍妙技，致使可能透顶限度一台Mac开采。

英国东谈主工智能安全接头所（AISI）同期拿到了Mythos和GPT5.5模子，其最新测试敷陈炫耀，Mythos之后，ChatGPT5.5还是成为第二个具备全自动汇聚障碍才能的大模子。

敷陈里有一个要道方针叫“CyberTimeHorizon（汇聚障碍时分跨度）”，用来揣度AI能集会、自主完成多永劫分的东谈主类使命，时分跨度越长，意味着AI离真的的全自动黑客越近。2025年11月，团队测度这个方针每8个月会翻倍一次；到了本年2月，数字还是裁减到4.7个月；Mythos出现后，进化周期又压缩了。

但另一种怀疑声不异存在：Mythos的风险被夸大了，它很可能是AI行业常见的炒作营销。

开源用具curl的创举东谈主丹尼尔·斯坦伯格就公开抒发过质疑。通过Linux基金会，curl蜿蜒得回了Mythos对curl代码库的分析收尾。敷陈宣称发现五个时弊，但斯坦伯格后续核查发现，唯有一个是真及时弊；三个是API文档早已阐扬的问题，另一个则仅仅往往Bug。

在斯坦伯格看来，AI的才能确乎在擢升，但距离窜改性遏制仍有距离。

雷同判断也出当今Mozilla的测试中。Mozilla往常弥远使用GPT-4和Sonnet3.5对Firefox进行安全分析，但一直受困于高误报率，很难真梗直范畴插足使用。比较之下Mythos的才能擢升是显然的，其一次性识别出了271个潜在时弊。

但Mozilla同期强调，这离真实的汇聚障碍还有一定距离，因为大多数情况下，单个时弊并不及以攻破复杂的凝视架构。更庞大的是，Mythos并莫得发现东谈主类看穿不了的安全时弊，仅仅速率和收尾大大擢升了。

一个细节也能阐扬问题。Mozilla团队会让Mythos生成补丁提议动作参考，但最终完成开发使命的仍然是东谈主类工程师，团队还莫得发现能够透顶自动化科罚的阵势。

AISI对此的最终判断是：AI正在快速接近自主执行复杂障碍经过的范围，而这种进化速率，显然快于传统安全行业的顺应速率，留给败北方的缓冲时分不会太长。

这概况才是激发震恐的根源，当下恰是一个要道窗口期，谁能更快竖立凝视体系，谁就能在改日拉开差距。

进一步说，谜底不仅仅谁能凝视Mythos，更是谁有才能造出下一个Mythos。在第三方模子评估榜单ArtificialAnalysis中，编程模子榜单的前十名被Claude、Cursor、ChatGPT轮替承包杏彩·体育世界杯(中国)官方网站，国内智谱的GLM-5.1为第十六名，KimiK2.6、DeepSeekV4也在前二十名。一些分析以为，中好意思之间前沿大模子的本事差距正在消弱。

杏彩·体育世界杯(中国)官方网站 为什么全球央行接连预警Anthropic最新大模子

杏彩·体育世界杯(中国)官方网站 为什么全球央行接连预警Anthropic最新大模子

杏彩·体育世界杯(中国)官方网站为什么全球央行接连预警Anthropic最新大模子

杏彩·体育世界杯(中国)官方网站为什么全球央行接连预警Anthropic最新大模子