一個 AI 模型,沒有人類指導,自己找到了一個藏在 FreeBSD 裡 17 年的遠端程式碼執行漏洞。
不是研究員找到的。不是漏洞獵人。不是國家級駭客組織。是 Anthropic 的新模型 Claude Mythos Preview,在拿到一個初始 prompt 之後,自主完成了從發現到利用的全部流程。
然後 Anthropic 做了一個決定:這個模型不公開發售。
2026 年 4 月 7 日,Anthropic 同時發布了兩件事——Claude Mythos Preview 模型,和一個叫 Project Glasswing 的產業防禦計畫。前者是他們造過最強的 AI;後者是他們認為這個 AI 太強了,所以必須有組織地控制誰能用它。
這篇文章拆解三件事:Mythos 到底有多強、Glasswing 在做什麼、以及這件事對你我意味著什麼。
Claude Mythos 的能力:數字說話
先看硬指標。
在 CyberGym 漏洞復現測試中,Mythos Preview 的成功率是 83.1%,上一代 Claude Opus 4.6 是 66.6%。聽起來差距不大?換個方式講:在 Firefox 瀏覽器的漏洞測試中,Mythos 成功開發出可運作的漏洞利用程式 181 次,Opus 4.6 只成功了 2 次。
181 比 2。這不是迭代升級,是物種差異。
在專家級 CTF(Capture the Flag,資安攻防比賽)任務中,2025 年 4 月之前沒有任何 AI 模型能完成這些題目。Mythos 的完成率是 73%。
英國 AI 安全研究所(AISI)的「The Last Ones」企業網路攻擊模擬——一個 32 步驟的完整滲透測試場景——Mythos 在 10 次嘗試中有 3 次完整通關。這是有史以來第一個能端到端完成整套企業級攻擊鏈的 AI 模型。
不只是資安。在 USAMO 2026 數學證明上,Mythos 拿了 97.6%(上一代 42.3%)。SWE-bench Verified 軟體工程基準達到 93.9%。這是一個全面性的能力跳升,只是在資安領域跳得特別離譜。
它找到了什麼
Anthropic 說,過去幾週內,Mythos Preview 在「每個主要作業系統和每個主要瀏覽器」中發現了數千個零日漏洞。幾個有名字的:
FreeBSD NFS 漏洞(CVE-2026-4747)——藏了 17 年。允許未經認證的攻擊者取得 root 權限。Mythos 從發現到寫出利用程式全部自主完成。
OpenBSD TCP SACK 漏洞——藏了 27 年。可以遠端讓系統當機。
FFmpeg H.264 解碼器漏洞——藏了 16 年。自動化測試工具已經跑過這段程式碼 500 萬次,沒有一次發現它。Mythos 找到了。
還有多個 Linux 核心漏洞可以被串接起來做權限提升。
這裡有個讓人不太舒服的事實:這些漏洞不是新的。它們一直在那裡——17 年、27 年、16 年。自動化 fuzzing 工具跑了幾百萬次都沒抓到。全世界最頂尖的資安研究員也沒找到。然後一個 AI 模型上線幾週就挖出來了。
Project Glasswing:為什麼不公開賣
Anthropic 的邏輯很直白:一個能自主找到零日漏洞並寫出利用程式的 AI,如果落到攻擊方手裡,後果不堪設想。所以他們選擇限量開放給防禦方。
Project Glasswing 是這個計畫的名字。12 個創始合作夥伴包括:
AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks,加上 Anthropic 自己。
另外還有超過 40 個維護關鍵基礎設施軟體的組織也拿到了存取權限。
Anthropic 投入了 1 億美金的模型使用額度給研究和合作夥伴,另外撥了 250 萬美金給 Linux Foundation 的 Alpha-Omega 和 OpenSSF 計畫,150 萬美金給 Apache Software Foundation。
定價方面,未來通過 API 使用的價格是每百萬輸入 token $25、每百萬輸出 token $125。可以通過 Claude API、Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry 存取。
翻譯成白話:蘋果、Google、微軟這些公司可以用 Mythos 來掃自家產品的漏洞。開源社群也可以申請使用。但你和我,暫時用不到。
這件事為什麼值得在意
表面上看,這是一則 AI 公司發新模型的新聞。但往深處想,有三個層面讓我覺得這件事比表面重要得多。
第一,攻防平衡被打破了。
資安領域有一句老話:防守方要守住所有的門,攻擊方只需要找到一個沒鎖的。過去幾十年,人類駭客找漏洞的速度大致跟得上修補的速度,勉強維持平衡。Mythos 這種等級的自動化漏洞挖掘能力,直接把天秤壓到了一邊。
好消息是 Anthropic 先把它交給了防守方。壞消息是,其他 AI 實驗室也在往這個方向走。今天 Mythos 能做到的事,6-12 個月後可能有開源模型也能做到。到時候就不是 Anthropic 能控制的了。
第二,「太強不能賣」成了一種商業模式。
Anthropic 把「我們的模型太危險了所以不公開」包裝成了一個高端產品——只有世界級企業和關鍵基礎設施維護者才能存取。每百萬輸出 token $125,是 Claude Opus 4.6 的好幾倍。
這很聰明。安全限制本身變成了稀缺性信號,而稀缺性是最好的定價策略。同時也讓 Anthropic 在「負責任 AI」的敘事中站穩了腳跟。
第三,普通人的數位安全可能因此變好。
那個 FreeBSD 漏洞藏了 17 年,FFmpeg 的藏了 16 年。你每天用的瀏覽器、作業系統、視訊播放器裡,可能都有類似的定時炸彈。現在至少有一個工具能系統性地找出它們。如果 Glasswing 合作夥伴真的把找到的漏洞都修了,我們所有人的軟體都會變得更安全。
這是少數 AI 進步直接改善普通人生活的案例,雖然你可能永遠感覺不到。
跟其他 AI 比,Mythos 在哪個位置
| 指標 | Claude Mythos Preview | Claude Opus 4.6 | GPT-5.4 |
|---|---|---|---|
| CyberGym 漏洞復現 | 83.1% | 66.6% | 未公布 |
| Firefox 漏洞利用成功數 | 181 次 | 2 次 | — |
| 專家級 CTF 完成率 | 73% | ~0%(2025.4前) | — |
| SWE-bench Verified | 93.9% | 75.6% | ~70% |
| USAMO 2026 數學 | 97.6% | 42.3% | — |
| 公開可用 | 否(限定存取) | 是 | 是 |
| 輸出 token 價格 | $125/M | $75/M | $60/M |
Mythos 在資安和數學推理上的領先幅度是碾壓級的。在一般軟體工程(SWE-bench)上也拉開了明顯差距。代價是價格和可用性——目前只有 Glasswing 合作夥伴能用。
我的看法
Claude Mythos 和 Project Glasswing 讓我想到核能。同一種技術,可以發電也可以造彈。差別在於誰先拿到、怎麼用。
Anthropic 選擇了先交給防禦方。這個決定在當下是對的。但他們也承認,其他實驗室可能在幾個月內就能做到類似的事。到時候不是每家公司都會做同樣的選擇。
對我們這些普通用戶來說,短期影響是正面的——你的瀏覽器和系統會因為這波漏洞掃描變得更安全。長期來看,我們正在進入一個 AI 驅動的資安軍備競賽時代。攻擊方和防守方都會用 AI,最終決定勝負的不是技術本身,而是誰跑得快。
如果你是開發者或在科技業工作,建議關注 Anthropic 的「Claude for Open Source」計畫——開源專案可以申請 Mythos 的存取權限來掃描自己的程式碼。如果你只是普通使用者,記得更新你的系統和瀏覽器。那些被 Mythos 找到的漏洞,修補程式應該已經在路上了。
免責聲明:本文僅為資訊分享,不構成任何投資或技術決策建議。AI 技術和模型能力可能快速變化,文中數據截至 2026 年 4 月。
發表迴響