13 至 20 分鐘
,

一個 AI 模型,沒有人類指導,自己找到了一個藏在 FreeBSD 裡 17 年的遠端程式碼執行漏洞。

不是研究員找到的。不是漏洞獵人。不是國家級駭客組織。是 Anthropic 的新模型 Claude Mythos Preview,在拿到一個初始 prompt 之後,自主完成了從發現到利用的全部流程。

然後 Anthropic 做了一個決定:這個模型不公開發售。

2026 年 4 月 7 日,Anthropic 同時發布了兩件事——Claude Mythos Preview 模型,和一個叫 Project Glasswing 的產業防禦計畫。前者是他們造過最強的 AI;後者是他們認為這個 AI 太強了,所以必須有組織地控制誰能用它。

這篇文章拆解三件事:Mythos 到底有多強、Glasswing 在做什麼、以及這件事對你我意味著什麼。

Claude Mythos 的能力:數字說話

先看硬指標。

在 CyberGym 漏洞復現測試中,Mythos Preview 的成功率是 83.1%,上一代 Claude Opus 4.6 是 66.6%。聽起來差距不大?換個方式講:在 Firefox 瀏覽器的漏洞測試中,Mythos 成功開發出可運作的漏洞利用程式 181 次,Opus 4.6 只成功了 2 次。

181 比 2。這不是迭代升級,是物種差異。

在專家級 CTF(Capture the Flag,資安攻防比賽)任務中,2025 年 4 月之前沒有任何 AI 模型能完成這些題目。Mythos 的完成率是 73%。

英國 AI 安全研究所(AISI)的「The Last Ones」企業網路攻擊模擬——一個 32 步驟的完整滲透測試場景——Mythos 在 10 次嘗試中有 3 次完整通關。這是有史以來第一個能端到端完成整套企業級攻擊鏈的 AI 模型。

不只是資安。在 USAMO 2026 數學證明上,Mythos 拿了 97.6%(上一代 42.3%)。SWE-bench Verified 軟體工程基準達到 93.9%。這是一個全面性的能力跳升,只是在資安領域跳得特別離譜。

它找到了什麼

Anthropic 說,過去幾週內,Mythos Preview 在「每個主要作業系統和每個主要瀏覽器」中發現了數千個零日漏洞。幾個有名字的:

FreeBSD NFS 漏洞(CVE-2026-4747)——藏了 17 年。允許未經認證的攻擊者取得 root 權限。Mythos 從發現到寫出利用程式全部自主完成。

OpenBSD TCP SACK 漏洞——藏了 27 年。可以遠端讓系統當機。

FFmpeg H.264 解碼器漏洞——藏了 16 年。自動化測試工具已經跑過這段程式碼 500 萬次,沒有一次發現它。Mythos 找到了。

還有多個 Linux 核心漏洞可以被串接起來做權限提升。

這裡有個讓人不太舒服的事實:這些漏洞不是新的。它們一直在那裡——17 年、27 年、16 年。自動化 fuzzing 工具跑了幾百萬次都沒抓到。全世界最頂尖的資安研究員也沒找到。然後一個 AI 模型上線幾週就挖出來了。

Project Glasswing:為什麼不公開賣

Anthropic 的邏輯很直白:一個能自主找到零日漏洞並寫出利用程式的 AI,如果落到攻擊方手裡,後果不堪設想。所以他們選擇限量開放給防禦方。

Project Glasswing 是這個計畫的名字。12 個創始合作夥伴包括:

AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks,加上 Anthropic 自己。

另外還有超過 40 個維護關鍵基礎設施軟體的組織也拿到了存取權限。

Anthropic 投入了 1 億美金的模型使用額度給研究和合作夥伴,另外撥了 250 萬美金給 Linux Foundation 的 Alpha-Omega 和 OpenSSF 計畫,150 萬美金給 Apache Software Foundation。

定價方面,未來通過 API 使用的價格是每百萬輸入 token $25、每百萬輸出 token $125。可以通過 Claude API、Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry 存取。

翻譯成白話:蘋果、Google、微軟這些公司可以用 Mythos 來掃自家產品的漏洞。開源社群也可以申請使用。但你和我,暫時用不到。

這件事為什麼值得在意

表面上看,這是一則 AI 公司發新模型的新聞。但往深處想,有三個層面讓我覺得這件事比表面重要得多。

第一,攻防平衡被打破了。

資安領域有一句老話:防守方要守住所有的門,攻擊方只需要找到一個沒鎖的。過去幾十年,人類駭客找漏洞的速度大致跟得上修補的速度,勉強維持平衡。Mythos 這種等級的自動化漏洞挖掘能力,直接把天秤壓到了一邊。

好消息是 Anthropic 先把它交給了防守方。壞消息是,其他 AI 實驗室也在往這個方向走。今天 Mythos 能做到的事,6-12 個月後可能有開源模型也能做到。到時候就不是 Anthropic 能控制的了。

第二,「太強不能賣」成了一種商業模式。

Anthropic 把「我們的模型太危險了所以不公開」包裝成了一個高端產品——只有世界級企業和關鍵基礎設施維護者才能存取。每百萬輸出 token $125,是 Claude Opus 4.6 的好幾倍。

這很聰明。安全限制本身變成了稀缺性信號,而稀缺性是最好的定價策略。同時也讓 Anthropic 在「負責任 AI」的敘事中站穩了腳跟。

第三,普通人的數位安全可能因此變好。

那個 FreeBSD 漏洞藏了 17 年,FFmpeg 的藏了 16 年。你每天用的瀏覽器、作業系統、視訊播放器裡,可能都有類似的定時炸彈。現在至少有一個工具能系統性地找出它們。如果 Glasswing 合作夥伴真的把找到的漏洞都修了,我們所有人的軟體都會變得更安全。

這是少數 AI 進步直接改善普通人生活的案例,雖然你可能永遠感覺不到。

跟其他 AI 比,Mythos 在哪個位置

指標Claude Mythos PreviewClaude Opus 4.6GPT-5.4
CyberGym 漏洞復現83.1%66.6%未公布
Firefox 漏洞利用成功數181 次2 次
專家級 CTF 完成率73%~0%(2025.4前)
SWE-bench Verified93.9%75.6%~70%
USAMO 2026 數學97.6%42.3%
公開可用否(限定存取)
輸出 token 價格$125/M$75/M$60/M

Mythos 在資安和數學推理上的領先幅度是碾壓級的。在一般軟體工程(SWE-bench)上也拉開了明顯差距。代價是價格和可用性——目前只有 Glasswing 合作夥伴能用。

我的看法

Claude Mythos 和 Project Glasswing 讓我想到核能。同一種技術,可以發電也可以造彈。差別在於誰先拿到、怎麼用。

Anthropic 選擇了先交給防禦方。這個決定在當下是對的。但他們也承認,其他實驗室可能在幾個月內就能做到類似的事。到時候不是每家公司都會做同樣的選擇。

對我們這些普通用戶來說,短期影響是正面的——你的瀏覽器和系統會因為這波漏洞掃描變得更安全。長期來看,我們正在進入一個 AI 驅動的資安軍備競賽時代。攻擊方和防守方都會用 AI,最終決定勝負的不是技術本身,而是誰跑得快。

如果你是開發者或在科技業工作,建議關注 Anthropic 的「Claude for Open Source」計畫——開源專案可以申請 Mythos 的存取權限來掃描自己的程式碼。如果你只是普通使用者,記得更新你的系統和瀏覽器。那些被 Mythos 找到的漏洞,修補程式應該已經在路上了。

免責聲明:本文僅為資訊分享,不構成任何投資或技術決策建議。AI 技術和模型能力可能快速變化,文中數據截至 2026 年 4 月。

關於Mr. Slash

「Mr. Slash 的系統性人生」,創立於 2024年,由 Mr. Slash 本人及專業編輯團隊經營的財經內容平台。

我們的宗旨是透過投資、財經、自動化與新興科技等領域的深入解說與應用,幫助讀者打造穩定的被動收入系統。內容涵蓋加密貨幣、股息資產、量化工具、平台分潤等實用策略,協助你用更聰明的方法配置資金、累積資產,走在財務自由的路上,少走冤枉路。

若為商業合作邀稿,將會清楚標註「不代表本站立場」。

商業合作

如果您有任何關於我們團隊或網站內容的疑問或建議,歡迎您前往IG 私訊 @slash.Capital聯繫我們,謝謝!

發表迴響

Trending

探索更多來自 Mr. Slash|系統流人生 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading

Join Mr. Slash