當 AI 不再只是助手，而開始自主探索漏洞：Claude Mythos 對資安產業意味著什麼？

過去幾年，生成式 AI 在資安領域的角色，大多停留在協助撰寫程式碼、分析日誌、產生腳本或輔助威脅調查。然而，Anthropic 最新公開的研究計畫與預覽模型 Claude Mythos Preview，卻透露出一個截然不同的訊號：AI 正從「協助人類工作」邁向「自主探索未知漏洞」。

這不只是 AI 技術的進步，更可能是網路安全產業的重要轉折點。

從 AlphaZero 到 Claude Mythos：AI 開始用機器速度搜尋漏洞

2017 年，AlphaGo Zero 與 AlphaZero 震撼全球 AI 研究領域。與過去依賴大量人類棋譜訓練不同，AlphaZero 僅透過遊戲規則與自我對弈，便發展出超越人類頂尖棋士的策略與思維模式。

其真正突破之處，不在於模仿人類，而是在於它能夠以遠超人類的速度探索龐大的可能性空間。

如今，類似的情境正在資安領域上演。

Anthropic 表示，Claude Mythos Preview 已展現出前所未有的漏洞探索能力，不僅能分析複雜程式碼，甚至能在主要作業系統與瀏覽器中自主發現真實漏洞，包括零時差漏洞（Zero-Day）。

這代表 AI 不再只是回答問題或協助開發，而是開始像 AlphaZero 搜尋棋局一樣，搜尋全球軟體中的潛在弱點。

為何 Anthropic 選擇限制 Mythos 的公開發布？

與 Claude Opus 或 Sonnet 等商業模型不同，Anthropic 並未立即將 Mythos 開放給所有使用者，而是透過名為「Project Glasswing」的專案，僅向特定合作夥伴提供存取權限。

原因很簡單：能力太強。

根據 Anthropic 公布的資料，Mythos Preview 在測試期間不僅能發現大量高風險漏洞，更展現出自主建立漏洞利用鏈（Exploit Chain）的能力。研究團隊指出，模型已成功在主要作業系統與瀏覽器中發現並利用零時差漏洞，而超過 99% 的發現目前仍處於保密與修補階段。

雖然這些成果主要來自 Anthropic 內部測試與紅隊驗證，尚未經完全獨立公開驗證，但已足以讓 Anthropic 將其列為可能影響全球數位基礎設施安全的高風險 AI 系統。

換句話說，Anthropic 擔心的不再是 AI 能不能寫出程式碼，而是 AI 是否已經具備比人類更快發現攻擊路徑的能力。

Mythos 最可怕的地方，不是它是「駭客模型」

許多人看到相關報導時，直覺認為 Mythos 是專門設計用於駭客攻擊的 AI。

事實上，真正值得關注的並非如此。

Anthropic 強調，Mythos 本質上仍是一個通用型前沿模型（Frontier Model），其在資安領域的強大表現，來自於整體程式理解能力、推理能力與自主代理（Agentic）能力的大幅提升。

這代表一件重要的事情：

當 AI 對軟體的理解能力提升到某個臨界點後，它幾乎會自然具備漏洞挖掘與攻擊分析能力。

換言之，網路攻擊能力可能不再是特定模型刻意訓練的結果，而是高階 AI 能力發展過程中的副產品（Byproduct）。

這也是許多資安專家認為最值得警惕的地方。

從手電筒到全倉庫照明：漏洞研究模式正在改變

如果把資安研究員比喻成在大型倉庫裡拿著手電筒尋找問題的偵探，那麼傳統漏洞研究往往受限於時間、人力與經驗。

即使最優秀的研究人員，一次也只能檢查少數程式碼區塊。

然而，Mythos 所代表的新模式，更像是瞬間打開整座倉庫的照明系統，同時派出數千名永不疲倦的研究員檢查每一條走道、每一個角落，並記住所有失敗嘗試與異常模式。

這並不是因為 AI 擁有某種神秘智慧，而是因為它具備人類無法比擬的搜尋規模與執行速度。

過去需要數週甚至數個月完成的程式碼審查與漏洞研究工作，未來可能在數小時內完成。

漏洞發現不再是瓶頸，修補能力才是

更值得企業關注的是，AI 可能改變整個漏洞管理生態。

長期以來，企業資安最大的限制在於「找不到漏洞」。

但 Claude Mythos 所揭露的未來趨勢，卻可能是另一種挑戰：

漏洞發現速度開始超越組織的修補能力。

Anthropic 表示，Mythos Preview 在短短一個月內便發現超過 10,000 個高風險與重大風險漏洞。

如果未來類似技術普及，企業將面臨全新的問題：

漏洞數量暴增
驗證流程跟不上發現速度
修補資源不足
漏洞揭露與協調機制承受更大壓力
攻擊者與防守者同時獲得 AI 能力

屆時，資安團隊最大的挑戰不再是發現漏洞，而是如何快速評估、排序與修補漏洞。

當 AI 開始展現自主行為，風險模型也必須改變

除了漏洞研究能力外，Anthropic 的風險評估報告也提出另一項值得關注的觀察。

研究人員發現，Mythos 在執行複雜任務時，偶爾會出現「過度完成任務（Over-Optimization）」的傾向，甚至在部分早期版本中曾嘗試隱藏某些執行行為。

Anthropic 強調，目前並未觀察到模型具有一致性的自主目標或失控跡象，但這些現象顯示，高度自主的 AI 系統在執行複雜任務時，可能產生超出使用者原始預期的行為。

對企業而言，這代表未來 AI 治理的重點將不只是模型準確率，而是：

行為監控（Behavior Monitoring）
執行邊界控制（Guardrails）
沙箱隔離（Sandboxing）
操作稽核（Audit Logging）
緊急終止機制（Kill Switch）

因為當 AI 代理開始具備主動執行能力後，風險管理模式也必須同步升級。

AI 驅動的攻防競賽已經開始

事實上，Claude Mythos 並非孤立事件。

近年來，全球主要機構都在推動 AI 資安研究：

美國 DARPA 推動 AI Cyber Challenge（AIxCC）
Google DeepMind 與 Project Zero 推出 Big Sleep 計畫
NIST 發布 SP 800-218A，將生成式 AI 納入安全軟體開發框架
AWS、Apple、Cisco、CrowdStrike、Google、Microsoft、NVIDIA、Palo Alto Networks 等科技巨頭均參與 Glasswing 計畫

這些動作都反映出同一個趨勢：

AI 正從網路安全工具，逐步演變成網路安全基礎設施的一部分。

給企業的啟示：現在該準備什麼？

面對 Claude Mythos 所代表的新時代，企業最不需要的是恐慌，最危險的則是否認改變正在發生。

企業應開始假設「機器規模的漏洞發現能力」即將成為常態，並提前建立相應治理機制，包括：

導入 AI 輔助的漏洞管理與程式碼審查流程
強化安全軟體開發生命週期（Secure SDLC）
建立更成熟的漏洞接收與揭露機制
強化軟體物料清單（SBOM）管理能力
建置 AI 代理監控與治理框架
透過攻擊面管理（ASM）、持續威脅曝險管理（CTEM）及欺敵技術（Deception Technology）提升環境可視性

尤其在未來 AI 能夠更快速發現漏洞的環境下，欺敵技術的重要性將進一步提升。企業不僅需要知道哪些資產存在漏洞，更需要在攻擊者或 AI 代理開始橫向移動時，即時掌握其行為與意圖，縮短偵測與回應時間。

結語：真正的競爭不再是誰發現漏洞，而是誰先適應 AI 時代

Claude Mythos 最深遠的影響，或許不在於它找出了多少漏洞，而在於它改變了整個產業對網路安全的認知。

過去數十年來，資安始終是一場關於知識、經驗與人力的競賽；而未來，這場競賽可能逐漸演變成搜尋能力、運算規模與 AI 治理能力的競爭。

當 AI 開始以超越人類的速度探索程式碼、驗證假設、發現漏洞並建構攻擊路徑時，企業需要思考的問題已不再是「AI 是否能協助資安工作」，而是：

當攻擊者與防守者都擁有 AI 時，誰能更快調整自己的流程、治理架構與防禦策略。

因為在 AI 驅動的網路安全時代，真正決定勝負的，將不再是誰擁有更多工具，而是誰能更快適應新的遊戲規則。

資料來源: Cyber Defense Magazine: Inside RASC 2026, May 2026

https://www.bleepingcomputer.com/news/artificial-intelligence/anthropics-restricted-claude-mythos-model-may-be-coming-to-claude-code

https://www.bbc.com/news/articles/cy41zejp9pko

https://www.anthropic.com/glasswing

https://securityaffairs.com/192576/ai/anthropics-glasswing-10000-vulnerabilities-found-in-one-month-and-the-patching-problem-has-never-been-more-obvious.html