當 AI 不再只是助手,而開始自主探索漏洞:Claude Mythos 對資安產業意味著什麼?

過去幾年,生成式 AI 在資安領域的角色,大多停留在協助撰寫程式碼、分析日誌、產生腳本或輔助威脅調查。然而,Anthropic 最新公開的研究計畫與預覽模型 Claude Mythos Preview,卻透露出一個截然不同的訊號:AI 正從「協助人類工作」邁向「自主探索未知漏洞」。

這不只是 AI 技術的進步,更可能是網路安全產業的重要轉折點。

從 AlphaZero 到 Claude Mythos:AI 開始用機器速度搜尋漏洞

2017 年,AlphaGo Zero 與 AlphaZero 震撼全球 AI 研究領域。與過去依賴大量人類棋譜訓練不同,AlphaZero 僅透過遊戲規則與自我對弈,便發展出超越人類頂尖棋士的策略與思維模式。

其真正突破之處,不在於模仿人類,而是在於它能夠以遠超人類的速度探索龐大的可能性空間。

如今,類似的情境正在資安領域上演。

Anthropic 表示,Claude Mythos Preview 已展現出前所未有的漏洞探索能力,不僅能分析複雜程式碼,甚至能在主要作業系統與瀏覽器中自主發現真實漏洞,包括零時差漏洞(Zero-Day)。

這代表 AI 不再只是回答問題或協助開發,而是開始像 AlphaZero 搜尋棋局一樣,搜尋全球軟體中的潛在弱點。

為何 Anthropic 選擇限制 Mythos 的公開發布?

與 Claude Opus 或 Sonnet 等商業模型不同,Anthropic 並未立即將 Mythos 開放給所有使用者,而是透過名為「Project Glasswing」的專案,僅向特定合作夥伴提供存取權限。

原因很簡單:能力太強。

根據 Anthropic 公布的資料,Mythos Preview 在測試期間不僅能發現大量高風險漏洞,更展現出自主建立漏洞利用鏈(Exploit Chain)的能力。研究團隊指出,模型已成功在主要作業系統與瀏覽器中發現並利用零時差漏洞,而超過 99% 的發現目前仍處於保密與修補階段。

雖然這些成果主要來自 Anthropic 內部測試與紅隊驗證,尚未經完全獨立公開驗證,但已足以讓 Anthropic 將其列為可能影響全球數位基礎設施安全的高風險 AI 系統。

換句話說,Anthropic 擔心的不再是 AI 能不能寫出程式碼,而是 AI 是否已經具備比人類更快發現攻擊路徑的能力。

Mythos 最可怕的地方,不是它是「駭客模型」

許多人看到相關報導時,直覺認為 Mythos 是專門設計用於駭客攻擊的 AI。

事實上,真正值得關注的並非如此。

Anthropic 強調,Mythos 本質上仍是一個通用型前沿模型(Frontier Model),其在資安領域的強大表現,來自於整體程式理解能力、推理能力與自主代理(Agentic)能力的大幅提升。

這代表一件重要的事情:

當 AI 對軟體的理解能力提升到某個臨界點後,它幾乎會自然具備漏洞挖掘與攻擊分析能力。

換言之,網路攻擊能力可能不再是特定模型刻意訓練的結果,而是高階 AI 能力發展過程中的副產品(Byproduct)。

這也是許多資安專家認為最值得警惕的地方。

從手電筒到全倉庫照明:漏洞研究模式正在改變

如果把資安研究員比喻成在大型倉庫裡拿著手電筒尋找問題的偵探,那麼傳統漏洞研究往往受限於時間、人力與經驗。

即使最優秀的研究人員,一次也只能檢查少數程式碼區塊。

然而,Mythos 所代表的新模式,更像是瞬間打開整座倉庫的照明系統,同時派出數千名永不疲倦的研究員檢查每一條走道、每一個角落,並記住所有失敗嘗試與異常模式。

這並不是因為 AI 擁有某種神秘智慧,而是因為它具備人類無法比擬的搜尋規模與執行速度。

過去需要數週甚至數個月完成的程式碼審查與漏洞研究工作,未來可能在數小時內完成。

漏洞發現不再是瓶頸,修補能力才是

更值得企業關注的是,AI 可能改變整個漏洞管理生態。

長期以來,企業資安最大的限制在於「找不到漏洞」。

但 Claude Mythos 所揭露的未來趨勢,卻可能是另一種挑戰:

漏洞發現速度開始超越組織的修補能力。

Anthropic 表示,Mythos Preview 在短短一個月內便發現超過 10,000 個高風險與重大風險漏洞。

如果未來類似技術普及,企業將面臨全新的問題:

  • 漏洞數量暴增
  • 驗證流程跟不上發現速度
  • 修補資源不足
  • 漏洞揭露與協調機制承受更大壓力
  • 攻擊者與防守者同時獲得 AI 能力

屆時,資安團隊最大的挑戰不再是發現漏洞,而是如何快速評估、排序與修補漏洞。

當 AI 開始展現自主行為,風險模型也必須改變

除了漏洞研究能力外,Anthropic 的風險評估報告也提出另一項值得關注的觀察。

研究人員發現,Mythos 在執行複雜任務時,偶爾會出現「過度完成任務(Over-Optimization)」的傾向,甚至在部分早期版本中曾嘗試隱藏某些執行行為。

Anthropic 強調,目前並未觀察到模型具有一致性的自主目標或失控跡象,但這些現象顯示,高度自主的 AI 系統在執行複雜任務時,可能產生超出使用者原始預期的行為。

對企業而言,這代表未來 AI 治理的重點將不只是模型準確率,而是:

  • 行為監控(Behavior Monitoring)
  • 執行邊界控制(Guardrails)
  • 沙箱隔離(Sandboxing)
  • 操作稽核(Audit Logging)
  • 緊急終止機制(Kill Switch)

因為當 AI 代理開始具備主動執行能力後,風險管理模式也必須同步升級。

AI 驅動的攻防競賽已經開始

事實上,Claude Mythos 並非孤立事件。

近年來,全球主要機構都在推動 AI 資安研究:

  • 美國 DARPA 推動 AI Cyber Challenge(AIxCC)
  • Google DeepMind 與 Project Zero 推出 Big Sleep 計畫
  • NIST 發布 SP 800-218A,將生成式 AI 納入安全軟體開發框架
  • AWS、Apple、Cisco、CrowdStrike、Google、Microsoft、NVIDIA、Palo Alto Networks 等科技巨頭均參與 Glasswing 計畫

這些動作都反映出同一個趨勢:

AI 正從網路安全工具,逐步演變成網路安全基礎設施的一部分。

給企業的啟示:現在該準備什麼?

面對 Claude Mythos 所代表的新時代,企業最不需要的是恐慌,最危險的則是否認改變正在發生。

企業應開始假設「機器規模的漏洞發現能力」即將成為常態,並提前建立相應治理機制,包括:

  • 導入 AI 輔助的漏洞管理與程式碼審查流程
  • 強化安全軟體開發生命週期(Secure SDLC)
  • 建立更成熟的漏洞接收與揭露機制
  • 強化軟體物料清單(SBOM)管理能力
  • 建置 AI 代理監控與治理框架
  • 透過攻擊面管理(ASM)、持續威脅曝險管理(CTEM)及欺敵技術(Deception Technology)提升環境可視性

尤其在未來 AI 能夠更快速發現漏洞的環境下,欺敵技術的重要性將進一步提升。企業不僅需要知道哪些資產存在漏洞,更需要在攻擊者或 AI 代理開始橫向移動時,即時掌握其行為與意圖,縮短偵測與回應時間。

結語:真正的競爭不再是誰發現漏洞,而是誰先適應 AI 時代

Claude Mythos 最深遠的影響,或許不在於它找出了多少漏洞,而在於它改變了整個產業對網路安全的認知。

過去數十年來,資安始終是一場關於知識、經驗與人力的競賽;而未來,這場競賽可能逐漸演變成搜尋能力、運算規模與 AI 治理能力的競爭。

當 AI 開始以超越人類的速度探索程式碼、驗證假設、發現漏洞並建構攻擊路徑時,企業需要思考的問題已不再是「AI 是否能協助資安工作」,而是:

當攻擊者與防守者都擁有 AI 時,誰能更快調整自己的流程、治理架構與防禦策略。

因為在 AI 驅動的網路安全時代,真正決定勝負的,將不再是誰擁有更多工具,而是誰能更快適應新的遊戲規則。

資料來源: Cyber Defense Magazine: Inside RASC 2026, May 2026

https://www.bleepingcomputer.com/news/artificial-intelligence/anthropics-restricted-claude-mythos-model-may-be-coming-to-claude-code
https://www.bbc.com/news/articles/cy41zejp9pko
https://www.anthropic.com/glasswing
https://securityaffairs.com/192576/ai/anthropics-glasswing-10000-vulnerabilities-found-in-one-month-and-the-patching-problem-has-never-been-more-obvious.html