
過去幾年,生成式 AI 在資安領域的角色,大多停留在協助撰寫程式碼、分析日誌、產生腳本或輔助威脅調查。然而,Anthropic 最新公開的研究計畫與預覽模型 Claude Mythos Preview,卻透露出一個截然不同的訊號:AI 正從「協助人類工作」邁向「自主探索未知漏洞」。
這不只是 AI 技術的進步,更可能是網路安全產業的重要轉折點。
從 AlphaZero 到 Claude Mythos:AI 開始用機器速度搜尋漏洞
2017 年,AlphaGo Zero 與 AlphaZero 震撼全球 AI 研究領域。與過去依賴大量人類棋譜訓練不同,AlphaZero 僅透過遊戲規則與自我對弈,便發展出超越人類頂尖棋士的策略與思維模式。
其真正突破之處,不在於模仿人類,而是在於它能夠以遠超人類的速度探索龐大的可能性空間。
如今,類似的情境正在資安領域上演。
Anthropic 表示,Claude Mythos Preview 已展現出前所未有的漏洞探索能力,不僅能分析複雜程式碼,甚至能在主要作業系統與瀏覽器中自主發現真實漏洞,包括零時差漏洞(Zero-Day)。
這代表 AI 不再只是回答問題或協助開發,而是開始像 AlphaZero 搜尋棋局一樣,搜尋全球軟體中的潛在弱點。
為何 Anthropic 選擇限制 Mythos 的公開發布?
與 Claude Opus 或 Sonnet 等商業模型不同,Anthropic 並未立即將 Mythos 開放給所有使用者,而是透過名為「Project Glasswing」的專案,僅向特定合作夥伴提供存取權限。
原因很簡單:能力太強。
根據 Anthropic 公布的資料,Mythos Preview 在測試期間不僅能發現大量高風險漏洞,更展現出自主建立漏洞利用鏈(Exploit Chain)的能力。研究團隊指出,模型已成功在主要作業系統與瀏覽器中發現並利用零時差漏洞,而超過 99% 的發現目前仍處於保密與修補階段。
雖然這些成果主要來自 Anthropic 內部測試與紅隊驗證,尚未經完全獨立公開驗證,但已足以讓 Anthropic 將其列為可能影響全球數位基礎設施安全的高風險 AI 系統。
換句話說,Anthropic 擔心的不再是 AI 能不能寫出程式碼,而是 AI 是否已經具備比人類更快發現攻擊路徑的能力。
Mythos 最可怕的地方,不是它是「駭客模型」
許多人看到相關報導時,直覺認為 Mythos 是專門設計用於駭客攻擊的 AI。
事實上,真正值得關注的並非如此。
Anthropic 強調,Mythos 本質上仍是一個通用型前沿模型(Frontier Model),其在資安領域的強大表現,來自於整體程式理解能力、推理能力與自主代理(Agentic)能力的大幅提升。
這代表一件重要的事情:
當 AI 對軟體的理解能力提升到某個臨界點後,它幾乎會自然具備漏洞挖掘與攻擊分析能力。
換言之,網路攻擊能力可能不再是特定模型刻意訓練的結果,而是高階 AI 能力發展過程中的副產品(Byproduct)。
這也是許多資安專家認為最值得警惕的地方。
從手電筒到全倉庫照明:漏洞研究模式正在改變
如果把資安研究員比喻成在大型倉庫裡拿著手電筒尋找問題的偵探,那麼傳統漏洞研究往往受限於時間、人力與經驗。
即使最優秀的研究人員,一次也只能檢查少數程式碼區塊。
然而,Mythos 所代表的新模式,更像是瞬間打開整座倉庫的照明系統,同時派出數千名永不疲倦的研究員檢查每一條走道、每一個角落,並記住所有失敗嘗試與異常模式。
這並不是因為 AI 擁有某種神秘智慧,而是因為它具備人類無法比擬的搜尋規模與執行速度。
過去需要數週甚至數個月完成的程式碼審查與漏洞研究工作,未來可能在數小時內完成。
漏洞發現不再是瓶頸,修補能力才是
更值得企業關注的是,AI 可能改變整個漏洞管理生態。
長期以來,企業資安最大的限制在於「找不到漏洞」。
但 Claude Mythos 所揭露的未來趨勢,卻可能是另一種挑戰:
漏洞發現速度開始超越組織的修補能力。
Anthropic 表示,Mythos Preview 在短短一個月內便發現超過 10,000 個高風險與重大風險漏洞。
如果未來類似技術普及,企業將面臨全新的問題:
- 漏洞數量暴增
- 驗證流程跟不上發現速度
- 修補資源不足
- 漏洞揭露與協調機制承受更大壓力
- 攻擊者與防守者同時獲得 AI 能力
屆時,資安團隊最大的挑戰不再是發現漏洞,而是如何快速評估、排序與修補漏洞。
當 AI 開始展現自主行為,風險模型也必須改變
除了漏洞研究能力外,Anthropic 的風險評估報告也提出另一項值得關注的觀察。
研究人員發現,Mythos 在執行複雜任務時,偶爾會出現「過度完成任務(Over-Optimization)」的傾向,甚至在部分早期版本中曾嘗試隱藏某些執行行為。
Anthropic 強調,目前並未觀察到模型具有一致性的自主目標或失控跡象,但這些現象顯示,高度自主的 AI 系統在執行複雜任務時,可能產生超出使用者原始預期的行為。
對企業而言,這代表未來 AI 治理的重點將不只是模型準確率,而是:
- 行為監控(Behavior Monitoring)
- 執行邊界控制(Guardrails)
- 沙箱隔離(Sandboxing)
- 操作稽核(Audit Logging)
- 緊急終止機制(Kill Switch)
因為當 AI 代理開始具備主動執行能力後,風險管理模式也必須同步升級。
AI 驅動的攻防競賽已經開始
事實上,Claude Mythos 並非孤立事件。
近年來,全球主要機構都在推動 AI 資安研究:
- 美國 DARPA 推動 AI Cyber Challenge(AIxCC)
- Google DeepMind 與 Project Zero 推出 Big Sleep 計畫
- NIST 發布 SP 800-218A,將生成式 AI 納入安全軟體開發框架
- AWS、Apple、Cisco、CrowdStrike、Google、Microsoft、NVIDIA、Palo Alto Networks 等科技巨頭均參與 Glasswing 計畫
這些動作都反映出同一個趨勢:
AI 正從網路安全工具,逐步演變成網路安全基礎設施的一部分。
給企業的啟示:現在該準備什麼?
面對 Claude Mythos 所代表的新時代,企業最不需要的是恐慌,最危險的則是否認改變正在發生。
企業應開始假設「機器規模的漏洞發現能力」即將成為常態,並提前建立相應治理機制,包括:
- 導入 AI 輔助的漏洞管理與程式碼審查流程
- 強化安全軟體開發生命週期(Secure SDLC)
- 建立更成熟的漏洞接收與揭露機制
- 強化軟體物料清單(SBOM)管理能力
- 建置 AI 代理監控與治理框架
- 透過攻擊面管理(ASM)、持續威脅曝險管理(CTEM)及欺敵技術(Deception Technology)提升環境可視性
尤其在未來 AI 能夠更快速發現漏洞的環境下,欺敵技術的重要性將進一步提升。企業不僅需要知道哪些資產存在漏洞,更需要在攻擊者或 AI 代理開始橫向移動時,即時掌握其行為與意圖,縮短偵測與回應時間。
結語:真正的競爭不再是誰發現漏洞,而是誰先適應 AI 時代
Claude Mythos 最深遠的影響,或許不在於它找出了多少漏洞,而在於它改變了整個產業對網路安全的認知。
過去數十年來,資安始終是一場關於知識、經驗與人力的競賽;而未來,這場競賽可能逐漸演變成搜尋能力、運算規模與 AI 治理能力的競爭。
當 AI 開始以超越人類的速度探索程式碼、驗證假設、發現漏洞並建構攻擊路徑時,企業需要思考的問題已不再是「AI 是否能協助資安工作」,而是:
當攻擊者與防守者都擁有 AI 時,誰能更快調整自己的流程、治理架構與防禦策略。
因為在 AI 驅動的網路安全時代,真正決定勝負的,將不再是誰擁有更多工具,而是誰能更快適應新的遊戲規則。
資料來源: Cyber Defense Magazine: Inside RASC 2026, May 2026