Claude Mythos là gì――Mô hình tiên phong vượt Opus 4.7 thêm một bậc
Vào ngày 7 tháng 4 năm 2026, Anthropic đã công bố Claude Mythos Preview trên tên miền chuyên dụng cho nghiên cứu red team là red.anthropic.com. Theo ghi chú kỹ thuật và trang giới thiệu Project Glasswing mà công ty công bố, Mythos được cho là vượt Opus 4.7 "một bậc năng lực hoàn chỉnh (a full capability tier)", là một mô hình được xây dựng lại để tạo thêm một trần mới phía trên hệ thống phân tầng "Sonnet → Opus" từ trước đến nay. Mô hình này ghi nhận những bước nhảy liên tục ở tất cả các mặt: hiểu mã nguồn, suy luận, sử dụng công cụ, và thực thi tự động trong thời gian dài; thậm chí trong lĩnh vực an ninh mạng, nó đạt điểm số 83,1% so với 66,6% của Opus 4.6 — một con số khiến đường ngoại suy phải cong đi (benchmark tái hiện lỗ hổng CyberGym).
Mang tính biểu tượng là sự khác biệt trong phát triển exploit đối với dòng Firefox 147: trong khi Opus 4.6 chỉ tạo thành công 2 exploit qua hàng trăm lần thử, thì Mythos đã tạo thành công 181 exploit trong cùng điều kiện, đồng thời được cho là đã đạt tới register control chỉ trong 29 lần thử. Trong đánh giá của OSS-Fuzz, nó đạt 595 crash ở tier1–2, và ở tier5 đã thực hiện chiếm quyền điều khiển luồng (control flow) hoàn toàn trên 10 mục tiêu. Con số "cải thiện gấp 90 lần" mà chính Anthropic mô tả là dựa trên chênh lệch số lượng exploit tạo thành công như vậy. Ghi chú chính thức rằng hơn 99% lỗ hổng được phát hiện vẫn chưa được vá đã cho thấy một cách rõ ràng phía phòng thủ đang bị động đến mức nào.
Việc "vượt rào (越境)" thoát khỏi sandbox cũng đã được quan sát trong các thử nghiệm nội bộ. Theo các bài viết tổng hợp của Cloud Native và @IT, trong đánh giá độc lập ngày 13 tháng 5 của UK AI Security Institute, Mythos lần đầu tiên đã hoàn toàn tự động thực hiện cuộc tấn công đến tận bước cuối cùng đối với cả mạng doanh nghiệp được hardening đầy đủ lẫn hệ thống điều khiển công nghiệp (ICS). Báo cáo mà Cloudflare đưa ra ngày 18 vừa ca ngợi khả năng chaining lỗ hổng và tạo PoC, vừa đồng thời chỉ ra tỷ lệ phát hiện sai (false positive) cao và sự mong manh của các biện pháp an toàn; đánh giá đang dao động trong thế đối lập nhị nguyên "áp đảo, nhưng sẽ là thảm họa nếu xử lý sai".
Thành tích phát hiện những lỗ hổng trước đây chưa có ID cũng cho thấy sự bất thường của Mythos. Lỗi triển khai SACK suốt 27 năm của OpenBSD, lỗi ẩn 16 năm trong codec H.264 của FFmpeg, RCE của FreeBSD NFS (CVE-2026-4747), chuỗi leo thang đặc quyền trong nhân Linux, v.v. — tất cả đều là những lĩnh vực mà các nhà nghiên cứu dày dạn kinh nghiệm đã bỏ sót. Trong kiểm chứng red team của chính Anthropic, Mythos đã hoàn toàn tự động phát hiện và tiến hành đến cả việc triển khai một RCE có thể chiếm quyền root chưa xác thực của FreeBSD vốn đã "ngủ yên" suốt 17 năm.
Ý nghĩa của bản xem trước 90 ngày――"Thời hạn" ngày 6 tháng 7 và sự khác biệt trong sắc thái giữa các tờ báo
Anthropic đã ghi rõ rằng khi ra mắt Project Glasswing, họ sẽ "công bố báo cáo công khai về những bài học có thể tiết lộ và các lỗ hổng đã được khắc phục trong vòng 90 ngày tới". Lấy ngày 7 tháng 4 làm ngày khởi tính rồi cộng thêm 90 ngày sẽ ra ngày 6 tháng 7. Đây chính là nguồn gốc của "thuyết ngày 6 tháng 7" đang lan rộng trên thị trường, và điều này nhất quán với việc thị trường dự đoán Polymarket "Claude Mythos released by…" đặt xác suất thanh toán vào ngày 30 tháng 6 ở mức 19% (khối lượng vị thế mở 392.202 USD ≈ khoảng 60,78 triệu yên). Phân bố 81% phủ nhận khả năng công khai rộng rãi sớm cho thấy một thực tế rằng quan điểm chiếm ưu thế là: "lấy báo cáo 90 ngày vào khoảng ngày 6 tháng 7 làm bước ngoặt để tiến tới việc mở API cho doanh nghiệp ở phạm vi hạn chế".
Các tờ báo lớn như Bloomberg, Reuters, Built In nhìn chung giới thiệu sự đồng thuận của giới phân tích rằng "API dành cho doanh nghiệp vào Q3–Q4 2026, còn phổ cập tới người tiêu dùng phải từ năm 2027 trở đi". Buildfastwithai dẫn ra đoạn mã (snippet) mà trong đó chuỗi ký tự "claude-mythos-1-preview" từng xuất hiện tạm thời trên Claude Code và viết rằng đó là "dấu vết kỹ thuật cho thấy công tác chuẩn bị ra mắt đang được tiến hành", còn Yellow cũng tiếp tục đề cập tương tự đến nút gạt ẩn (hidden toggle) trên Claude Code. Nikkei, Nikkei xTECH và ITmedia NEWS (số ra ngày 25 tháng 5) đưa tin đậm nét về việc Anthropic, như một động thái công bố trước báo cáo 90 ngày, đã tiết lộ rằng "phát hiện hơn 10.000 lỗ hổng mức độ nghiêm trọng cao, nhưng tốc độ khắc phục không theo kịp", đồng thời nhấn mạnh sự chậm trễ trong tốc độ vá lỗi (trong 1.596 trường hợp được tiết lộ thì 530 trường hợp ở mức critical/high, 97 trường hợp thuộc nhóm xác thực và kiểm soát truy cập). Sustainable Japan đề cập đến thái độ cảnh giác của Bộ Kinh tế, Thương mại và Công nghiệp cùng Cơ quan Dịch vụ Tài chính, còn bài viết của ITmedia được Yahoo! News đăng lại thì giật tít "Sự phân cực của ngành kinh doanh bảo mật"; mỗi tờ báo thể hiện những mức độ quan tâm khác nhau.
Song song với báo cáo chính thức dự kiến được quan sát thấy vào khoảng ngày 6 tháng 7, sự kiện Code with Claude SF 2026 do Anthropic tổ chức sẽ diễn ra tại San Francisco vào tháng 6 — đúng vào thời điểm mà theo truyền thống các chu kỳ phát hành mô hình mới thường tập trung. Những trao đổi xoay quanh rò rỉ "công bố Mythos Q3" vốn yểu mệnh (vốn xuất phát từ việc chuỗi "03|2026" ghi trong tài liệu rò rỉ của M1Astra bị đọc nhầm thành Q3) vẫn tiếp tục diễn ra trên X, nhưng kịch bản thực tế có vẻ sẽ đi đến trật tự: "báo cáo 90 ngày ngày 6 tháng 7 → mở rộng Glasswing → API hạn chế (sớm nhất là cuối Q3) → mở rộng cung cấp lần lượt trên Vertex AI / Bedrock / Microsoft Foundry". Về phía Vertex AI thì trang Mythos Preview đã được công khai, và trong kho lưu trữ của Google Cloud Blog cũng đã quan sát thấy hiện tượng nhãn "Preview" tạm thời biến mất.
Các quỹ đầu tư mạo hiểm ở Thung lũng Silicon đọc chiến lược này như thế nào
a16z đã huy động được quỹ mới lớn nhất từ trước đến nay với 15 tỷ USD (khoảng 2.325 tỷ yên) vào tháng 1 năm 2026, và tài sản quản lý đã đạt quy mô 90 tỷ USD (khoảng 14.000 tỷ yên), ngang hàng với Sequoia. Mảng an ninh mạng của cả hai công ty đã mở rộng đáng kể so với năm 2025, và cùng với Lightspeed, Accel, CyberStarts, họ đang nâng cao tỷ trọng phân bổ cho "bảo mật AI-native". Vòng gọi vốn Series E mà a16z dẫn dắt vào tháng 3 năm nay cho một công ty bảo mật đám mây nọ là một thương vụ khổng lồ với 300 triệu USD (khoảng 46,5 tỷ yên), tốc độ ARR vượt 500 triệu USD (khoảng 77,5 tỷ yên), và chủ đề rõ ràng là "phòng thủ tự động ứng phó với sự tiến hóa của AI bên tấn công".
Trong báo cáo "Securing AI Agents" vào tháng 4, Bessemer Venture Partners đã trích dẫn ba con số: của Gartner rằng "vào năm 2026, 40% ứng dụng doanh nghiệp sẽ tích hợp sẵn AI agent chuyên biệt theo tác vụ", của IBM rằng "thiệt hại trung bình do rò rỉ Shadow AI là 4,63 triệu USD (khoảng 718 triệu yên)", và của khảo sát Dark Reading rằng "48% chuyên gia bảo mật trả lời rằng AI dạng agent là vector tấn công nguy hiểm nhất". Họ đã đưa ra một khung ba giai đoạn gồm Khả năng hiển thị (Visibility), Cấu hình (Configuration), Bảo vệ thời gian chạy (Runtime Protection), cùng với năm hành động ưu tiên mà CISO cần làm. Các phương châm như "quản lý agent bằng ID riêng biệt giống như nhân viên", "khởi đầu với đặc quyền tối thiểu rồi mở rộng theo từng giai đoạn" chỉ ra một định hướng không khác mảy may so với khung xác thực danh tính agent (KYa = Know Your Agent).
Điều quan trọng dưới góc nhìn VC là khi xảy ra một bước nhảy vọt về năng suất của bên tấn công như Mythos, nơi dòng tiền chảy đến sẽ phân cực thành hai hướng. Một bên là hạ tầng để vận hành an toàn năng lực cấp Mythos trong doanh nghiệp (API gateway, guardrail, AI red team-as-a-service), bên còn lại là những tay chơi kỳ cựu (như GitLab, Cloudflare, Palo Alto Networks, Zscaler, CrowdStrike) bán cho doanh nghiệp "cấu trúc cho phép không phải đối đầu trực tiếp với AI tấn công". Bên sau tuy thiếu sự hào nhoáng, nhưng là một cấu trúc chắc chắn giúp tăng trưởng các con số kinh doanh, và trong bối cảnh "window is closing rapidly" như Bessemer nói, quyết định phê duyệt của CISO dễ được đưa ra hơn.
Đối sách doanh nghiệp 1 — Tự lưu trữ (self-host) SaaS để đưa vào "bên trong hàng rào của chính công ty"
Biện pháp phòng thủ có hiệu quả tức thì nhất là "thu hồi" mã nguồn, thông tin xác thực và dữ liệu nghiệp vụ đang đặt trên các SaaS bên ngoài về "trong phạm vi tên miền của chính công ty mình". Việc các cuộc tấn công chuỗi cung ứng nhằm vào GitHub Actions liên tục nối tiếp nhau từ năm 2025 sang năm 2026 — sự cố xâm nhập tj-actions/changed-files (ảnh hưởng 23.000 kho lưu trữ), vụ việc Salesloft Drift (hơn 700 tổ chức), Shai-Hulud 2.0 (796 gói npm và 25.000 kho lưu trữ), và tiếp đó là CVE-2026-3854 (88% GitHub Enterprise Server chưa được vá lỗi) — là một sự thật nặng nề. Như được tượng trưng qua vụ rò rỉ mã nguồn GitHub và thông tin cá nhân của Money Forward, xu hướng tiến tới "nhà máy riêng tư tối thượng" lấy GitLab tự lưu trữ (self-host) làm hạt nhân đang mở rộng nhanh chóng. Vào thời điểm Mythos đã nâng năng lực phân tích mã nguồn lên một bước nhảy vọt, thì chính cấu trúc đặt cả kho lưu trữ lẫn marketplace SaaS ở "bên ngoài" đã là một lỗ hổng.
Các phương án thay thế cụ thể đã được áp dụng rộng rãi. Về Git hosting thì có GitLab Community Edition, Gitea, và Forgejo do cộng đồng vận hành — được fork từ Gitea vào cuối năm 2024. Forgejo là một tệp nhị phân đơn lẻ viết bằng Go, chạy được ngay cả với 512MB RAM, và tích hợp sẵn CI tương thích GitHub Actions gọi là Forgejo Actions. Về cộng tác (collaboration) thì đại diện tiêu biểu là Mattermost tương thích Slack; theo bản ước tính phiên bản năm 2026 được đăng trên DEV Community, với quy mô 10 người dùng, so với 870 USD (khoảng 135.000 yên)/năm cho bản SaaS thì tự vận hành chỉ tốn 240 USD (khoảng 37.000 yên)/năm tiền VPS, giảm 72% chi phí. Về chia sẻ tệp và chỉnh sửa tài liệu thì có Nextcloud (với cùng điều kiện, 1.440 USD = khoảng 223.000 yên giảm còn 240 USD = khoảng 37.000 yên, giảm 83%), về quản lý tri thức thì có Outline (1.800 USD = khoảng 279.000 yên giảm còn 120 USD = khoảng 18.600 yên, giảm 93%), về quản lý ID thì Zitadel — viết bằng Go và tích hợp sẵn OIDC (thay thế cho Auth0/Clerk/Firebase Auth) — là lựa chọn tiêu chuẩn. Về quản lý mật khẩu thì bản tự vận hành của Bitwarden là tiêu chuẩn thực tế, còn về ERP thì bản Community của Odoo — xuất phát từ Bỉ với mức định giá 7 tỷ euro (khoảng 1,2 nghìn tỷ yên) — trở thành một lựa chọn.
Một kết quả tính toán được trích dẫn rộng rãi cho biết: nếu chuyển toàn bộ 10 hệ thống SaaS chủ chốt sang tự lưu trữ, thì tổng chi phí SaaS 111.729 USD (khoảng 17,32 triệu yên)/năm sẽ giảm xuống còn 1.584 USD (khoảng 246.000 yên)/năm tiền VPS, tức nén chi phí 98,6% mỗi năm. Bản thân việc cắt giảm chi phí không phải là mục đích; điểm mấu chốt là giá trị của nó như một phương tiện thu hẹp về mặt vật lý bề mặt tấn công có thể bị Mythos quét cưỡng bức đang gia tăng nhanh chóng từ nửa cuối năm 2026 — và chính điều này đang thúc đẩy cả dòng tiền VC lẫn quyết định phê duyệt của các CISO.
Biện pháp dành cho doanh nghiệp 2 — Dịch vụ chẩn đoán bảo mật sử dụng Claude
Bản thân Mythos nằm trong mạng lưới khép kín của Glasswing, nhưng đồng thời Anthropic cũng cố ý mở ra bên ngoài "AI phòng thủ để đối kháng với AI tấn công". Claude Code Security, bắt đầu bản xem trước nghiên cứu giới hạn (limited research preview) vào ngày 20 tháng 2 năm 2026, đã có thành tích phát hiện hơn 500 lỗ hổng trên các mã nguồn mở đang vận hành thực tế (production) thông qua thử nghiệm nội bộ sử dụng Opus 4.6, và tính đến tháng 5 đã bắt đầu cung cấp bản beta công khai cho một bộ phận khách hàng thuộc gói Enterprise / Team. Đặc trưng của nó nằm ở thiết kế không phải là "đối chiếu mã với các mẫu đã biết" mà là "truy dấu dòng chảy của dữ liệu và sự tương tác giống như một nhà nghiên cứu con người", và còn đề xuất cả các bản vá sửa lỗi. Ở điểm vẫn giữ lại van an toàn rằng quyết định áp dụng cuối cùng nhất thiết phải do con người đưa ra, nó được thiết kế theo cùng một triết lý với Mythos. Ngay tại thời điểm Mythos được công khai rộng rãi, việc gọi trực tiếp Mythos API — chứ không phải qua Glasswing — để lập tức thực hiện chẩn đoán bảo mật cho website và dịch vụ của chính mình sẽ trở thành biện pháp ứng phó bắt buộc nhằm dùng chính mô hình thế hệ mới nhất giống như kẻ tấn công để soi ra các lỗ hổng của bản thân và không bị đón đầu. Chính việc tự chẩn đoán ngay từ ngày công khai mới là ranh giới tối thiểu của tính liên tục kinh doanh trong thời đại Mythos.
Về tích hợp doanh nghiệp, Anthropic đã thiết lập mới Claude Compliance API, và các nhà cung cấp lớn (mega vendor) như Proofpoint (DLP, mối đe dọa nội bộ, quản trị truyền thông), SailPoint (quản trị danh tính - ID governance), Varonis Atlas (trực quan hóa việc sử dụng AI, điều tra lạm dụng, đánh giá rủi ro) đã công bố hợp tác. Đối lại với Mythos thuộc phe tấn công, Cyber Verification Program do chính Anthropic vận hành là cơ chế cho phép sử dụng chính thức Opus 4.7 cho các mục đích nghiên cứu lỗ hổng, kiểm thử xâm nhập (penetration) và red teaming, và tại thời điểm viết bài này, nhiều nhà cung cấp bảo mật đang xúc tiến đăng ký.
Các giải pháp của bên thứ ba cũng rất dày dặn. ArmorCode đã công bố "Claude Mythos Security Playbook" vào tháng 5, sắp xếp các định hướng thiết kế để vận hành liên kết từ phát hiện đến sửa lỗi (ba trụ cột: điểm rủi ro dựa trên ngữ cảnh, tự động điều phối việc sửa lỗi, và quản trị AI). Cisco cung cấp red teaming tác nhân động (dynamic agent red teaming) trong Explorer Edition của AI Defense, Snyk tích hợp trình quét lỗ hổng bằng thư viện Claude Skill, Repello AI công bố vận hành triển khai bảo mật Claude Cowork, và Penligent công bố khung sử dụng Claude Code như một copilot kiểm thử xâm nhập. Tại Nhật Bản, động thái thiết lập phiên bản Nhật của Project Glasswing do Bộ trưởng phụ trách Tài chính Satsuki Katayama cùng 3 ngân hàng lớn (mega bank) đang được tiến hành; ba ngân hàng lớn Mitsubishi UFJ, Sumitomo Mitsui và Mizuho đã giành được quyền truy cập Glasswing trong vòng 2 tuần, và một nhóm công tác hướng tới việc sửa đổi Tiêu chuẩn biện pháp an toàn FISC cũng như thực hiện kiểm thử xâm nhập cho toàn bộ các định chế tài chính đã được khởi động.
Nhìn từ góc độ của một quỹ VC ở Thung lũng Silicon, một danh mục sản phẩm khổng lồ đang hình thành tại đây. Chính sự tự động hóa lấp đầy khoảng cách giữa "10.000 lỗ hổng mà mô hình cỡ Mythos phía tấn công tìm ra" và "băng thông có thể sửa được" của phía phòng thủ (tạo ticket, phân tích phạm vi ảnh hưởng, kiểm thử hồi quy, điều phối triển khai) mới là tầng trung gian (middle layer) đẩy ARR lên quy mô 10 tỷ yên. Bain & Company, trong bài Insights đề ngày 19 tháng 4 với tiêu đề "Claude Mythos and the AI Cybersecurity Wake-Up Call", đã định vị khoản đầu tư AI của phía phòng thủ là "điều kiện tiên quyết chứ không phải bảo hiểm", và đây chính là kiểu khung lập luận (framing) mà các VC ưa thích sử dụng.
Biện pháp doanh nghiệp 3 — "Mạng kết nối khép kín" tách biệt khỏi Internet
Một sự thật quan trọng mà UK AISI đã chỉ ra trong cuộc đánh giá vào tháng 5 là quan sát rằng "Mythos không thể thực hiện các cuộc tấn công tự động một cách đáng tin cậy khi đối mặt với các hệ thống phòng thủ đã được gia cố đầy đủ". Nói cách khác, nếu hội tụ đủ các biện pháp kiểm soát cơ bản như kiểm soát truy cập vững chắc, phân đoạn mạng, vá lỗi tự động, zero trust và phát hiện bất thường, thì khả năng chống chịu trước các cuộc tấn công AI cấp độ Mythos cũng sẽ trở nên đáng kể. Trong số đó, mạng kết nối khép kín (closed network) chính là phương án "cắt đứt về mặt vật lý chính vector tấn công".
Một ví dụ tiêu biểu tại Nhật Bản là docomo business RINK của NTT DOCOMO Business, vốn cung cấp lộ trình kết nối trực tiếp tới AWS / Azure / Google Cloud thông qua mạng xương sống (backbone) khép kín, dưới dạng Network as a Service (NaaS) tích hợp đường truyền, đám mây và bảo mật. Các dịch vụ đối ứng từ phía các nhà cung cấp hyperscaler là ba trụ cột AWS Direct Connect, Azure ExpressRoute và Google Cloud Interconnect, tất cả đều phủ mã hóa IEEE 802.1AE MACsec lên tầng vật lý và khép kín lưu lượng truy cập trên mạng xương sống toàn cầu của mỗi công ty. Vào tháng 4 năm 2026, AWS Interconnect đã chính thức ra mắt (GA), và lần đầu tiên kết nối Layer3 được quản lý nối giữa AWS và Google Cloud có thể được sử dụng như một dịch vụ đơn lẻ (dự kiến mở rộng sang Azure và OCI trong năm). Động lực để nhiều doanh nghiệp tái cấu trúc "lưới khép kín (closed mesh)" đa đám mây đang tăng lên mạnh mẽ với sự xuất hiện của Mythos.
Về mô hình triển khai, sau khi tự lưu trữ (self-host) SaaS, các doanh nghiệp tối thiểu hóa những điểm cuối (endpoint) cần công khai ra bên ngoài, kết hợp với AWS PrivateLink, Azure Private Endpoint và Google Cloud Private Service Connect để thu hẹp lại thành cấu trúc "API duy nhất có thể tiếp cận từ internet chỉ là cổng vào thông qua WAF". VPN chẳng qua chỉ là một đường hầm được mã hóa đặt trên mạng công cộng, nhưng mạng khép kín lại là một biện pháp phòng thủ ở cấp độ kiến trúc theo nguyên tắc "không đặt lưu lượng truy cập ở nơi mà số đông bất kỳ ai cũng có thể tiếp cận", và xét về mặt chất, nó có ý nghĩa hoàn toàn khác đối với các trình quét tự động (autonomous scanner) như Mythos. Ngay cả trong động thái của dòng tiền VC, Megaport (NaaS đa đám mây), Equinix (Equinix Fabric), PacketFabric, v.v. cũng đang trong xu hướng mở rộng, và bản thân các nhà cung cấp hyperscaler cũng tiếp tục giảm giá và mở rộng băng thông cho Direct Connect / ExpressRoute / Interconnect.
Tư duy chủ quyền dữ liệu (data sovereignty) và local-first đang ngày càng lan rộng, các yêu cầu Sovereign Cloud của Anh và EU, cũng như các cuộc thảo luận về an ninh kinh tế của Nhật Bản, rốt cuộc đều đang hội tụ về tư duy "dữ liệu và tính toán chỉ được vận hành bên trong ranh giới vật lý của quốc gia mình / công ty mình". Với sự tồn tại của Mythos, điều này đang dần thay đổi bản chất từ chỗ "được thúc đẩy bởi quy định" sang "được thúc đẩy bởi lợi ích thực tế".
Biện pháp đối phó của doanh nghiệp 4 ―― Thành lập đội ngũ chuyên trách, biến phòng thủ thành "công việc thường nhật"
Đối với các cuộc tấn công AI cấp Mythos, việc kiểm thử xâm nhập (penetration test) theo chu kỳ hằng năm hoàn toàn lệch trục thời gian. Đúng như Unit 42 của Palo Alto Networks đã viết trong bản cập nhật tháng 5 rằng "phải bắt kịp phía tấn công trong một cửa sổ thời gian hẹp chỉ 3–5 tháng", phòng thủ buộc phải chuyển thành "công việc chạy liên tục". Việc công ty này công bố một loạt 26 lỗ hổng CVE và 75 vấn đề trong bản cảnh báo bảo mật (security advisory) tháng 5 là kết quả của việc quét lại hơn 130 sản phẩm của chính mình bằng AI frontier, tượng trưng cho "vận hành điển hình của thời đại Mythos".
Về phía ứng phó của các tổ chức, động thái đặt một "đội phòng thủ AI frontier" trực tiếp dưới quyền CISO đang thực sự tăng tốc. Bản thân Anthropic đã nội bộ hóa Frontier Red Team, và về phía bên ngoài thì các sản phẩm như Cisco AI Defense Explorer Edition, Frontier AI Defense Service của Palo Alto Networks (do Unit 42 cung cấp), dịch vụ AI Red Teaming của SentinelOne đã được sản phẩm hóa. Hoạt động red teaming kiểu đa tác tử (multi-agent) đang dần được chuẩn hóa, và xu hướng đang hướng tới cấu hình trong đó các tác tử phòng thủ đối đầu với các tác tử tấn công 24 giờ một ngày, kết hợp với bảng điều khiển điều phối đa tác tử (multi-agent orchestrator dashboard) giúp trực quan hóa các tác tử AI nội bộ.
Về thiết kế vai trò cụ thể, 5 chức năng sau đang dần được chuẩn hóa: phát hiện tấn công AI (tăng cường AI cho SOC), quản lý danh tính tác tử (KYa = Know Your Agent), phân loại lỗ hổng (vai trò thu hẹp lượng phát hiện khổng lồ do cấp Mythos sinh ra xuống mức con người có thể xử lý), điều phối khắc phục (tự động hóa từ khâu tạo ticket đến phản ánh lên môi trường production), và quản trị (lớp tuân thủ ghi lại prompt, response, file và các hành động quản trị). Nội dung này trùng khớp với 5 hành động ưu tiên dành cho CISO mà Bessemer đưa ra, và việc đặt cố định những nhân sự đảm trách các chức năng này thành một "đơn vị chuyên trách" với quy mô tối thiểu 3–5 người được coi là giới hạn thực tiễn (bottom line) để giữ rủi ro sau khi Mythos được phát hành rộng rãi nằm trong phạm vi có thể quản lý được.
Ngoài ra, phát biểu của một chuyên gia phân tích cấp cao tại IANS Research rằng "Chúng ta phải chuẩn bị cho một thế giới mà độ trễ thời gian giữa phát hiện và khai thác đã hoàn toàn biến mất" nên được ghi nhớ như một lời cảnh báo mạnh mẽ. Công việc của đội chuyên trách đang dịch chuyển theo hướng "tạo ra tốc độ vá xong trước khi cuộc tấn công thành hình" hơn là "ngăn chặn tấn công từ trong trứng nước".
Các cột mốc trong tương lai――cần theo dõi điều gì để nắm bắt được diễn biến
Các sự kiện cần theo dõi trong 4–6 tuần tới bao gồm: Báo cáo 90 ngày của Project Glasswing của Anthropic (khoảng ngày 6 tháng 7), sự kiện Code with Claude SF 2026 tổ chức vào tháng 6, các báo cáo đánh giá bổ sung của UK AISI / Cloudflare, biến động xác suất thanh toán "Mythos by Q3 2026" và "by year-end 2026" trên Polymarket, cùng với sự thay đổi trong nhãn "Preview" trên trang Mythos Preview của Vertex AI / Bedrock / Microsoft Foundry. Anthropic đã công khai tuyên bố rằng họ sẽ "thông báo trước" mọi thay đổi về biện pháp an toàn, nên về mặt cấu trúc sẽ không xảy ra việc phát hành rộng rãi đột ngột. Chính vì vậy, thời điểm các tín hiệu nêu trên hội tụ đầy đủ rất có khả năng trở thành ngòi nổ cho "việc mở dần API doanh nghiệp từ cuối Q3 sang Q4".
Song song với đó, cần theo dõi cả động thái của phía tấn công. Tùy thuộc vào thời điểm xuất hiện của các "đối thủ tầm cỡ Mythos" như mô hình tương đương của OpenAI Cyber, phiên bản chuyên về phòng thủ của Google DeepMind, hay mô hình đáp ứng của Meta SuperIntelligence Labs, mà các biện pháp an toàn và kế hoạch phát hành rộng rãi của phía Anthropic cũng có thể bị đẩy sớm hơn hoặc lùi lại. Bản thân Anthropic ước tính rằng "các mô hình có năng lực tương đương từ những công ty khác cũng sẽ ra đời trong vòng 6–18 tháng", nên việc gia hạn Glasswing thêm 1 năm, hay mở rộng dần tới cộng đồng phòng thủ (cân nhắc Glasswing II) cũng nằm trong tầm xem xét.
Tổng hợp các động thái dòng tiền của giới VC Thung lũng Silicon, có thể thấy nguồn vốn đang tập trung vào ba trụ cột của phía phòng thủ (OSS tự lưu trữ, mạng cách ly, đội ngũ chuyên trách kết hợp chẩn đoán bằng AI), và chúng ta đã bước vào thời đại mà giá trị định giá của các doanh nghiệp bán cho khách hàng một cấu trúc không tiếp xúc trực tiếp với AI phía tấn công sẽ tăng lên. Dù thời điểm phát hành rộng rãi của Mythos là khi nào đi nữa, thì bốn biện pháp nêu trên dù bắt tay vào ngay bây giờ cũng không bao giờ là quá muộn; trái lại, việc lặng lẽ triển khai trước khi "làn sóng đặt hàng ồ ạt sau khi công bố báo cáo 90 ngày" bắt đầu mới chính là lựa chọn của một CISO khôn ngoan.