Mythos: Mô hình AI làm rung chuyển thế giới an ninh mạng

CEO kiêm đồng sáng lập Anthropic Dario Amodei phát biểu tại Diễn đàn Kinh tế Thế giới ở Davos, Thụy Sĩ, ngày 20-1-2026. (Ảnh Reuters).JPG

Tháng 4/2026, thế giới an ninh mạng chứng kiến một khoảnh khắc hiếm gặp: công ty Anthropic tung ra mô hình mới Mythos nhưng không dám phát hành đại trà. Điều khiến Mythos gây chấn động không phải vì nó nói chuyện hay hơn một chatbot thông thường, mà vì Anthropic tuyên bố mô hình này có thể tìm và khai thác lỗ hổng phần mềm ở quy mô mà trước đây chỉ những chuyên gia hàng đầu mới có thể tiếp cận.

Nói cách khác, đây không còn là câu chuyện AI biết viết mã hay hỗ trợ lập trình, mà là câu chuyện AI tham gia trực tiếp vào công đoạn nhạy cảm nhất của an ninh mạng: phát hiện điểm yếu trước khi con người kịp nhìn ra, rồi biến điểm yếu đó thành đường tấn công có thể sử dụng được. Chính vì vậy, ngay từ ngày công bố 7/4, Anthropic đã đặt Mythos trong khuôn khổ truy cập hạn chế thay vì đưa ra thị trường đại trà.

Điểm đáng chú ý nhất là Mythos không chỉ mạnh trên lý thuyết. Anthropic công bố mô hình đã tìm ra hàng nghìn lỗ hổng nghiêm trọng, trong đó có một lỗi 27 năm tuổi trên OpenBSD, một lỗ hổng 16 năm tuổi trong FFmpeg và một lỗ hổng 17 năm tuổi trên FreeBSD. Công ty còn nói hơn 99% số lỗ hổng mà họ tìm thấy khi đó vẫn chưa được vá, nên không thể công khai chi tiết. Nếu các số liệu này đứng vững sau quá trình rà soát và công bố có trách nhiệm, điều đó cho thấy năng lực của AI đã bắt đầu chạm tới một vùng rất nhạy cảm: tìm ra những lỗi nằm quá sâu trong mã nguồn, tồn tại quá lâu trong hệ thống, và từng vượt qua nhiều lớp kiểm thử tự động cũng như nhiều vòng rà soát của con người. Câu chuyện vì vậy không còn là “AI nhanh hơn người”, mà là “AI đang thay đổi bản chất của nghề săn lỗi”.

Logo Anthropic hiển thị trên màn hình điện thoại tại Creteil, Pháp, ngày 21-4-2026. (Ảnh AFP).jpg

Để hiểu vì sao ngành bảo mật lo ngại, có thể hình dung an ninh mạng lâu nay dựa trên một loại nút thắt cổ chai rất con người: thời gian, chuyên môn và chi phí. Một lỗ hổng nghiêm trọng thường đòi hỏi nhiều giờ hoặc nhiều ngày để phân tích, tái hiện rồi mới viết được khai thác. Với Mythos, nút thắt đó bị nới lỏng đột ngột. AISI của Anh cho biết Mythos là mô hình đầu tiên hoàn tất trọn vẹn một bài mô phỏng tấn công mạng doanh nghiệp gồm 32 bước trong 3/10 lần thử, với kết quả trung bình 22/32 bước. Ở các bài kiểm tra CTF cấp chuyên gia, mô hình đạt 73% thành công. Cần nhấn mạnh, AISI không nói Mythos đã đủ sức phá mọi hệ thống phòng thủ mạnh ngoài đời thật. Nhưng chỉ riêng việc AI đi được xa như vậy trong một chuỗi tác vụ dài đã là tín hiệu cho thấy cửa sổ giữa phát hiện và khai thác lỗ hổng sẽ ngắn đi rất nhanh.

Điểm này đã được minh họa rõ trong thực tế. Mozilla cho biết bản phát hành Firefox 150 đã vá 271 lỗ hổng được phát hiện nhờ một phiên bản sớm của Mythos. Trước đó, khi hợp tác với Anthropic bằng thế hệ mô hình trước, Firefox 148 mới vá 22 lỗi nhạy cảm. Con số 271 không tự động có nghĩa rằng internet ngay lập tức trở nên nguy hiểm hơn 271 lần. Nhưng nó cho thấy một điều thiết thực hơn nhiều: năng lực rà quét của AI có thể đẩy các đội bảo mật vào một giai đoạn dọn dẹp quy mô lớn, nơi hàng loạt lỗi tiềm ẩn bị lôi ra cùng lúc. Như vậy, thời đại sắp tới có thể không phải là thời đại “hacker AI toàn thắng”, mà là thời đại mọi đội ngũ phần mềm buộc phải chạy một cuộc tổng kiểm tra sâu hơn, nhanh hơn và tốn nguồn lực hơn rất nhiều.

Mythos: Mô hình AI làm rung chuyển thế giới an ninh mạng - Ảnh 2.

Tất nhiên, Mythos không chỉ là chiếc kính lúp cho người phòng thủ. Bản chất lưỡng dụng của công nghệ này mới là điều khiến giới quản lý lo ngại. Anthropic thừa nhận mô hình có thể xác định và khai thác zero-day trên các hệ điều hành và trình duyệt lớn khi được yêu cầu. Báo cáo kỹ thuật của hãng cũng nêu rằng, ngay cả người không có đào tạo bài bản về bảo mật, nếu dùng đúng công cụ bao quanh, cũng có thể để Mythos tìm lỗ hổng rồi dựng khai thác tự động. Đây là điểm làm thay đổi toàn bộ cán cân an ninh mạng: khi tri thức tấn công được đóng gói vào mô hình, rào cản gia nhập của phía tấn công sẽ thấp hơn, trong khi áp lực lên bên phòng thủ tăng mạnh. Nói gọn hơn, AI đang biến săn lỗi từ một nghề thủ công đắt đỏ thành một quy trình có thể nhân bản ở quy mô máy móc.

Chính vì thế, Anthropic không phát hành Mythos theo cách của một sản phẩm tiêu dùng thông thường. Hãng dựng Project Glasswing, quy tụ các đối tác như Amazon Web Services, Apple, Google, Microsoft, NVIDIA, JPMorganChase, Linux Foundation và Palo Alto Networks, đồng thời mở rộng thêm cho hơn 40 tổ chức xây dựng hoặc duy trì hạ tầng phần mềm quan trọng. Anthropic cam kết tới 100 triệu USD tín dụng sử dụng cho Mythos và 4 triệu USD hỗ trợ trực tiếp cho các tổ chức an ninh nguồn mở. Về mặt lý thuyết, đây là nỗ lực đẩy năng lực phòng thủ đi trước năng lực tấn công. Nhưng mặt kia của câu chuyện cũng rất rõ: một công cụ có thể ảnh hưởng tới an ninh của phần mềm toàn cầu giờ nằm trong tay một phòng thí nghiệm tư nhân và một nhóm đối tác được chọn lọc. Tranh luận từ đây không chỉ là “AI nguy hiểm đến đâu”, mà còn là “ai được quyền dùng nó và ai giám sát việc đó”.

Mythos: Mô hình AI làm rung chuyển thế giới an ninh mạng - Ảnh 3.

Thị trường cũng phản ứng rất nhanh. Reuters cho biết cổ phiếu phần mềm Mỹ đã giảm sau khi Mythos được công bố ngày 7/4, còn Financial Times ghi nhận nhóm cổ phiếu an ninh mạng chịu áp lực vì nhà đầu tư bắt đầu tính đến khả năng AI có thể làm thay đổi mô hình kinh doanh bảo mật truyền thống. Ở đây có một nghịch lý đáng chú ý. Khi một mô hình AI giúp tìm lỗ hổng hiệu quả hơn, nhu cầu an ninh mạng không giảm đi. Ngược lại, nhu cầu có thể còn tăng mạnh hơn, nhưng nó sẽ chuyển từ những sản phẩm bảo vệ kiểu cũ sang các năng lực mới như rà quét bằng AI, tự động hóa vá lỗi, đánh giá chuỗi cung ứng phần mềm, giám sát hành vi bất thường và phản ứng nhanh theo thời gian thực.

Dù vậy, sự tỉnh táo vẫn rất cần thiết. Báo cáo rủi ro của Anthropic không mô tả Mythos như một “siêu AI phản loạn”, mà kết luận rủi ro tổng thể đang ở mức rất thấp, dù cao hơn các mô hình trước. Hãng nói các phiên bản sớm đôi khi có hành vi quá mức để hoàn thành nhiệm vụ, và trong vài trường hợp hiếm có dấu hiệu che giấu hành động đó. Bloomberg cũng đưa tin một nhóm người dùng trái phép đã truy cập được Mythos, còn WSJ cho biết Nhà Trắng phản đối việc Anthropic mở rộng truy cập lên khoảng 120 tổ chức vì lo ngại an ninh quốc gia. Chính những dữ kiện này cho thấy câu chuyện quan trọng nhất không nằm ở các chi tiết giật gân, mà ở một bài toán khó hơn nhiều: làm sao quản trị được một công cụ mà cả việc giữ kín lẫn việc mở rộng đều có rủi ro.

Vì thế, điều Mythos thật sự làm rung chuyển không phải là một hệ thống đơn lẻ, mà là cách cả thế giới nghĩ về an ninh mạng. Trong nhiều năm, các doanh nghiệp tin rằng chỉ cần tăng ngân sách bảo mật, thuê đủ chuyên gia và vá lỗi đều đặn là có thể giữ thế cân bằng. Mythos cho thấy thế cân bằng đó đang đổi khác. Khi AI có thể tìm lỗi ở quy mô công nghiệp, phần thắng sẽ thuộc về bên nào có kỷ luật cập nhật tốt hơn, kiểm soát truy cập chặt hơn, ghi log đầy đủ hơn và biến an ninh mạng thành vấn đề của hội đồng quản trị chứ không chỉ của phòng kỹ thuật. Đó cũng là điều chính phủ Anh và AISI cùng nhấn mạnh: trong kỷ nguyên mới, những nguyên tắc cơ bản như vá cập nhật, cấu hình an toàn, phân quyền hợp lý và giám sát liên tục không hề cũ đi, chúng trở nên quan trọng hơn bao giờ hết. Hôm nay là Mythos. Ngày mai sẽ là những mô hình còn mạnh hơn. Và từ thời điểm này, câu hỏi không còn là AI có bước vào chiến trường an ninh mạng hay chưa, mà là các tổ chức đã kịp thay đổi để sống trong chiến trường đó hay chưa.