RSI (Cải thiện bản thân đệ quy) sử dụng Mythos do đồng sáng lập OpenAI Karpathy dẫn đầu. Sự vượt trội độc tôn và nỗi khổ của Anthropic

Andrej Karpathy, đồng sáng lập OpenAI và chuyên gia hàng đầu về giáo dục AI, đã bất ngờ chuyển sang Anthropic vào ngày 19 tháng 5 năm 2026, dẫn đầu một nhóm với nhiệm vụ "sử dụng Claude để tăng tốc quá trình tiền huấn luyện chính Claude". Đây là một động thái nhân sự đặt ông vào trung tâm của "RSI = Cải tiến Bản thân Đệ quy (Recursive Self-Improvement)" — nơi AI tạo ra chính AI. Thế nhưng vào đầu tháng 6, chính công ty này đã công bố một bài luận xác định RSI là rủi ro lớn nhất, đồng thời kêu gọi thế giới thực hiện "tạm dừng có phối hợp" trong việc phát triển AI tiên tiến. Đạp chân ga mạnh hơn bất kỳ ai, trong khi tự tay phân phát bản thiết kế cho hệ thống phanh — nhưng đây không phải là mâu thuẫn. Chính vì đạp ga mạnh hơn bất kỳ ai

RSI (Cải thiện bản thân đệ quy) là gì — Trước tiên hãy nhìn vào bức tranh tổng thể

RSI (Recursive Self-Improvement / Cải tiến bản thân đệ quy) là quá trình mà, nói một cách đơn giản nhất, "AI cải thiện năng lực của chính mình với rất ít sự can thiệp của con người, rồi dùng năng lực đã được cải thiện đó để tiếp tục cải thiện bản thân". Một AI thông minh hơn một bậc sẽ tạo ra AI thông minh hơn nữa. AI đó lại tạo ra AI thông minh hơn nữa. Khi vòng lặp lồng nhau (đệ quy) này bắt đầu quay, tốc độ cải tiến tự nó sẽ tăng tốc, và có thể đạt đến điểm vượt xa trí tuệ con người trong một thời gian ngắn — khái niệm này được nhà toán học I. J. Good lần đầu tiên định thức hóa vào năm 1965 dưới tên "bùng nổ trí tuệ (intelligence explosion)", và trong hơn nửa thế kỷ vẫn chỉ tồn tại trong phạm vi thí nghiệm tư duy.

Thế rồi từ năm 2025 đến 2026, nó đã bước ngay từ triết học suy đoán xuống nghiên cứu công nghệ thực tiễn. Minh chứng tiêu biểu là hội nghị quốc tế hàng đầu về học máy ICLR tổ chức vào tháng 4 năm 2026 tại Rio de Janeiro đã mở hội thảo quốc tế đầu tiên chuyên về RSI. Chính việc các nhà nghiên cứu bắt đầu nghiêm túc thảo luận về các nguyên tắc chung và phương pháp đánh giá cho "các hệ thống AI tự cải tiến" đã nói lên sự thay đổi của thời đại.

Để không dừng lại ở lý luận trừu tượng, hãy nêu một ví dụ cụ thể. Theo dữ liệu mà Anthropic công bố, vào cuối năm 2025, code do Claude viết ra còn hơi kém hơn code do các kỹ sư của công ty viết, nhưng đến giữa năm 2026, chất lượng đã gần như tương đương. Hơn 80% code được merge vào codebase của công ty hiện đã do Claude viết, và trong quý 2 năm 2026, lượng code một kỹ sư thông thường merge trong một ngày đã tăng khoảng 8 lần so với năm 2024. AI sản xuất code nhanh và nhiều đến mức người ta còn báo cáo rằng "việc review code của con người đã trở thành nút thắt cổ chai mới". Nói cách khác, RSI không phải là khoa học viễn tưởng của tương lai xa xôi, mà là thực tế đã và đang vận hành một phần bên trong các công ty AI.

Người đàn ông đã trình diễn "tự nghiên cứu" — Andrej Karpathy là ai

Người đứng ở tiền tuyến của RSI này chính là Andrej Karpathy. Sự nghiệp của ông là hình thu nhỏ của kỷ nguyên học sâu (deep learning). Ông khởi đầu với tư cách là một trong những thành viên sáng lập của OpenAI, chuyển sang Tesla vào năm 2017 để dẫn dắt bộ phận AI về xe tự lái (Full Self-Driving và Autopilot), rời Tesla vào năm 2022, một lần quay lại OpenAI vào năm 2023, rồi đến năm 2024 độc lập sáng lập startup giáo dục AI Eureka Labs. Ông được mệnh danh là "nhà giáo dục xuất sắc nhất thế giới" vì thông qua các khóa học trực tuyến và video giải thích trên YouTube, ông đã truyền đạt nền tảng về LLM cho các kỹ sư trên toàn thế giới bằng cách giải thích cơ chế mạng nơ-ron phức tạp một cách dễ hiểu hơn bất kỳ ai. Ông là một nhân vật hiếm có — người vừa đứng ở đỉnh cao với tư cách nhà nghiên cứu, vừa là nhà giáo dục.

Thí nghiệm mà Karpathy đó đã trình bày trên mạng xã hội cá nhân vào tháng 3 năm 2026 đã khiến RSI trở nên dễ hiểu ngay cả với người bình thường. Ông giao cho dự án học tập nhỏ tự xây dựng của mình có tên "nanochat" một agent lập trình AI và một mô hình ngôn ngữ nhỏ, rồi để chúng chạy gần như không giám sát trong khoảng hai ngày. Agent liên tục tự thay đổi và thử nghiệm mã học tập (công thức huấn luyện), thực hiện khoảng 700 lần thay đổi tự chủ. Kết quả là nó tích lũy khoảng 20 "cải tiến tự phát hiện" bao gồm điều chỉnh hệ số chuẩn hóa, tinh chỉnh tham số cơ chế attention, thay đổi cài đặt thuật toán tối ưu hóa, và rút ngắn thời gian học từ 2,02 giờ xuống còn 1,80 giờ, tức khoảng 11%. Hơn nữa, nhiều cải tiến trong số đó có thể trực tiếp chuyển đổi từ mô hình nhỏ (sâu 12 lớp) sang mô hình lớn hơn (sâu 24 lớp).

Tiền huấn luyện (pre-training) là quy trình mà các công ty AI đầu tư số vốn lớn nhất, và dù chỉ là cải thiện hiệu quả nhỏ, tác động sẽ phình to theo kiểu quả cầu tuyết khi quy mô tăng lên. Bản thân Karpathy đánh giá thí nghiệm này là "một phần là code, một phần là khoa học viễn tưởng, và một chút điên rồ (part code, part sci-fi, and a pinch of psychosis)", và mô tả nó như là "trận boss cuối (final boss battle)" đối với các phòng thí nghiệm AI tiên phong. AI tự tối ưu hóa chính cách tạo ra nó — nhà giáo dục xuất sắc nhất thế giới đã thực diễn một phiên bản thu nhỏ của RSI ngay tại thí nghiệm tại nhà của mình.

Chuyển nhượng chớp nhoáng — Karpathy gia nhập nhóm "Tiền huấn luyện" của Anthropic

Khoảng hai tháng sau thí nghiệm đó, vào ngày 19 tháng 5 năm 2026, Karpathy đã gây chấn động ngành khi đăng lên mạng xã hội: "Thông báo cá nhân: Tôi đã gia nhập Anthropic." Theo lời ông, "Tôi nghĩ vài năm tới sẽ là giai đoạn đặc biệt mang tính quyết định đối với những tiến bộ tiên phong của LLM. Tôi vô cùng hứng khởi khi được tham gia cùng đội ngũ ở đây và quay lại với nghiên cứu và phát triển (R&D)." Ông cũng nói thêm rằng "niềm đam mê giáo dục của tôi không thay đổi, và tôi có kế hoạch quay lại với công việc đó vào một lúc nào đó."

Theo các báo cáo của TechCrunch và CNBC, Karpathy gia nhập nhóm tiền huấn luyện của Anthropic do Nick Joseph dẫn dắt, và sẽ "thành lập một nhóm tập trung vào việc tăng tốc nghiên cứu tiền huấn luyện bằng Claude." Nhóm tiền huấn luyện là bộ phận chịu trách nhiệm cho những chu kỳ huấn luyện khổng lồ — nơi truyền tải kiến thức và năng lực cốt lõi cho Claude. Nói cách khác, nhiệm vụ của ông là vận hành "autoresearch (tự nghiên cứu)" mà ông đã thử nghiệm tại nhà vào tháng 3 — nhưng lần này ở quy mô công nghiệp, sử dụng các mô hình tiên phong đỉnh cao nhất thế giới — tức là để Claude cải tiến cách tạo ra Claude tiếp theo, chính là RSI (Recursive Self-Improvement) đó. Các điều khoản về thù lao và cổ phần tại Anthropic chưa được tiết lộ.

Ý nghĩa biểu tượng của sự chuyển dịch này mang tính kép. Thứ nhất, đây là một sự kiện lớn trong cuộc chiến nhân tài: một thành viên sáng lập của OpenAI chuyển sang đối thủ lớn nhất là Anthropic, và cụ thể là sang mảng tiền huấn luyện — nền tảng cốt lõi của mô hình. Thứ hai là thực tế rằng chính Karpathy lại thuộc trường phái thận trọng, cho rằng "AGI vẫn còn cách 10 năm nữa." Trong podcast của Dwarkesh Patel vào tháng 10 năm 2025, ông phát biểu rằng đây không phải là "năm của các tác nhân" mà là "thập kỷ của các tác nhân," thẳng thắn gọi code do các mô hình hiện tại tạo ra là "slop (hàng kém chất lượng)," và bày tỏ trực giác mạnh mẽ rằng "xu hướng dài hạn tăng trưởng kinh tế khoảng 2% mỗi năm sẽ không thay đổi." Đây là một tiếng nói thực tế, có chân đứng vững vàng, đối lập với những luận điểm AGI cận tương lai đang sục sôi. Trớ trêu thay, chính con người thận trọng đó lại được giao vai trò quay tay khởi động chiếc động cơ RSI mang tính tăng tốc nhất.

Mythos là gì — "Mô hình tiên phong mạnh nhất" không được công bố

"Mythos" trong tiêu đề bài viết là một mô hình tiên tiến chưa được công bố rộng rãi mà Anthropic gọi là "Claude Mythos Preview". Đây là một mô hình đa năng được cho là đã đạt đến trình độ vượt trội so với con người — ngoại trừ một số ít những chuyên gia hàng đầu — đặc biệt trong khả năng phát hiện và khai thác lỗ hổng phần mềm. Mythos được báo cáo đã tìm thấy hàng nghìn lỗ hổng nghiêm trọng, và phát hiện ra các điểm yếu chưa được biết đến trong hầu hết các hệ điều hành chính và trình duyệt web chính.

Do khả năng quá mạnh mẽ, và vì lĩnh vực mạng có cả hai mặt "phòng thủ" lẫn "tấn công", Anthropic đã không cung cấp mô hình này cho công chúng, mà chỉ cấp quyền truy cập cho một số cơ quan chính phủ và nhà khai thác cơ sở hạ tầng quan trọng thông qua khuôn khổ gọi là "Project Glasswing". Theo thông báo chính thức của công ty, Glasswing ban đầu bắt đầu với khoảng 50 đối tác sáng lập, và chỉ trong vài tuần sau khi vận hành, các đối tác đã phát hiện hơn 10.000 lỗ hổng có mức độ nghiêm trọng "cao" hoặc "nghiêm trọng". Ngày 2 tháng 6 năm 2026, Anthropic thông báo mở rộng quyền truy cập tới khoảng 150 tổ chức tại hơn 15 quốc gia — nhiều trong số đó là những đơn vị vận hành cơ sở hạ tầng quan trọng, nơi "một cuộc tấn công quy mô lớn có thể ảnh hưởng đến hơn 100 triệu người". Ngoài ra, theo Bloomberg, cơ quan an ninh mạng ENISA của EU được dự kiến trở thành cơ quan EU đầu tiên được tiếp cận Mythos. Anthropic đặt mục tiêu cuối cùng là "triển khai các mô hình cấp Mythos ở quy mô lớn cho mục đích phòng thủ mạng, cùng với các cơ chế an toàn mạnh mẽ có khả năng phát hiện và chặn các đầu ra nguy hiểm nhất".

Ở đây, tôi muốn làm rõ một điểm mà nhiều trang web khác thường bỏ qua. Những gì thông tin công khai khẳng định rõ ràng gồm hai điều: (1) Mythos hiện tại là mô hình tiên tiến "chưa công bố" mạnh nhất của Anthropic, và (2) nhóm của Karpathy đang sử dụng "Claude (đặc biệt là Claude Opus ở tuyến đầu)" để tăng tốc quá trình huấn luyện trước. Ví dụ, trong vòng lặp autoresearch theo phong cách Karpathy, Claude Opus 4.6 được báo cáo đã chạy liên tục hơn 12 giờ qua 118 thí nghiệm. Tuy nhiên, Anthropic chưa chính thức tuyên bố rằng "biến thể cụ thể tên Mythos" được sử dụng bên trong vòng lặp tự nghiên cứu đó. Do đó, hình ảnh "Mythos × RSI" mà tiêu đề bài viết này gợi lên nên được hiểu như một biểu tượng cho bức tranh: Anthropic đã bắt đầu hướng "năng lực mạnh nhất" của mình vào bên trong — tức là vào chính quá trình phát triển của mình. Khả năng tấn công mạnh nhất (phát hiện lỗ hổng) và khả năng tự cải tiến mạnh nhất (tối ưu hóa huấn luyện trước) đều xuất phát từ cùng một dòng tiên tiến của cùng một công ty — đó chính là điều cốt lõi.

Lời kêu gọi "giảm tốc" của Anthropic — tự đạp phanh chiếc động cơ mà chính họ đã chế tạo

Vào đầu tháng 6 năm 2026 (các báo đưa tin vào ngày 4–5 tháng 6), Anthropic đã công bố bài luận "When AI builds itself (Khi AI tự tạo ra chính mình)" thông qua tổ chức nghiên cứu của mình là "Anthropic Institute". Tác giả là Marina Favaro (người đứng đầu tổ chức nghiên cứu) và đồng sáng lập Jack Clark. Nội dung kêu gọi các công ty AI hàng đầu thế giới nghiêm túc cân nhắc việc "giảm tốc độ có phối hợp, hoặc tạm dừng" phát triển AI tiên tiến.

Bài luận định nghĩa RSI là "hệ thống AI có khả năng tự thiết kế và phát triển các thế hệ kế tiếp của chính mình một cách hoàn toàn tự chủ". Công ty nhận định điều này "không phải là tất yếu", nhưng cảnh báo rằng nó "có thể đến sớm hơn mức mà nhiều tổ chức đã chuẩn bị". Trọng tâm của đề xuất là "khả năng xác minh (verifiability)" — được đặt ra trong bối cảnh thừa nhận tính phi thực tế của việc đơn phương dừng lại. Anthropic viết: "Nếu những hệ thống như vậy tồn tại, chúng tôi dự kiến sẽ giảm tốc hoặc tạm dừng, với điều kiện các nhà phát triển khác đang ở biên giới hoặc gần đó cũng giảm tốc theo cách có thể xác minh được." Đây là một đề xuất có điều kiện — "nếu tất cả có thể xác nhận lẫn nhau rằng mình đã thực sự dừng lại, thì chúng tôi cũng dừng" — với tiền đề là sự cảnh giác cao độ trước nguy cơ ai đó lén lút tiến lên trước.

Công ty nhận định thẳng thắn về sự khó khăn này: "Các lần chạy huấn luyện dễ che giấu hơn nhiều so với hầm chứa tên lửa, đầu vào của chúng có tính đa dụng, và động cơ để lén lút tiến lên là vô cùng lớn — bởi kẻ tiếp tục chạy trong khi người khác dừng lại sẽ thừa hưởng vị trí dẫn đầu." Bài luận dẫn chiếu lịch sử qua các chế độ giải trừ quân bị như Hiệp ước INF, đồng thời kết luận rằng "những chế độ như vậy mất nhiều thập kỷ để xây dựng cơ chế tin tưởng và xác minh. Chúng ta không có nhiều thời gian đến vậy."

Các con số cũng rất cụ thể. Theo dữ liệu của chính Anthropic, độ dài các tác vụ mà AI có thể xử lý tự chủ đã tăng gần gấp đôi sau mỗi vài tháng trong những năm gần đây: Claude 3 Opus vào tháng 3 năm 2024 xử lý được tác vụ khoảng 4 phút, đến tháng 3 năm 2025 là khoảng 1,5 giờ, và đến tháng 3 năm 2026, Claude Opus 4.6 đã có thể xử lý liên tục khoảng 12 giờ. Công ty dự báo rằng "các tác vụ mà chuyên gia thực hiện trong vài ngày có thể nằm trong tầm tay trong năm nay" và "đến năm 2027, các tác vụ kéo dài vài tuần cũng có thể đạt được." Đồng sáng lập Jack Clark được cho là ước tính xác suất tự động hóa hoàn toàn nghiên cứu và phát triển bởi AI là "khoảng 60% vào cuối năm 2028." Đáng chú ý, đối thủ cạnh tranh OpenAI đã trình bày quan điểm khác trong một báo cáo riêng — rằng "không phải các công ty tư nhân hành động đơn lẻ, mà chính các chính phủ dân chủ mới là bên cuối cùng quyết định các quy tắc, biện pháp bảo vệ và cơ chế trách nhiệm giải trình" — tạo nên sự tương phản rõ rệt.

Sự nguy hiểm khi "AI tốt nhất" và "nhà giáo dục tốt nhất" hướng tới RSI

Hãy để chúng ta quay lại chủ đề chính của bài viết này. Mô hình frontier mạnh nhất (Mythos) và nhà giáo dục xuất sắc nhất (Karpathy) — người vừa giỏi nâng cao hiệu quả nghiên cứu AI, vừa giỏi dân chủ hóa tri thức AI — cùng nhau hướng tới RSI. Điều gì trong sự kết hợp này là nguy hiểm?

Thứ nhất, đó là chất lượng năng lực. Mythos đã vượt qua con người về khả năng "tìm kiếm và khai thác lỗ hổng trong phần mềm". Bản chất của RSI cũng chính là "tìm kiếm, khai thác và sửa chữa các lỗ hổng (sự kém hiệu quả) trong cách tạo ra AI". Khi trí thông minh "tìm kiếm điểm yếu" đã được chứng minh qua việc phát hiện lỗ hổng bảo mật được hướng vào chính kiến trúc và công thức huấn luyện của bản thân nó, chu trình cải tiến có thể vận hành mà không cần sự can thiệp của con người. Cái vòng lặp mà Karpathy gọi là "một chút điên rồ" trong các thí nghiệm tại nhà — khi được trang bị bởi mô hình mạnh nhất thế giới và kỹ thuật tinh chỉnh đỉnh cao nhất thế giới — phản hồi sẽ trở nên nhanh hơn theo cấp số nhân.

Thứ hai, đó là sự dịch chuyển của nút thắt cổ chai. Như chính Anthropic thừa nhận, tốc độ AI viết code càng tăng, giai đoạn giới hạn tốc độ càng dịch chuyển sang "đánh giá của con người". Khi việc đánh giá không theo kịp, phạm vi mà các cải tiến tích lũy mà con người không hiểu được sẽ ngày càng mở rộng. Chính Anthropic đã nêu rủi ro rằng "sự không đồng nhất (misalignment) tích lũy theo lãi kép qua từng thế hệ" — đây chính xác là điểm đó. Nhà giáo dục xuất sắc nhất vốn là bậc thầy trong việc "dịch sang dạng mà con người có thể hiểu được". Sự nghịch lý rằng người đó lại trở thành người thúc đẩy gia tốc của một vòng lặp có nguy cơ bỏ lại sự hiểu biết của con người phía sau — chính ở đó, "sự nguy hiểm" mà tiêu đề đề cập được cô đọng lại.

Thứ ba, đó là sự nguy hiểm của chính cấu trúc: phe thận trọng đang đạp ga. Karpathy, người từng điềm tĩnh nói rằng "AGI còn 10 năm nữa" và "code hiện tại là slop" — khi bước vào tuyến đầu, sẽ trở thành người chịu trách nhiệm triển khai RSI, chủ đề có tính gia tốc nhất. Sự thận trọng và gia tốc có thể cùng tồn tại không mâu thuẫn trong một con người. Chính vì vậy, câu hỏi đặt ra không phải là ai đang nắm dây cương, mà là vòng lặp đó sẽ trở nên nhanh đến đâu. Việc Anthropic vừa đề xuất giảm tốc vừa giành được người dẫn đầu RSI không phải vì họ đang ôm ấp một mâu thuẫn nội tại. Chính thực tế rằng ngay cả đại diện tiêu biểu của phe thận trọng cũng đã chuyển sang phía quay tay quay ở tuyến đầu — đó mới là dấu hiệu rõ ràng nhất cho thấy AGI đang tiến gần hơn với tốc độ nhanh hơn dự kiến, và là lý do tại sao lo ngại về phanh hãm đã trở thành một vấn đề thực tế cần bàn luận.

4 quan điểm về AGI — Page, Musk, Altman, Amodei

Tại sao cùng đối diện với một "AI mạnh mẽ" như nhau, mà thái độ giữa các công ty và mỗi cá nhân lại phân hóa đến vậy? Truy về nguồn gốc, ta sẽ đến với triết lý của bốn người đã định hình Thung lũng Silicon suốt nhiều năm qua.

Ở cực tăng tốc mạnh nhất là Larry Page, đồng sáng lập Google. Theo lời khai tuyên thệ của Elon Musk tại phiên tòa liên quan đến OpenAI bắt đầu vào tháng 4 năm 2026, "OpenAI tồn tại là vì Larry Page gọi tôi là 'kẻ phân biệt loài' (speciesist)." Giai thoại này cũng được khắc họa trong tiểu sử của Walter Isaacson: Page được cho là đã cười nhạo khả năng AI gây mối đe dọa hiện sinh cho nhân loại, và chỉ trích Musk — người ưu tiên sự tồn vong của loài người — là "kẻ phân biệt chủng loại, thiên vị loài người." Với Page, sự xuất hiện của siêu trí tuệ kỹ thuật số là bước tiến hóa tiếp theo hoàn toàn tự nhiên và đáng mong đợi; chính việc đặt đặc quyền cho con người với tư cách một loài sinh học mới là điều hẹp hòi (cần lưu ý rằng bản thân Page hầu như không lên tiếng công khai về vấn đề này, và câu chuyện chủ yếu được biết đến qua lời khai của Musk và các tài liệu tiểu sử).

Ở cực đối lập là Musk. Ông thậm chí nói rằng "Tôi thực sự thích nhân loại, bạn ơi (I f---ing like humanity, dude)" và đặt sự an toàn lấy con người làm trung tâm lên hàng đầu. Ông nhất quán khẳng định rằng cuộc chia tay với Page là một trong những động lực thúc đẩy ông thành lập OpenAI (năm 2015) như một đối trọng phi lợi nhuận và mang tính mở. Vụ kiện ông khởi xướng năm 2024, với cáo buộc OpenAI phản bội danh nghĩa phi lợi nhuận, đã bước vào giai đoạn then chốt tại tòa vào tháng 4 năm 2026.

Ở vị trí trung gian là Sam Altman, người theo chủ nghĩa tiệm tiến. Trong bài luận tháng 6 năm 2025 "The Gentle Singularity" (Điểm kỳ dị nhẹ nhàng), ông lập luận rằng sự ra đời của siêu trí tuệ là không thể tránh khỏi, nhưng nó sẽ đến "từng chút một" như một đường cong trơn tru, chứ không phải như một đứt gãy thảm khốc. "Chúng ta đã vượt qua chân trời sự kiện. Quá trình cất cánh đã bắt đầu" — nhưng mọi người vẫn sẽ yêu thương gia đình, thưởng thức sáng tạo, và bơi lội trên hồ — cuộc sống hằng ngày sẽ "ấn tượng nhưng vẫn có thể quản lý được." Đây là luận thuyết lạc quan theo từng tầng bậc, phác thảo một lịch trình: năm 2025 là các tác nhân thực sự xử lý công việc nhận thức, năm 2026 là các hệ thống tạo ra những hiểu biết mới, năm 2027 là robot làm việc trong thế giới thực.

Và Dario Amodei. Ông không thích từ "AGI" và gọi đó là "AI mạnh mẽ" (powerful AI). Ông cho rằng điều này có thể đến sớm nhất vào năm 2026, nhưng trong bài tiểu luận dài hơi tháng 10 năm 2024 "Machines of Loving Grace" (Những cỗ máy đầy ân huệ), ông vẽ nên một viễn cảnh tương lai tích cực triệt để: khi trí tuệ đạt tầm Nobel có thể "thông minh hơn con người trong mọi lĩnh vực," thì việc kéo dài tuổi thọ gấp đôi, chữa khỏi gần như mọi căn bệnh, và sự thịnh vượng kinh tế khổng lồ đều nằm trong tầm tay. Tuy nhiên, đến tháng 1 năm 2026, ông công bố phần tiếp theo "The Adolescence of Technology" (Tuổi thiếu niên của công nghệ), soi sáng vào phía rủi ro, rồi dẫn đến "đề xuất giảm tốc" vào tháng 6. Sự hào hứng trước lợi ích và cảnh giác trước nguy cơ mất kiểm soát cùng tồn tại trong một con người — đó là lập trường cơ bản của Amodei, và rộng hơn là của Anthropic. Người hùng biện nhất về niềm vui của sự tăng tốc đồng thời là người lên tiếng mạnh mẽ nhất đòi hãm phanh. Đây không phải mâu thuẫn. Chính vì đã đạp ga sâu hơn ai hết, ông mới sớm nhận ra rằng AGI đang tiến đến nhanh hơn dự tính, và bắt đầu lo lắng về phanh hãm. Cái cảm giác "nhanh hơn mình nghĩ" đó chính là nguồn gốc của "nỗi đau" của Anthropic.

Góc nhìn từ các nhà đầu tư mạo hiểm Silicon Valley — Tại sao những công ty "kêu gọi giảm tốc độ" lại có thể bứt phá dẫn đầu?

Từ đây, tôi muốn tổng hợp chuỗi diễn biến này từ một góc độ không có ở các trang khác — góc nhìn của giới đầu tư mạo hiểm (VC) tại Silicon Valley.

Trước tiên, hãy xác nhận bằng con số sự "dẫn đầu độc tôn" của Anthropic. Ngày 28 tháng 5 năm 2026, công ty huy động được 65 tỷ đô la (khoảng 10 nghìn tỷ yên) trong vòng Series H, đưa định giá post-money lên 965 tỷ đô la (khoảng 150 nghìn tỷ yên). Đứng đầu danh sách nhà đầu tư là Sequoia Capital, Altimeter, Dragoneer, Greenoaks, cùng với Coatue, GIC, ICONIQ, Capital Group và nhiều quỹ hàng đầu thế giới khác. Trước đó, trong vòng Series G, định giá công ty vào khoảng 380 tỷ đô la (khoảng 59 nghìn tỷ yên), tức là chỉ trong vài tháng, định giá đã tăng gấp đôi. Ngày 1 tháng 6, công ty nộp bản thảo S-1 (prospectus niêm yết) dưới dạng bảo mật lên SEC, chính thức bắt đầu hành trình IPO hướng tới mốc 1 nghìn tỷ đô la (khoảng 155 nghìn tỷ yên). Tốc độ doanh thu theo năm (run rate) tính đến tháng 5 năm 2026 đạt khoảng 47 tỷ đô la (khoảng 7,3 nghìn tỷ yên), tăng gấp khoảng 5 lần so với khoảng 10 tỷ đô la (khoảng 1,6 nghìn tỷ yên) của năm trước. Riêng Claude Code đã leo từ mức 1 tỷ đô la (khoảng 155 tỷ yên) theo năm vào tháng 11 năm 2025 lên 2,5 tỷ đô la (khoảng 390 tỷ yên) vào tháng 2 năm 2026. Đây thực sự là sự dẫn đầu xứng đáng với nhận xét "Dario đã thắng".

Trong thế giới VC, có một giả thuyết lý thuyết củng cố cho sự dẫn đầu này. Nếu RSI (Recursive Self-Improvement — cải tiến bản thân đệ quy) là thật, thì vòng phản hồi "chu kỳ nghiên cứu nhanh hơn → mô hình nền tảng tốt hơn → Claude thông minh hơn → chu kỳ nghiên cứu lại càng nhanh hơn" sẽ xoay vòng, và công ty nào nắm được điều này trước tiên sẽ bứt phá theo cách mà các đối thủ không thể đuổi kịp — đây chính là cơ học của "kẻ thắng lấy tất" (winner-take-all). Trong bối cảnh đó, việc thu hút Karpathy không chỉ đơn thuần là một thương vụ tuyển dụng đình đám, mà là khoản đầu tư vào "nhân tài có thể vận hành vòng lặp nhanh nhất", và đó cũng là lý do hợp lý để các VC nghiêng về phía Anthropic. Nhớ lại rằng Anthropic từng bị nhiều VC hàng đầu từ chối trong giai đoạn đầu (có nguồn tin cho rằng bị "21 VC top-tier từ chối"), biên độ dao động của định giá tự nó đã nói lên sự bất đối xứng của canh bạc này.

Điều thú vị một cách quyết định ở đây là hàm ý VC của nghịch lý "kẻ kêu gọi giảm tốc lại dẫn đầu độc tôn". Đại diện tiêu biểu của phe tăng tốc tại Silicon Valley là Andreessen Horowitz (a16z). "Tuyên ngôn Techno-Optimist" của nhà sáng lập Marc Andreessen ca ngợi chủ nghĩa tư bản kỹ thuật thị trường tự do là thuốc chữa bách bệnh, và bác bỏ những quan niệm như "đạo đức công nghệ" hay "trust and safety" (tin tưởng và an toàn). David Ulevitch, đối tác của a16z, chỉ trích thái độ của Amodei trong việc hợp tác với chính phủ, và thậm chí còn nói rằng các lãnh đạo công nghệ nên từ bỏ "God complex" (phức cảm thần thánh). Anthropic/Amodei hướng đến giảm tốc và kiểm soát, còn a16z hướng đến tăng tốc và tự do — cuộc đối lập này chính là bức tranh trong đó sự bất đồng về quan niệm AGI được dịch trực tiếp thành sự bất đồng về triết lý đầu tư.

Tuy nhiên, một số VC đang đọc sâu hơn một tầng nữa. Nếu trọng tâm của ngành dịch chuyển từ "tốc độ năng lực" sang "giám sát, đánh giá, kiểm chứng (governance)", thì kẻ chiến thắng sẽ không phải là người có tốc độ năng lực thuần túy, mà là người nắm giữ công cụ kiểm chứng và nền tảng quản trị — đó là nhận định này. Đứng từ góc nhìn đó, "lời kêu gọi giảm tốc" của Anthropic không chỉ là sự biểu đạt lương tâm đơn thuần, mà còn là chiến lược định vị nhằm giành quyền chủ đạo trong việc thiết lập quy tắc. Công ty lớn tiếng cảnh báo về RSI nhất lại là công ty triển khai RSI nhanh nhất, đồng thời còn tình nguyện đứng ra kéo lá cờ trong việc định hình các quy tắc đó. Chân ga, phanh, và soạn thảo luật giao thông — nắm cả ba thứ trong một công ty chính là bản chất thực sự của "sự dẫn đầu độc tôn" của Anthropic, đồng thời cũng là bản chất thực sự của "nỗi đau" của họ. Nhưng lời kêu gọi giảm tốc và sự dẫn đầu không mâu thuẫn nhau. Chỉ kẻ chạy nhanh hơn tất cả mới cảm nhận được mình đang gần đích (AGI) đến mức nào bằng chính da thịt mình, và chính vì vậy mới vội vàng thiết kế phanh. Chính việc Anthropic bắt đầu nói nghiêm túc về phanh chính là bằng chứng rõ ràng nhất rằng AGI đang đến nhanh hơn dự kiến. Liệu họ có thể điều khiển được cảm giác "đến sớm hơn tưởng" này dưới sức hút trọng lực của định giá 150 nghìn tỷ yên đến đâu — đó chính là điểm mà các VC đang dõi theo.

Điểm cần chú ý trong thời gian tới — khi nào và điều gì được "đo lường"

Cuối cùng, hãy sắp xếp lại những gì cần theo dõi từ đây, và theo khung thời gian nào.

Chỉ số định lượng cụ thể nhất là "nhịp độ tăng gấp đôi độ dài tác vụ mà AI có thể tự hoàn thành" mà chính Anthropic đã công bố. Vào tháng 3 năm 2026, con số này là khoảng 12 giờ. Công ty đã tuyên bố rằng "các tác vụ mà chuyên gia mất vài ngày sẽ nằm trong tầm tay trong năm nay (2026)" và "đến năm 2027 sẽ mở rộng lên quy mô vài tuần". Liệu "chu kỳ tăng gấp đôi độ dài tác vụ" này có được cập nhật theo đúng dự báo vài tháng một lần, hay sẽ chậm lại, chính là thước đo tốt nhất để xem liệu RSI có đang thực sự tăng tốc hay không. Ngoài ra, các đối tượng cần quan sát bao gồm: tỷ lệ code nội bộ do Claude viết (đã vượt 80%), lượng merge trên mỗi kỹ sư (gấp 8 lần so với năm 2024), và mức độ các cải tiến trong vòng lặp autoresearch có thể được chuyển giao từ các mô hình nhỏ sang quy mô tiên tiến đến đâu.

Về con người và sự kiện: Thứ nhất, nhóm của Karpathy sẽ công bố kết quả gì trong quá trình pre-training. Thứ hai, so với nhận định của Jack Clark rằng "khoảng 60% nghiên cứu và phát triển sẽ được tự động hóa hoàn toàn vào cuối năm 2028", thực tế sẽ tiến gần đến mức nào trong giai đoạn 2026–2027. Thứ ba, "đề xuất giảm tốc" sẽ được các phòng thí nghiệm nghiên cứu lớn khác và các chính phủ tiếp nhận ra sao, và đối thoại hướng đến thiết kế cụ thể cơ chế kiểm chứng (cơ chế xác nhận lẫn nhau rằng các bên đã thực sự dừng lại) sẽ tiến triển đến đâu trong vài tháng tới. Anthropic đã tuyên bố sẽ tiếp tục các cuộc tham vấn với các nhà hoạch định chính sách, nhà nghiên cứu và đối thủ cạnh tranh trong thời gian tới về vấn đề này. Thứ tư, Project Glasswing và Mythos sẽ mở rộng ra đến phạm vi nào từ 15 quốc gia và 150 tổ chức hiện tại, và việc các cơ quan EU như ENISA tham gia sẽ tác động như thế nào đến các cuộc thảo luận về quy định an toàn.

Và về sự kiện tài chính, điểm mấu chốt lớn nhất là khi nào bản S-1 nộp bảo mật sẽ chuyển thành bản cáo bạch chính thức và bước vào giai đoạn roadshow (thuyết trình cho nhà đầu tư). Theo quy định của Hoa Kỳ, bản cáo bạch chính thức phải được gửi đến nhà đầu tư ít nhất 15 ngày trước khi bắt đầu roadshow, do đó việc công bố đó sẽ là tín hiệu "khởi động đồng hồ niêm yết". Nếu đợt niêm yết tiệm cận 1 nghìn tỷ đô la (khoảng 155 nghìn tỷ yên) được thực hiện, đây sẽ là lần đầu tiên hiệu quả kinh tế của việc AI phát triển AI (RSI) được định giá trên thị trường công khai. Thị trường sẽ định giá bao nhiêu cho một công ty vừa kêu gọi giảm tốc vừa đang dẫn đầu một mình — nửa cuối năm 2026, câu trả lời một phần sẽ dần lộ diện.