Thách thức cấu trúc trong phát triển thuốc — Tại sao thuốc mới lại tốn kém và chậm trễ đến vậy
Sự kém hiệu quả trong phát triển thuốc mới là thách thức nan giải nhất của ngành dược phẩm.
Theo ước tính của Trung tâm Nghiên cứu Phát triển Dược phẩm Tufts (CSDD), chi phí trung bình để đưa một loại thuốc được phê duyệt ra thị trường là 2,6 tỷ đô la (khoảng 390 tỷ yên), và thời gian trung bình cần thiết là 10 đến 15 năm. Phân tích năm 2021 của BIO/QLS Advisors/Informa cho thấy xác suất để một loại thuốc bước vào Giai đoạn I cuối cùng được FDA phê duyệt chỉ là 12%. Tỷ lệ thất bại của toàn bộ thử nghiệm lâm sàng lên tới khoảng 90%. Riêng trong lĩnh vực ung thư, xác suất từ Giai đoạn I đến khi được phê duyệt chỉ vỏn vẹn 5%.
Nguồn gốc của sự kém hiệu quả này được diễn đạt qua "Định luật Eroom" — đọc ngược của Định luật Moore. Năng suất khám phá thuốc đã được điều chỉnh theo lạm phát giảm một nửa cứ khoảng 9 năm kể từ năm 1950. Nguyên nhân là sự thắt chặt các quy định, sự cạn kiệt "quả chín thấp" (các mục tiêu dễ dàng đã có thuốc rồi), và đặc biệt là sự thiếu hụt dữ liệu sinh học đa dạng và chất lượng cao.
Chi tiêu R&D dược phẩm toàn cầu đã vượt 265 tỷ đô la (khoảng 39,75 nghìn tỷ yên) vào năm 2024 (theo ước tính của IQVIA). Tuy nhiên, phần lớn trong số đó biến mất dưới dạng chi phí của các thử nghiệm thất bại. Ba trụ cột đang nỗ lực thay đổi căn bản mô hình này là: ngân hàng sinh học (biobank), dữ liệu tổng hợp, và AI/học máy.
Ngân hàng sinh học — "Sự thật trên mặt đất" kết nối kiểu gen và kiểu hình
Biobank là nền tảng nghiên cứu thu thập và lưu trữ dài hạn dữ liệu bộ gen, mẫu sinh học (máu, nước tiểu, v.v.) và hồ sơ sức khỏe từ các quần thể quy mô lớn. Trong lĩnh vực phát triển thuốc, biobank cung cấp "sự thật thực địa" để kiểm chứng mối quan hệ nhân quả giữa gen và bệnh tật ở cấp độ quần thể.
UK Biobank là biobank nổi tiếng nhất thế giới. Dự án tuyển mộ 500.000 người trong giai đoạn 2006–2010, và việc giải trình tự toàn bộ gen (WGS) cho toàn bộ người tham gia đã hoàn thành vào năm 2023. Dữ liệu proteomics đo lường khoảng 3.000 protein trên toàn bộ 500.000 người tham gia, thực hiện với sự hợp tác của Olink, cũng đã được công bố. Dự án đã thu hút hơn 30.000 nhà nghiên cứu đăng ký, hơn 10.000 dự án được phê duyệt, và tạo ra hơn 8.000 bài báo được bình duyệt. Tổng ngân sách tích lũy vào khoảng 260 triệu bảng Anh (khoảng 5.000 tỷ đồng). Mô hình truy cập mở cho phép các nhà nghiên cứu trên toàn thế giới tiếp cận dữ liệu.
All of Us (NIH – Viện Y tế Quốc gia Hoa Kỳ) đặt mục tiêu thu hút hơn 1 triệu người tham gia phản ánh sự đa dạng của nước Mỹ. Tính đến năm 2025, hơn 800.000 người đã đăng ký và hơn 500.000 người đã cung cấp mẫu sinh học. Điểm đột phá là các nhóm thiểu số về chủng tộc và dân tộc vốn bị loại trừ trong lịch sử nghiên cứu chiếm hơn 50% người tham gia. Ngân sách giai đoạn đầu được phân bổ là 1,4 tỷ đô la Mỹ (khoảng 35.000 tỷ đồng).
BioBank Japan (BBJ) có khoảng 270.000 người tham gia và 47 bệnh mục tiêu, được vận hành bởi Viện Nghiên cứu RIKEN và Đại học Tokyo. Đây là một trong những biobank lớn nhất thế giới đối với các quần thể không phải người châu Âu, và đóng vai trò không thể thiếu trong việc tìm hiểu cấu trúc di truyền của quần thể Đông Á. BBJ đã đóng góp vào việc xác định hơn 200 locus gen liên quan đến bệnh.
FinnGen (Phần Lan) có hơn 500.000 người tham gia và đặc biệt có giá trị trong việc phát hiện các biến thể hiếm gặp nhờ tận dụng hiệu ứng người sáng lập của Phần Lan. Đây là quan hệ đối tác công–tư giữa 13 biobank và 11 công ty dược phẩm (AbbVie, AstraZeneca, Pfizer, v.v.).
deCODE Genetics (Iceland) lưu giữ kiểu gen của hơn 190.000 người Iceland (hơn một nửa dân số), kết hợp với dữ liệu phả hệ trải dài hơn 1.000 năm. Công ty được Amgen mua lại với giá 415 triệu đô la Mỹ (khoảng 6.225 tỷ đồng) vào năm 2012 và đã đóng góp vào việc xác định nhiều mục tiêu phát triển thuốc.
Giá trị lớn nhất mà dữ liệu biobank mang lại cho phát triển thuốc là phát hiện rằng các mục tiêu phát triển thuốc có cơ sở di truyền có tỷ lệ thành công trong thử nghiệm lâm sàng cao gấp 2 lần (Nelson et al., Nature Genetics, 2015). Nghiên cứu cập nhật của King et al. (2019) cho thấy các loại thuốc có hỗ trợ di truyền có xác suất đi từ Giai đoạn I đến khi được phê duyệt cao hơn 2,6 lần.
Dữ liệu tổng hợp — Vượt qua rào cản về quyền riêng tư và sự khan hiếm
Dữ liệu tổng hợp là công nghệ tạo ra dữ liệu nhân tạo không thể nhận dạng cá nhân trong khi mô phỏng các đặc tính thống kê của dữ liệu bệnh nhân thực tế. Công nghệ này vượt qua các quy định bảo mật HIPAA (Hoa Kỳ) và GDPR (EU) ngay từ giai đoạn thiết kế.
Giá trị của dữ liệu tổng hợp trong nghiên cứu phát triển thuốc gồm ba điểm. Thứ nhất, giải quyết tình trạng khan hiếm dữ liệu. Có hơn 7.000 loại bệnh hiếm gặp được biết đến trên thế giới, nhưng nhiều bệnh chỉ có vài trăm bệnh nhân, khiến việc thiết kế thử nghiệm lâm sàng theo phương pháp truyền thống là bất khả thi. Dữ liệu tổng hợp tạo ra các nhóm thuần tập quy mô hàng nghìn người có giá trị thống kê từ số ít dữ liệu thực tế này. Thứ hai, chia sẻ dữ liệu có bảo vệ quyền riêng tư. Nhiều cơ sở y tế có thể tiến hành nghiên cứu hợp tác dưới dạng dữ liệu tổng hợp mà không cần chia sẻ dữ liệu thực. Thứ ba, mô phỏng thử nghiệm lâm sàng (thử nghiệm in silico). Unlearn.AI có phương pháp được FDA phê duyệt để tạo nhóm đối chứng tổng hợp (digital twin), có thể giảm 20~30% quy mô nhóm đối chứng và tiết kiệm 10~50 triệu đô la (khoảng 1,5~7,5 tỷ yên) chi phí mỗi thử nghiệm.
Các công ty tiêu biểu bao gồm: Syntegra (San Francisco, dữ liệu EHR tổng hợp, huy động khoảng 17 triệu đô la trong vòng Series A), MDClone (Israel/Hoa Kỳ, nền tảng "ADAMS", được Mayo Clinic và các tổ chức khác áp dụng, tổng cộng huy động khoảng 63 triệu đô la), Gretel.ai (San Diego, đảm bảo bảo mật vi phân, huy động khoảng 68 triệu đô la trong vòng Series B), Mostly AI (Vienna, chuyên về GDPR, huy động khoảng 31 triệu đô la), và Datavant (San Francisco, mạng lưới dữ liệu kết nối hơn 70.000 bệnh viện, huy động hơn 110 triệu đô la).
Thị trường dữ liệu tổng hợp trong lĩnh vực chăm sóc sức khỏe dự kiến đạt khoảng 1,2~1,5 tỷ đô la (khoảng 180~225 tỷ yên) vào năm 2025 và mở rộng lên 4~5,5 tỷ đô la (khoảng 600~825 tỷ yên) vào năm 2030 (CAGR 25~28%). Gartner dự báo rằng đến năm 2030, dữ liệu tổng hợp sẽ vượt qua dữ liệu thực trong việc huấn luyện các mô hình AI.
Các công ty hàng đầu trong lĩnh vực khám phá thuốc bằng AI——Kỷ nguyên mới được mở ra bởi công nghệ
Trong lĩnh vực khám phá thuốc bằng AI, hàng loạt công ty quy mô hàng tỷ đô la đang nổi lên, đang biến đổi toàn bộ chuỗi giá trị dược phẩm.
Recursion Pharmaceuticals (Salt Lake City, NASDAQ: RXRX) đã huy động tổng cộng hơn 1,5 tỷ USD, và vào tháng 8 năm 2024 đã công bố sáp nhập với Exscientia (khoảng 688 triệu USD), trở thành một trong những công ty khám phá thuốc bằng AI lớn nhất thế giới. Công ty sở hữu "bộ dữ liệu sinh học và hóa học độc quyền lớn nhất thế giới" — hàng nghìn tỷ điểm dữ liệu — và đã ký kết quan hệ đối tác nhiều năm với NVIDIA (NVIDIA đầu tư 50 triệu USD). Hơn 8 chương trình đang ở giai đoạn lâm sàng.
Insilico Medicine (Hồng Kông) là biểu tượng của lĩnh vực khám phá thuốc bằng AI. INS018_055 (Rentosertib) đã đạt đến thử nghiệm lâm sàng Giai đoạn II với tư cách là loại thuốc đầu tiên trong lịch sử được phát hiện hoàn toàn bằng AI (PandaOmics) và thiết kế hoàn toàn bằng AI (Chemistry42) — cả mục tiêu lẫn phân tử đều do AI thực hiện. Thuốc nhắm vào xơ phổi vô căn (IPF), và trong Giai đoạn IIa đã báo cáo mức độ an toàn có thể chấp nhận được cùng tín hiệu hiệu quả ban đầu. Công ty đã ký hợp đồng với Sanofi trị giá lên tới 1,2 tỷ USD (khoảng 180 tỷ yên).
Isomorphic Labs (London, Alphabet/DeepMind) do CEO Demis Hassabis dẫn dắt, ứng dụng công nghệ AlphaFold vào khám phá thuốc. Vào tháng 1 năm 2024, công ty đã ký hợp đồng với Eli Lilly trị giá lên tới 1,7 tỷ USD (khoảng 255 tỷ yên) và với Novartis trị giá lên tới 1,2 tỷ USD (khoảng 180 tỷ yên). AlphaFold 3 (công bố tháng 5 năm 2024) có thể dự đoán cấu trúc của các phức hợp protein-ligand, protein-DNA, protein-RNA, mang lại khả năng ứng dụng trực tiếp vào khám phá thuốc.
Xaira Therapeutics (San Francisco/Seattle) được thành lập năm 2024 với vốn khởi nghiệp hơn 1 tỷ USD. Các nhà đầu tư bao gồm ARCH Venture Partners, Foresite Capital, Sequoia Capital và Lightspeed Venture Partners. Công ty đã cấp phép IP từ phòng thí nghiệm David Baker (Viện Thiết kế Protein, Đại học Washington) và hướng tới xây dựng mô hình nền tảng cho sinh học. Đây là một trong những vòng gọi vốn khởi nghiệp lớn nhất trong lịch sử công ty công nghệ sinh học.
Generate Biomedicines (Somerville, MA) được Flagship Pioneering — công ty đã tạo ra Moderna — thành lập vào năm 2020. Công ty đã huy động hơn 573 triệu USD và sử dụng AI tạo sinh để thiết kế thuốc protein từ đầu. Mô hình khuếch tán "Chroma" được công bố trên tạp chí Nature có khả năng tạo ra các protein với các đặc tính được chỉ định.
Absci (Vancouver, WA, NASDAQ: ABSI) chuyên về thiết kế kháng thể bằng AI tạo sinh. Trong bài báo trên Nature Biotechnology (2023), công ty đã công bố lần đầu tiên chứng minh việc thiết kế kháng thể gắn kết mục tiêu theo cách zero-shot mà không cần kháng thể xuất phát. Công ty đã ký hợp đồng với AstraZeneca trị giá lên tới 610 triệu USD (khoảng 91,5 tỷ yên).
Tại Nhật Bản, Takeda Pharmaceutical đã hợp tác với Recursion, Schrödinger và Exscientia (trước khi sáp nhập), đầu tư hơn 500 triệu USD vào chuyển đổi dữ liệu/kỹ thuật số. Daiichi Sankyo hợp tác với Preferred Networks (PFN) để ứng dụng AI vào tối ưu hóa ADC (liên hợp kháng thể-thuốc). Sumitomo Pharma đã hợp tác với Exscientia để phát triển DSP-1181 (thuốc điều trị OCD) — một trong những trường hợp đầu tiên phân tử được thiết kế bằng AI bước vào thử nghiệm lâm sàng Giai đoạn I.
Công nghệ thành phần — Từ AlphaFold đến các mô hình nền tảng sinh học
Sự tiến hóa của các công nghệ nền tảng hỗ trợ khám phá thuốc bằng AI thật đáng kinh ngạc.
AlphaFold 2 (năm 2020) đã giải quyết bài toán lớn 50 năm về dự đoán cấu trúc protein, và kết hợp với EMBL-EBI, đã dự đoán và công bố cấu trúc của hơn 200 triệu protein. AlphaFold 3 (tháng 5 năm 2024) áp dụng kiến trúc khuếch tán để dự đoán cấu trúc phức hợp protein-ligand, protein-DNA/RNA. Độ chính xác trong tương tác protein-ligand đã được cải thiện hơn 50% so với các phương pháp truyền thống. Giải Nobel Hóa học 2024 trao cho Hassabis, Jumper và Baker là biểu tượng cho đỉnh cao đạt được trong lĩnh vực này.
Sinh phân tử bằng mô hình khuếch tán là tiền tuyến của khám phá thuốc bằng AI. RFdiffusion (phòng thí nghiệm David Baker, Nature 2023) tạo ra các cấu trúc protein mới với các đặc tính được chỉ định. DiffDock (MIT, 2023) áp dụng mô hình khuếch tán vào việc docking phân tử, vượt trội so với các phần mềm docking truyền thống. Chroma (Generate Biomedicines) là mô hình sinh cấu trúc protein.
Các mô hình ngôn ngữ lớn dành cho sinh học đang nổi lên mạnh mẽ. ESM-2/ESMFold (Meta AI) được huấn luyện trên hơn 250 triệu chuỗi protein, dự đoán trực tiếp cấu trúc từ chuỗi. ProGen/ProGen2 (Salesforce Research) tạo ra các chuỗi protein có chức năng và đã chứng minh rằng các protein được tạo ra hoạt động như enzyme có hoạt tính. Evo (Arc Institute, đồng sáng lập bởi Patrick Collison, 2024) là mô hình nền tảng bộ gen được huấn luyện trên 2,7 triệu bộ gen, có khả năng tạo ra các chuỗi DNA ở quy mô gen và bộ gen.
Thử nghiệm lâm sàng với bản sao kỹ thuật số cũng đang tiến triển. Unlearn.AI tạo ra các bản sao kỹ thuật số của bệnh nhân từ dữ liệu thử nghiệm trước đây, và xây dựng nhóm đối chứng tổng hợp bằng phương pháp điều chỉnh hiệp biến được FDA phê duyệt. Điều này giúp giảm 20~30% quy mô nhóm đối chứng cần thiết, tiết kiệm thời gian và chi phí.
Góc nhìn từ các nhà đầu tư mạo hiểm Silicon Valley——"Sinh học đã trở thành khoa học thông tin"
Các nhà đầu tư mạo hiểm (VC) tại Thung lũng Silicon định vị AI trong khám phá thuốc là "cơ hội đầu tư một thế hệ có một lần".
a16z Bio (Andreessen Horowitz) do Vijay Pande (người phát minh ra Folding@home, cựu giáo sư Stanford) dẫn dắt, đã thành lập các quỹ Bio trị giá hơn 1,5 tỷ đô la trong giai đoạn 2019–2023. Dưới luận điểm "phần mềm sẽ nuốt chửng sinh học", quỹ này đã đầu tư vào Insitro, Freenome và nhiều công ty khác. Pande thường xuyên chia sẻ rộng rãi về "kỹ thuật sinh học" (engineering biology).
Flagship Pioneering (Cambridge, MA) là công ty tạo lập liên doanh đã sản sinh ra Moderna (vốn hóa thị trường đỉnh điểm vượt 150 tỷ đô la). Được dẫn dắt bởi CEO Noubar Afeyan, công ty quản lý tổng vốn hơn 10 tỷ đô la. Generate Biomedicines là khoản đầu tư AI-sinh học trọng tâm của họ.
ARCH Venture Partners do Robert Nelsen và Kristina Burow dẫn dắt, đã đầu tư vào Illumina (với tư cách nhà đầu tư giai đoạn đầu) và dẫn đầu vòng gọi vốn hơn 1 tỷ đô la cho Xaira Therapeutics. Họ tuyên bố: "Sinh học đã trở thành khoa học thông tin. Sự hội tụ giữa AI và sinh học là cơ hội đầu tư lớn nhất trong một thế hệ".
Tổng vốn VC đầu tư vào AI khám phá thuốc đã tăng từ 4,6 tỷ đô la năm 2020 lên 6,7 tỷ đô la vào năm 2024 (theo PitchBook, BioCentury), và dự kiến đạt 7–8 tỷ đô la vào năm 2025.
Jensen Huang (CEO NVIDIA) tuyên bố: "Nền tảng điện toán tiếp theo chính là sinh học. Mọi công ty dược phẩm sẽ trở thành công ty công nghệ" (Bài phát biểu khai mạc GTC 2024). Nền tảng BioNeMo và GPU (H100/B200) của NVIDIA đang đóng vai trò như "cuốc và xẻng" trong lĩnh vực AI khám phá thuốc.
Quan điểm của những người nổi tiếng — từ người đoạt giải Nobel đến các doanh nhân VC
Demis Hassabis (CEO của Google DeepMind/Isomorphic Labs, Giải Nobel Hóa học 2024) đã phát biểu rằng "AlphaFold là công trình quan trọng nhất mà tôi từng thực hiện. Đây là ứng dụng có tác động lớn nhất của AI," đồng thời dự đoán rằng "trong vòng 5 năm, AI sẽ tăng tốc đáng kể giai đoạn đầu của quá trình phát triển thuốc, và trong vòng 10 năm, toàn bộ quy trình sẽ thay đổi căn bản."
David Baker (Đại học Washington, Giải Nobel Hóa học 2024) đã phát biểu trong bài giảng Nobel của mình rằng "Chúng ta đã bước vào kỷ nguyên có thể thiết kế các phân tử từ đầu — những phân tử thực hiện những gì mà quá trình tiến hóa tự nhiên chưa từng khám phá. Sự kết hợp giữa thiết kế tính toán và AI đang thay đổi những gì có thể làm được trong y học."
Daphne Koller (CEO của Insitro, Giáo sư Stanford) cho biết: "Lý do khiến việc phát triển thuốc tốn kém là vì chúng ta đang thử nghiệm trên người do không có đủ mô hình dự đoán tốt. Nếu có thể xây dựng các mô hình dự đoán tốt hơn bằng học máy, chúng ta có thể thất bại nhanh hơn, rẻ hơn và sớm hơn."
Eric Topol (Giám đốc Viện Nghiên cứu Dịch thuật Scripps) nhận định: "Chúng ta đang ở điểm bước ngoặt. Sự hội tụ của dữ liệu bộ gen phong phú từ các ngân hàng sinh học và AI đang thay đổi cách thức phát triển thuốc," và dự đoán rằng "đến năm 2030, việc không tích hợp AI vào quy trình phát triển thuốc sẽ giống như không có email trong văn phòng. Đó sẽ không còn là một lựa chọn nữa."
AI trong khám phá thuốc qua các con số — Thị trường tăng trưởng mạnh và kết quả lâm sàng
Những con số về khám phá thuốc bằng AI cho thấy sự tăng trưởng bùng nổ của lĩnh vực này.
Thị trường khám phá thuốc bằng AI dự kiến tăng từ khoảng 2,5 tỷ USD (khoảng 375 tỷ yên) vào năm 2024 lên 10–12 tỷ USD (khoảng 1,5–1,8 nghìn tỷ yên) vào năm 2030 (CAGR 24–28%, Precedence Research). Thị trường AI trong ngành dược theo nghĩa rộng hơn cũng được ước tính vượt 20 tỷ USD vào năm 2032 (Grand View Research).
Tiến độ lâm sàng của các phân tử được khám phá bằng AI đang tăng tốc. Tính đến đầu năm 2025, có hơn 50 phân tử trong Giai đoạn I, 15–20 phân tử trong Giai đoạn II, và 2–3 phân tử trong Giai đoạn III đang trong quá trình thử nghiệm lâm sàng. Sự phê duyệt FDA đầu tiên được kỳ vọng vào năm 2026–2028. Chi phí giải trình tự toàn bộ hệ gen đã giảm xuống còn khoảng 200 USD (so với 3 tỷ USD của Dự án Bộ gen người). Thị trường ngân hàng sinh học dự kiến mở rộng từ khoảng 3,5–4 tỷ USD (khoảng 525–600 tỷ yên) vào năm 2024 lên 6–7 tỷ USD (khoảng 900 tỷ – 1,05 nghìn tỷ yên) vào năm 2030.
Xu hướng tại Nhật Bản — Giao điểm giữa Ngân hàng sinh học và AI Dược phẩm
Nhật Bản là một nhân tố quan trọng trong cả lĩnh vực hạ tầng ngân hàng sinh học (biobank) lẫn khám phá thuốc bằng AI.
BioBank Japan với khoảng 270.000 người tham gia và 47 bệnh mục tiêu là nguồn tài nguyên không thể thiếu để hiểu cấu trúc di truyền của quần thể Đông Á. Dự án cũng đóng góp vào các phân tích liên kết toàn bộ hệ gen xuyên sắc tộc (trans-ethnic GWAS) cùng với UK Biobank và All of Us.
Ngân hàng Sinh học Megabank Tohoku (ToMMo) được thành lập như một dự án phục hồi sau thảm họa động đất và sóng thần Đông Nhật Bản năm 2011, với khoảng 150.000 người tham gia. Bảng tham chiếu hệ gen người Nhật (3.5KJPNv2/8.3KJPN) là công cụ không thể thiếu cho các nghiên cứu hệ gen đặc thù của quần thể người Nhật.
Chính phủ Nhật Bản đặt mục tiêu giải trình tự hơn 100.000 hệ gen ung thư trong "Chiến lược Triển khai Y tế Hệ gen" (xây dựng năm 2019, cập nhật năm 2023), trong khi AMED (Cơ quan Nghiên cứu và Phát triển Y tế Nhật Bản) hỗ trợ nghiên cứu khám phá thuốc với ngân sách khoảng 400 tỷ yên mỗi năm.
Preferred Networks (PFN) hợp tác với Daiichi Sankyo và AMED trong lĩnh vực khám phá thuốc bằng AI, với thế mạnh về học sâu trong mô phỏng phân tử. Đây là startup AI lớn nhất Nhật Bản với định giá vượt 3,5 tỷ đô la.
Thách thức — Rào cản đằng sau sự lạc quan
Tương lai của việc phát triển thuốc bằng AI rất sáng sủa, nhưng vẫn còn những thách thức quan trọng.
Sai lệch dữ liệu là mối lo ngại lớn nhất. Khoảng 78% người tham gia GWAS có nguồn gốc châu Âu (tính đến năm 2023, đang được cải thiện), và những người tham gia UK Biobank có xu hướng khỏe mạnh hơn, giàu có hơn và là người da trắng nhiều hơn so với mức trung bình của Vương quốc Anh. Dữ liệu tổng hợp có thể truyền bá và khuếch đại các sai lệch có trong dữ liệu huấn luyện.
Sự không chắc chắn về quy định cũng là một vấn đề. Tính đến đầu năm 2026, vẫn chưa có sự chấp thuận hoàn toàn của FDA/EMA đối với bất kỳ loại thuốc nào được phát hiện bằng AI. FDA đã công bố các khung hướng dẫn, nhưng con đường quy định dành riêng cho thuốc được phát hiện bằng AI vẫn chưa được thiết lập.
Xác nhận dữ liệu tổng hợp cũng là một thách thức. Làm thế nào để chứng minh rằng dữ liệu tổng hợp phản ánh chính xác sinh học thực tế? Có nguy cơ các mô hình "ảo giác" — các tạo phẩm thống kê — xuất hiện trong dữ liệu tổng hợp.
Tích hợp với ngành dược phẩm truyền thống cũng không hề dễ dàng. Các dự đoán của AI cần được xác nhận trong phòng thí nghiệm ướt ("vấn đề dặm cuối"), và sự kháng cự văn hóa theo kiểu "chúng ta vẫn luôn làm theo cách này" vẫn còn rất dai dẳng.
Triển vọng tương lai — Tương lai của khám phá thuốc đang thay đổi
Các nhà lãnh đạo trong ngành thể hiện sự lạc quan đồng thuận hiếm có về tương lai của việc khám phá thuốc bằng AI.
2026–2028: Dự kiến sẽ có sự chấp thuận đầu tiên từ FDA dành cho thuốc được phát hiện bởi AI (ứng cử viên hàng đầu là INS018_055 hoặc các chương trình của Recursion/Exscientia). Khám phá thuốc bằng AI trở thành thực hành tiêu chuẩn tại các công ty dược phẩm lớn (McKinsey).
2028–2030: Các mô hình nền tảng trong sinh học đạt đến "thời điểm GPT-3" — AI sinh học đa năng có thể được tinh chỉnh cho bất kỳ nhiệm vụ khám phá thuốc nào. Việc tích hợp dữ liệu thực tế từ ngân hàng sinh học, dữ liệu tổng hợp và các mô hình AI trở thành quy trình vận hành tiêu chuẩn trong R&D dược phẩm.
2032–2035: Tiến trình khám phá thuốc được rút ngắn xuống còn 3–5 năm đối với nhiều bệnh lý, với chi phí giảm 50–70%. Thuốc điều trị bệnh hiếm gặp trở nên khả thi về mặt kinh tế (hiện tại, khoảng 95% trong số hơn 7.000 bệnh hiếm gặp chưa có thuốc được phê duyệt).
CEO Alex Zhavoronkov của Insilico Medicine phát biểu: "Chúng tôi đã chứng minh rằng AI có thể khám phá và thiết kế thuốc. Vấn đề không còn là 'liệu có thể hay không' mà là 'có thể mở rộng quy mô nhanh đến mức nào'." Ngày có câu trả lời cho điều đó không còn xa nữa.
Tác động đến ngành công nghiệp
Thứ nhất, sự kết hợp giữa ngân hàng sinh học (biobank) và dữ liệu tổng hợp đang dần phá vỡ một cách có hệ thống "bức tường dữ liệu" trong lĩnh vực phát triển thuốc. Dữ liệu thực tế từ UK Biobank (500.000 người, hoàn thành toàn bộ WGS), All of Us (hơn 800.000 người, đa dạng trên 50%) và BioBank Japan (270.000 người) cung cấp "sự thật nền tảng", trong khi dữ liệu tổng hợp vượt qua các hạn chế về quyền riêng tư và tính hiếm gặp. Phát hiện rằng tỷ lệ thành công lâm sàng của các mục tiêu thuốc có cơ sở di truyền cao gấp 2 đến 2,6 lần đã củng cố tính hợp lý kinh tế của sự kết hợp này.
Thứ hai, AI trong phát triển thuốc không còn dừng lại ở giai đoạn "chứng minh khái niệm" mà đã bước vào giai đoạn "chứng minh lâm sàng". Hơn 100 phân tử được khám phá bởi AI đang trong quá trình thử nghiệm lâm sàng, và sự phê duyệt đầu tiên từ FDA được kỳ vọng vào giai đoạn 2026–2028. Hợp đồng trị giá tổng cộng 2,9 tỷ USD của Isomorphic Labs với các tập đoàn dược phẩm lớn, cùng vòng gọi vốn thành lập trên 1 tỷ USD của Xaira Therapeutics, cho thấy mức độ tin tưởng sâu sắc vào lĩnh vực này.
Thứ ba, việc Hassabis, Jumper và Baker nhận giải Nobel Hóa học đánh dấu sự hội tụ của AI và sinh học đã được công nhận ở cấp độ học thuật cao nhất. Kiến trúc khuếch tán của AlphaFold 3 có khả năng ứng dụng trực tiếp vào phát triển thuốc, và cùng với các mô hình sinh tạo như RFdiffusion, Chroma..., kỷ nguyên "thiết kế phân tử từ con số không" đang trở thành hiện thực.
Thứ tư, nhờ sự hiện diện của BioBank Japan, ToMMo, AMED và PFN, Nhật Bản nắm giữ một vị thế độc đáo tại giao điểm giữa hệ gen học quần thể Đông Á và AI trong phát triển thuốc. Các quan hệ đối tác AI của Takeda, Daiichi Sankyo và Sumitomo Pharma cho thấy ngành dược phẩm Nhật Bản đang tích cực tham gia vào cuộc chuyển đổi này.
Tài liệu tham khảo: Tufts CSDD Drug Development Cost Study (2020), BIO/QLS Advisors Clinical Trial Success Rates (2021), IQVIA Global R&D Spending Report (2024), Eroom's Law (Scannell et al., Nature Reviews Drug Discovery, 2012), UK Biobank Open Access Data, NIH All of Us Research Program, BioBank Japan/RIKEN, FinnGen Public-Private Partnership, deCODE Genetics/Amgen, Nelson et al. "The support of human genetic evidence for approved drug indications" (Nature Genetics, 2015), King et al. update (2019), Recursion-Exscientia Merger Announcement (Aug 2024), Insilico INS018_055 Phase II Results, Isomorphic Labs-Lilly-Novartis Deals (Jan 2024), Xaira Therapeutics $1B+ Launch, AlphaFold 3 Release (May 2024), Nobel Prize Chemistry 2024, Generate Biomedicines Chroma (Nature 2023), Absci Zero-Shot Antibody Design (Nature Biotechnology 2023), RFdiffusion (Nature 2023), Evo Model (Arc Institute 2024), Unlearn.AI FDA Guidance, Syntegra/MDClone/Gretel.ai/Datavant Company Data, a16z Bio Fund, Flagship Pioneering, ARCH Venture Partners, PitchBook/BioCentury AI Drug Discovery Funding Data, NVIDIA BioNeMo, Jensen Huang GTC 2024, Demis Hassabis Nobel Lecture, David Baker Nobel Lecture, Daphne Koller a16z Podcast (2023), Eric Topol "Ground Truths" Substack, Patrick Collison Arc Institute, Precedence Research AI Drug Discovery Market, Grand View Research, ToMMo Japanese Reference Genome, AMED Budget Data, Preferred Networks/Daiichi Sankyo Partnership, Takeda Digital Transformation, Sumitomo Pharma/Exscientia DSP-1181