Trí tuệ nhân tạo được đào tạo trên ADN của linh trưởng dự đoán rủi ro bệnh gen cho con người
Một nhóm các nhà nghiên cứu quốc tế đã làm sáng tỏ thêm về các biến thể gen gây ra bệnh tật cho con người bằng cách phân tích dữ liệu ADN của linh trưởng với một thuật toán trí tuệ nhân tạo mới.
Ban đầu, các nhà khoa học đã giải mã hơn 800 mẫu cá nhân từ 233 loài linh trưởng không phải của con người, đại diện cho tất cả 16 họ, từ linh lùn đến linh gorilla. Để giải thích dữ liệu, họ phát triển một thuật toán mới: PrimateAI-3D.
PrimateAI-3D được xây dựng trên các kiến trúc ngôn ngữ học sâu tương tự như các mô hình sử dụng trong ChatGPT, nhưng được thiết kế để mô phỏng chuỗi gen hơn là chuỗi ngôn ngữ. Nhóm đã sử dụng tư duy tự nhiên để đào tạo các tham số của nó, bằng cách trình bày nó với các biến đổi được loại trừ cho bệnh tật ở họ hàng linh trưởng của chúng ta. Như vậy, thuật toán đã học cách nhận biết các biến thể gen lành mạnh và, thông qua quá trình loại trừ, những biến thể gây ra bệnh.
Sau đó, các nhà khoa học áp dụng PrimateAI-3D để xác định các biến đổi có thể gây hại cho con người, sử dụng hồ sơ sức khỏe và dữ liệu biến thể gen của hơn 400 người đã hiến mẫu cho dự án UK Biobank. Họ phát hiện thuật toán đã cho thấy "sự cải thiện ấn tượng" trong việc dự đoán rủi ro gen tăng cao của con người đối với các bệnh thông thường.
Khả năng được tuyên bố của phương pháp nhận diện các biến đổi gây bệnh chính xác hơn so với các kỹ thuật hiện tại cũng liên quan đến việc nó có thể vượt qua độ chệch di truyền từ dòng họ trắng Châu Âu.
“Mặc dù có 8 tỷ người, độ đa dạng gen của chúng ta vẫn giống như dân số gốc của 10,000 tổ tiên chung mà chúng ta đều bắt nguồn từ,” nói Kyle Farh, đồng tác giả của nghiên cứu và Phó Chủ tịch Trí tuệ Nhân tạo tại công ty hợp tác Illumina.
“Đơn giản là không có đủ thông tin để rút ra từ loài người. Điều này trở nên rõ ràng vài năm trước rằng, để thực sự hiểu rõ gen con người, dữ liệu chứa trong việc giải mã gen của loài người không đủ,” ông thêm.
Kết hợp dữ liệu của người và linh trưởng không phải của con người là chìa khóa quan trọng, đặc biệt là khi linh trưởng sống chung với hơn 90% ADN giống nhau. Nghiên cứu từ Illumina đã chỉ ra rằng nếu một biến thể gen được chấp nhận bởi sự lựa chọn tự nhiên ở linh trưởng khác, khả năng gây bệnh cho con người là 99% không có.
Các kết quả của nghiên cứu có thể được sử dụng để hỗ trợ nghiên cứu sức khỏe, như giúp các nhà khoa học ưu tiên các biến thể có khả năng gây rủi ro nhất cho con người. Chúng cũng có thể giúp bảo tồn các quần thể linh trưởng khác.
“Tôi nghĩ chúng ta chỉ mới ở đầu đường. Có rất nhiều điều có thể được học từ đây. Và ý tưởng rằng bạn có thể tìm hiểu thêm về loài của chúng ta từ các loài khác, theo tôi, là một ý tưởng rất lãng mạn,” Kyle Farh lưu ý.
Toàn bộ nghiên cứu được công bố trên tạp chí Science.
