Dựa vào khối lượng thông tin hiện có trong các cơ sở dữ liệu, công cụ AI của Trung Quốc đã phát hiện gần 162.000 virus RNA mới với tốc độ kỷ lục.
Theo SCMP, nhờ vào dữ liệu có sẵn, một công cụ trí tuệ nhân tạo (AI) của Trung Quốc đã hỗ trợ các nhà khoa học trong việc phát hiện gần 162.000 virus RNA chưa được biết đến với tốc độ nhanh chóng - một loài mỗi giây.
Nghiên cứu này được thực hiện bởi các nhà khoa học từ Trung Quốc đại lục, Hong Kong và Australia.

Các nhà khoa học đã phát hiện gần 162.000 loại virus RNA mới nhờ vào công cụ AI của Trung Quốc. (Ảnh: SCMP)
Nhóm nghiên cứu cho biết gần 162.000 virus RNA mới được tìm thấy trong nhiều môi trường khác nhau, như khí quyển, suối nước nóng và lỗ thông thủy nhiệt, thể hiện sự đa dạng và khả năng sống sót của chúng trong điều kiện khắc nghiệt, đồng thời cung cấp thông tin về cách các virus và sinh vật nguyên thủy khác hình thành.
Thông qua việc phân tích dữ liệu trình tự gene chưa được nhận diện trong các cơ sở dữ liệu công cộng, công cụ AI đã xác định virus dựa trên trình tự và thông tin cấu trúc protein mà virus RNA sử dụng để sao chép.
Công cụ này được phát triển dựa trên một thuật toán do đội ngũ Alibaba Cloud Intelligence thiết kế, với sự tư vấn từ các chuyên gia virus học.
Trong bài báo được công bố trên tạp chí Cell vào ngày 10/10, nhóm nghiên cứu đã chia sẻ: "Chúng tôi đã xây dựng một mô hình học sâu dựa trên dữ liệu, vượt trội hơn so với các phương pháp truyền thống về độ chính xác, hiệu quả, và quan trọng nhất là khả năng phát hiện đa dạng virus".
Nhóm nghiên cứu khẳng định đây là báo cáo lớn nhất về việc phát hiện virus mới với số lượng loài được công bố.
Shi Mang, trưởng nhóm nghiên cứu và là giáo sư virus học tại Học viện Y khoa Đại học Trung Sơn (Quảng Đông, Trung Quốc), cho biết công cụ AI này không chỉ giúp rút ngắn thời gian phát hiện virus, vốn mất nhiều thời gian khi dùng phương pháp truyền thống, mà còn mở ra cơ hội cho các nhà khoa học khám phá những lĩnh vực virus chưa từng được biết đến.
“Tất cả các loại virus được phát hiện trong nghiên cứu này đều có mặt trong môi trường và đã được giải trình tự. Các phương pháp trước đây không thể nhận diện được chúng, khiến chúng trở thành 'vật chất tối' đối với các nhà khoa học” , ông Shi cho biết, nhấn mạnh đến những trình tự không thể phân lập trước đây hoặc được phát hiện có liên quan đến virus đã biết.
Giáo sư cũng cho biết thêm: “Công cụ AI giúp giải quyết vấn đề này với độ chính xác cao, tương đương với các phương pháp sinh học tin học truyền thống. Nó có khả năng khám phá các chuỗi 'vật chất tối', cùng với những trình tự gần gũi hơn với các nhóm virus đã được xác lập”.
Ông Shi chia sẻ rằng phát hiện này sẽ thúc đẩy các nghiên cứu trong tương lai bằng cách thiết lập nền tảng cho sự đa dạng của virus. "Ví dụ, nghiên cứu này cung cấp thông tin về sự tồn tại của virus trong những điều kiện khắc nghiệt, như suối nước nóng. Kiến thức này cho phép các nhà khoa học xây dựng những mô tả toàn diện hơn về sinh thái trong các hệ sinh thái khác nhau”.
Nhà virus học đã chia sẻ thêm: "Về khả năng gây bệnh của virus, chúng ta có thể tiến hành nghiên cứu sâu hơn về cách mà virus tương tác với vật chủ, cũng như xác định các nhóm virus có khả năng lây nhiễm cho từng vật chủ cụ thể".
Li Zhaorong, đồng tác giả và chuyên gia nghiên cứu sinh học tính toán tại Phòng thí nghiệm Apsara của Alibaba Cloud Intelligence, cho biết nghiên cứu này đã chứng minh rằng thuật toán học sâu có thể thực hiện một cách hiệu quả các nhiệm vụ trong việc khám phá sinh học.
Ông Li cho biết nhóm nghiên cứu sẽ tiếp tục cập nhật công cụ với những công nghệ AI tiên tiến, bao gồm các mô hình đào tạo mới nhằm phân tích nucleotide và protein.
“Chúng tôi cũng đang xem xét lại những vấn đề cơ bản trong virus học thông qua tư duy AI và dữ liệu mới, chẳng hạn như cấu trúc và chức năng của virus, cũng như mối quan hệ giữa virus với con người và động vật” , ông Li cho biết.
Nhóm nghiên cứu kỳ vọng rằng các phương pháp tương tự có thể được áp dụng để xác định vi khuẩn và ký sinh trùng.
