Một mô hình trí tuệ nhân tạo (AI) mới có khả năng phát hiện 13 loại ung thư khác nhau với độ chính xác 98,2% chỉ từ dữ liệu DNA từ các mẫu mô, theo nghiên cứu mới.
Mô hình AI này, gọi là EMethylNET, được phát triển bởi nhóm nghiên cứu tại Đại học Cambridge ở Anh, giúp tăng tốc quá trình phát hiện sớm, chẩn đoán và điều trị ung thư.
Các phát hiện này đã được công bố trên tạp chí Biology Methods and Protocols tuần trước, tập trung vào quá trình methyl hóa DNA, một quá trình hóa học xảy ra sớm trong quá trình phát triển của tế bào, bao gồm cả tế bào ung thư. Các nhà nghiên cứu đã huấn luyện mô hình máy học để nhận diện các cấu trúc và con đường hình thành ung thư từ sớm.
“Ung thư, một nhóm gồm hơn hai trăm bệnh khác nhau, tiếp tục là nguyên nhân hàng đầu gây bệnh và tử vong trên toàn cầu,” nghiên cứu lưu ý. “Thường được phát hiện ở giai đoạn tiến triển, ung thư di căn chiếm 90% số ca tử vong do bệnh này.”
“Do đó, phát hiện sớm ung thư – phối hợp với các phương pháp hiện tại – sẽ có tác động quan trọng đến tỷ lệ sống sót và điều trị các loại ung thư khác nhau,” nghiên cứu tiếp tục.
Các nhà nghiên cứu đã đào tạo EMethylNET trên dữ liệu từ hơn 6.000 mẫu mô từ The Cancer Genome Atlas, đại diện cho 13 loại ung thư như ung thư vú, phổi và đại trực tràng. Sau đó, họ thử nghiệm mô hình AI này trên hơn 900 mẫu từ các tập dữ liệu độc lập.
Kết quả nổi bật là độ chính xác hơn 98% trong việc phân loại 13 loại ung thư và các mẫu không phải ung thư. Nghiên cứu cũng nhấn mạnh rằng phương pháp này hoạt động tốt trên các tập dữ liệu đa dạng từ các quốc gia khác nhau. Các nhà nghiên cứu cũng xác định được 3.388 vị trí methyl hóa liên quan đến các gen và con đường liên quan đến ung thư.
Theo nghiên cứu, mô hình AI này kết hợp hai phương pháp AI: XGBoost, lựa chọn các đặc điểm có liên quan, và mạng nơ-ron sâu để phân loại. Điều này không chỉ giúp mô hình phát hiện ung thư một cách chính xác mà còn cung cấp những hiểu biết về sự điều chỉnh của cơ thể đối với các yếu tố phi di truyền biến đổi tế bào bình thường thành tế bào ung thư.
Ảnh: Tổng quan về phương pháp. Dữ liệu microarray methyl hóa DNA từ 13 loại ung thư và các mẫu mô bình thường tương ứng đã được thu thập từ TCGA và tiền xử lý. Đối với các nhiệm vụ phân loại nhị phân và đa lớp, ba loại mô hình đã được huấn luyện: Mô hình đơn giản (hồi quy logistic và máy vector hỗ trợ), XGBoost, và EMethylNET, một mô hình kết hợp XGBoost và Mạng Nơ-ron Sâu. Sau đó, các mô hình đã được đánh giá trên các bộ dữ liệu độc lập và một phân tích các đặc điểm được sử dụng trong phân loại đã được thực hiện.
“Các biến đổi epigenetic này là một trong những sự kiện tân sinh sớm nhất liên quan đến sự sinh ung thư,” nghiên cứu lưu ý, củng cố tiềm năng của phương pháp này trong phát hiện sớm ung thư.
Mặc dù nghiên cứu ban đầu này hứa hẹn rất nhiều, các tác giả cảnh báo rằng công nghệ này cần được nghiên cứu và thử nghiệm thêm trước khi áp dụng vào lâm sàng. Nhóm nghiên cứu cho biết họ đang nghiên cứu điều chỉnh mô hình này cho các mẫu mô lỏng, có thể sử dụng để sàng lọc ung thư sớm không xâm lấn.
“Tùy thuộc vào sự sẵn có của dữ liệu huấn luyện, phương pháp này có thể mở rộng để phát hiện hàng trăm loại ung thư,” báo cáo khẳng định.
Khi AI tiếp tục tiến vào lĩnh vực chăm sóc sức khỏe, EMethylNET đại diện cho một bước tiến quan trọng trong việc áp dụng máy học để chẩn đoán ung thư sớm và chính xác hơn. Những đổi mới như vậy có thể có tác động sâu rộng đối với sức khỏe cộng đồng.
Hơn 19 triệu ca ung thư mới được chẩn đoán và 10 triệu ca tử vong do ung thư xảy ra hàng năm, theo ước tính mới nhất từ Cơ quan Quốc tế Nghiên cứu về Ung thư.
Theo Decrypt