Hệ thống học sâu mới của Google có thể giúp các chuyên gia xem mảnh X-quang
Bạn có biết Neural đang xuất hiện trong mùa thu này? Cùng với đội ngũ chuyên gia tuyệt vời, chúng tôi sẽ khám phá tương lai của trí tuệ nhân tạo trong khuôn khổ Hội nghị TNW 2021. Đặt vé của bạn ngay bây giờ!
Học sâu có thể phát hiện các mảnh X-quang ngực bất thường với độ chính xác ngang bằng với các chuyên gia chẩn đoán hình ảnh chuyên nghiệp, theo một bài báo mới của một nhóm nghiên cứu trí tuệ nhân tạo tại Google, được công bố trên tạp chí khoa học đồng nghiệp Nature.
Hệ thống học sâu có thể giúp các chuyên gia xem mảnh X-quang ngực ưu tiên, đồng thời có thể phục vụ như một công cụ phản ứng đầu tiên trong các tình huống khẩn cấp nơi chuyên gia chẩn đoán kinh nghiệm không có sẵn. Những kết quả cho thấy rằng, trong khi học sâu chưa thể thay thế các chuyên gia chẩn đoán hình ảnh, nó có thể giúp tăng cường năng suất của họ trong bối cảnh thế giới đang đối mặt với tình trạng thiếu hụt nghiêm trọng về các chuyên gia y tế.
Bài báo cũng cho thấy cộng đồng nghiên cứu trí tuệ nhân tạo đã đi xa đến đâu trong việc xây dựng quy trình có thể giảm thiểu các rủi ro của các mô hình học sâu và tạo ra công việc có thể được phát triển thêm trong tương lai.
Tìm kiếm mảnh X-quang ngực bất thường
Sự tiến bộ trong phân tích hình ảnh y học được đẩy mạnh bởi trí tuệ nhân tạo là không thể phủ nhận. Hiện nay có hàng chục hệ thống học sâu cho hình ảnh y tế đã nhận được sự chấp thuận chính thức từ FDA và các cơ quan quản lý khác trên khắp thế giới.
Nhưng vấn đề của hầu hết các mô hình này là chúng đã được huấn luyện cho một nhiệm vụ rất hẹp, chẳng hạn như tìm kiếm dấu vết của một bệnh và các điều kiện cụ thể trong hình ảnh X-quang. Do đó, chúng chỉ hữu ích trong những trường hợp mà chuyên gia chẩn đoán hình ảnh biết phải tìm gì.
Tuy nhiên, các chuyên gia chẩn đoán hình ảnh không nhất thiết phải bắt đầu bằng việc tìm kiếm một bệnh cụ thể. Và xây dựng một hệ thống có thể phát hiện mọi bệnh có thể là rất khó khăn, thậm chí "nếu không thể.
“Dải rộng của các tình trạng CXR [chụp X-quang ngực] có thể gây ra khiến việc phát hiện mọi tình trạng có thể trở nên không thực tế bằng cách xây dựng nhiều hệ thống riêng biệt, mỗi hệ thống phát hiện một hoặc nhiều điều kiện được xác định trước,” các nhà nghiên cứu trí tuệ nhân tạo của Google viết trong bài báo của họ.
Giải pháp của họ là tạo ra một hệ thống học sâu nhận diện liệu phòng ngực có bình thường hay chứa các kết quả có thể điều trị lâm sàng. Việc xác định lĩnh vực vấn đề cho các hệ thống học sâu là hành động tìm kiếm sự cân bằng giữa đặc thù và khả năng tổng quát hóa. Ở một đầu của phổ là các mô hình học sâu có thể thực hiện các nhiệm vụ rất hẹp (ví dụ, phát hiện viêm phổi hoặc gãy xương) nhưng với chi phí không tổng quát hóa cho các nhiệm vụ khác (ví dụ, phát hiện lao). Và ở đầu kia là các hệ thống có thể giải quyết câu hỏi tổng quát hơn (ví dụ, liệu bức ảnh X-quang này có bình thường hay cần phải kiểm tra thêm không?) nhưng không thể giải quyết các vấn đề cụ thể hơn.

Trực giác của các nhà nghiên cứu của Google là việc phát hiện tình trạng bất thường có thể ảnh hưởng lớn đến công việc của các chuyên gia chẩn đoán hình ảnh, ngay cả khi mô hình huấn luyện không chỉ ra các bệnh cụ thể.
“Hệ thống AI đáng tin cậy để phân biệt giữa hình ảnh X-quang ngực bình thường và bất thường có thể đóng góp vào quá trình kiểm tra và quản lý bệnh nhân nhanh chóng,” những nhà nghiên cứu viết.
Ví dụ, một hệ thống như vậy có thể giúp giảm độ ưu tiên hoặc loại trừ các trường hợp bình thường, từ đó có thể làm nhanh chóng quá trình lâm sàng.
Mặc dù các nhà nghiên cứu của Google không cung cấp chi tiết chính xác về mô hình họ sử dụng, bài báo đề cập đến EfficientNet, một họ mô hình mạng nơ-ron tích chập (CNN) nổi tiếng vì đạt được độ chính xác hàng đầu trên các nhiệm vụ thị giác máy tính với chi phí tính toán chỉ là một phần nhỏ của các mô hình khác.
B7, mô hình được sử dụng cho việc phát hiện tình trạng bất thường trên tia X, là mô hình lớn nhất trong gia đình EfficientNet và bao gồm 813 lớp và 66 triệu tham số (tuy nhiên, có khả năng nhà nghiên cứu đã điều chỉnh kiến trúc dựa trên ứng dụng của họ). Thú vị là nhóm nghiên cứu không sử dụng bộ xử lý TPU của Google mà thay vào đó họ đã sử dụng 10 GPU Tesla V100 để huấn luyện mô hình.
Tránh độ chệch không cần thiết trong mô hình học sâu
Google’s AI researchers took several steps to make sure the deep learning system did not learn problematic biases.Có lẽ phần thú vị nhất của dự án của Google là công việc chăm chỉ được thực hiện để chuẩn bị tập dữ liệu huấn luyện và kiểm tra. Các kỹ sư học sâu thường phải đối mặt với thách thức của mô hình của họ nắm bắt các độ chệch sai lệch ẩn trong dữ liệu huấn luyện. Ví dụ, trong một trường hợp, một hệ thống học sâu để phát hiện ung thư da đã nhầm lẫn học cách phát hiện sự xuất hiện của các đánh dấu đo trên da. Trong những trường hợp khác, các mô hình có thể trở nên nhạy cảm đối với các yếu tố không liên quan, chẳng hạn như thương hiệu thiết bị được sử dụng để chụp ảnh. Và quan trọng hơn, là quan trọng một mô hình đã được huấn luyện có thể duy trì độ chính xác của nó trên các quần thể khác nhau.
Để đảm bảo rằng các độ chệch gây vấn đề không xâm phạm vào mô hình, nhà nghiên cứu đã sử dụng sáu bộ dữ liệu độc lập để huấn luyện và kiểm thử.
Mô hình học sâu đã được huấn luyện trên hơn 250,000 ảnh X-quang xuất phát từ năm bệnh viện ở Ấn Độ. Những ví dụ được đánh dấu là “bình thường” hoặc “bất thường” dựa trên thông tin trích xuất từ báo cáo kết quả.
Sau đó, mô hình được đánh giá bằng các ảnh X-quang ngực mới được thu thập từ bệnh viện ở Ấn Độ, Trung Quốc và Hoa Kỳ để đảm bảo nó có thể tổng quát hóa cho các khu vực khác nhau.
Dữ liệu kiểm thử cũng chứa các ảnh X-quang của hai bệnh không được bao gồm trong tập dữ liệu huấn luyện, là TB và Covid-19, để kiểm tra cách mô hình sẽ thực hiện trên các bệnh chưa được nhìn thấy.
Độ chính xác của các nhãn trong tập dữ liệu được xem xét và xác nhận độc lập bởi ba chuyên gia nghiên cứu hình ảnh y khoa.
Nhóm nghiên cứu đã công bố công khai các nhãn để hỗ trợ nghiên cứu sau này về mô hình học sâu cho chẩn đoán hình ảnh y khoa. “Để hỗ trợ sự phát triển tiếp tục của các mô hình AI cho chụp X ngực, chúng tôi công bố các nhãn bất thường so với bình thường từ 3 chuyên gia nghiên cứu hình ảnh y khoa (2430 nhãn trên 810 hình ảnh) cho tập kiểm thử CXR-14 công khai. Chúng tôi tin rằng điều này sẽ hữu ích cho công việc tương lai vì chất lượng nhãn là rất quan trọng đối với bất kỳ nghiên cứu AI nào trong lĩnh vực chăm sóc sức khỏe,” nhà nghiên cứu viết.
Mở rộng khả năng chẩn đoán của bác sĩ chuyên khoa hình ảnh với học sâu.
Lịch sử của hình ảnh y khoa đã trải qua những thăng trầm với học sâu.
Năm 2016, nhà nghiên cứu học sâu tiên phong Geoffrey Hinton nói, “Tôi nghĩ nếu bạn làm việc như một bác sĩ chuyên khoa hình ảnh, bạn giống như con chó sói đã đứng trên mép vách đá nhưng chưa nhìn xuống, nên nó vẫn chưa nhận ra không có mặt đất ở dưới. Mọi người nên ngừng đào tạo bác sĩ chuyên khoa hình ảnh ngay bây giờ. Hoàn toàn rõ ràng rằng trong vòng năm năm tới, học sâu sẽ làm tốt hơn bác sĩ chuyên khoa hình ảnh bởi vì nó sẽ có nhiều kinh nghiệm hơn. Có thể là mười năm, nhưng chúng ta đã có đủ nhiều bác sĩ chuyên khoa hình ảnh,”
Nhưng sau năm năm, trí tuệ nhân tạo không gần đâu xa việc đuổi bác sĩ chuyên khoa hình ảnh ra khỏi công việc của họ. Trên thực tế, trên toàn cầu vẫn đang có một tình trạng thiếu hụt nghiêm trọng về bác sĩ chuyên khoa hình ảnh, mặc dù số lượng bác sĩ chuyên khoa hình ảnh đã tăng lên. Và công việc của bác sĩ chuyên khoa hình ảnh không chỉ là nhìn vào ảnh X-quang.
Trong bài báo của họ, các nhà nghiên cứu Google lưu ý rằng mô hình học sâu của họ đã thành công trong việc phát hiện ảnh X-quang bất thường với độ chính xác có thể so sánh và đôi khi vượt trội so với bác sĩ chuyên khoa hình ảnh. Tuy nhiên, họ cũng chỉ ra rằng lợi ích thực sự của hệ thống này là khi nó được sử dụng để cải thiện năng suất của bác sĩchuyên khoa hình ảnh.
Để đánh giá hiệu suất của hệ thống học sâu, các nhà nghiên cứu đã thử nghiệm nó trong hai kịch bản mô phỏng, trong đó mô hình hỗ trợ bác sĩ chuyên khoa hình ảnh bằng cách giúp ưu tiên quét ảnh được xác định là bất thường hoặc loại bỏ quét ảnh được xác định là bình thường. Trong cả hai trường hợp, sự kết hợp của học sâu và bác sĩ chuyên khoa hình ảnh đã mang lại cải thiện đáng kể về thời gian xử lý.
“Dù triển khai trong một thực hành ngoại trú khỏe mạnh hoặc giữa một bối cảnh bận rộn đặc biệt trong hoặc ngoại trú, một hệ thống như vậy có thể giúp ưu tiên X-quang ngực bất thường để bác sĩ chuyên khoa hình ảnh có thể diễn giải một cách nhanh chóng,” các nhà nghiên cứu viết.
Được xuất bản ban đầu bởi Ben Dickson trên TechTalks, một bản tin nghiên cứu xu hướng công nghệ, cách chúng ảnh hưởng đến cách chúng ta sống và kinh doanh, cũng như những vấn đề mà chúng giải quyết. Nhưng chúng tôi cũng thảo luận về mặt tối của công nghệ, những hậu quả tăm tối của công nghệ mới và những điều chúng ta cần phải chú ý. Bạn có thể đọc bài viết gốc tại đây.
