
Trí tuệ nhân tạo hứa hẹn có thể chẩn đoán một cách chuyên nghiệp các bệnh trong hình ảnh y học và cắt lớp. Tuy nhiên, một cái nhìn kỹ lưỡng vào dữ liệu được sử dụng để huấn luyện thuật toán cho việc chẩn đoán các vấn đề về mắt gợi ra rằng những công cụ mới mạnh mẽ này có thể duy trì những bất bình đẳng về sức khỏe.
Một nhóm nghiên cứu tại Anh đã phân tích 94 bộ dữ liệu—với hơn 500,000 hình ảnh—thường được sử dụng để huấn luyện thuật toán trí tuệ nhân tạo để phát hiện bệnh mắt. Họ phát hiện gần như tất cả dữ liệu đều đến từ bệnh nhân ở Bắc Mỹ, Châu Âu và Trung Quốc. Chỉ có bốn bộ dữ liệu từ Nam Á, hai từ Nam Mỹ và một từ châu Phi; không có bộ dữ liệu nào đến từ châu Đại Dương.
Sự chênh lệch trong nguồn gốc của những hình ảnh mắt này có nghĩa là thuật toán kiểm tra mắt trí tuệ nhân tạo ít chắc chắn hoạt động tốt đối với các nhóm chủng tộc từ các quốc gia ít được đại diện, theo Xiaoxuan Liu, một bác sĩ nhãn khoa và nhà nghiên cứu tại Đại học Birmingham tham gia vào nghiên cứu. “Ngay cả khi có sự thay đổi rất tinh subtil về căn bệnh ở một số quốc gia, trí tuệ nhân tạo có thể thất bại một cách nghiêm trọng,” cô nói.
Hiệp Hội Mắt Học Mỹ đã tỏ lòng hăng hái với các công cụ Trí Tuệ Nhân Tạo, mà họ cho rằng hứa hẹn giúp cải thiện tiêu chuẩn chăm sóc. Nhưng Liu nói rằng các bác sĩ có thể miễn cưỡng khi sử dụng các công cụ như vậy cho các dân tộc thiểu số nếu họ biết rằng chúng được xây dựng từ việc nghiên cứu chủ yếu trên bệnh nhân da trắng. Cô lưu ý rằng các thuật toán có thể thất bại do những khác biệt quá tinh subtil mà bác sĩ thậm chí còn không thể nhận biết được.
Các nhà nghiên cứu còn phát hiện ra các vấn đề khác trong dữ liệu. Nhiều bộ dữ liệu không bao gồm thông tin dân số chủ chốt như tuổi tác, giới tính và chủng tộc, làm cho việc đánh giá xem chúng có thiên vị theo cách khác không dễ dàng. Các bộ dữ liệu cũng thường được tạo ra xung quanh chỉ vài căn bệnh: đau mắt đen, biến chứng mạch máu đái tháo đường và suy giảm vùng trung tâm của võng mạc theo tuổi tác. Bốn mươi sáu bộ dữ liệu đã được sử dụng để huấn luyện các thuật toán nhưng không cung cấp dữ liệu.
Cục Quản lý Thực phẩm và Dược phẩm Hoa Kỳ đã phê duyệt một số sản phẩm hình ảnh Trí Tuệ Nhân Tạo trong vài năm gần đây, bao gồm hai công cụ Trí Tuệ Nhân Tạo cho mắt học. Liu nói rằng các công ty đằng sau các thuật toán này thường không cung cấp chi tiết về cách chúng được huấn luyện. Cô và các tác giả đồng sáng lập của cô kêu gọi các cơ quan quản lý xem xét đa dạng của dữ liệu huấn luyện khi kiểm tra các công cụ Trí Tuệ Nhân Tạo.
Sự thiên vị được phát hiện trong các bộ dữ liệu hình ảnh mắt có nghĩa là các thuật toán được huấn luyện trên dữ liệu đó ít có khả năng hoạt động đúng ở Châu Phi, Châu Mỹ Latinh hoặc Đông Nam Á. Điều này sẽ làm suy yếu một trong những lợi ích lớn được cho là của việc chẩn đoán Trí Tuệ Nhân Tạo: khả năng mang chuyên môn y khoa tự động đến các khu vực nghèo nàn nơi nó đang thiếu hụt.
“Bạn đang nhận được một sáng kiến chỉ có lợi cho một số phần của một số nhóm người,” Liu nói. “Nó giống như có một Google Maps không đi vào một số mã bưu điện cụ thể.”
Sự thiếu đa dạng được tìm thấy trong các hình ảnh mắt, mà các nhà nghiên cứu gọi là “nghèo về dữ liệu,” có khả năng ảnh hưởng đến nhiều thuật toán Trí Tuệ Nhân Tạo y tế.
Amit Kaushal, giáo sư trợ giảng y học tại Đại học Stanford, là một phần của một nhóm nghiên cứu phân tích 74 nghiên cứu liên quan đến việc sử dụng Trí Tuệ Nhân Tạo trong y khoa, trong đó có 56 nghiên cứu sử dụng dữ liệu từ bệnh nhân Mỹ. Họ phát hiện ra rằng hầu hết dữ liệu Mỹ đến từ ba tiểu bang—California (22), New York (15) và Massachusetts (14).

“Khi các nhóm dân số bị loại trừ một cách có hệ thống khỏi dữ liệu huấn luyện Trí Tuệ Nhân Tạo, các thuật toán Trí Tuệ Nhân Tạo sẽ có xu hướng hoạt động kém hơn đối với những nhóm bị loại trừ đó,” Kaushal nói. “Các vấn đề mà các nhóm dân số thiểu số đang phải đối mặt có thể không được nghiên cứu bởi các nhà nghiên cứu Trí Tuệ Nhân Tạo do thiếu dữ liệu có sẵn.”
Ông nói rằng giải pháp là làm cho các nhà nghiên cứu Trí Tuệ Nhân Tạo và bác sĩ nhận thức về vấn đề này, để họ tìm kiếm các bộ dữ liệu đa dạng hơn. “Chúng ta cần tạo ra một cơ sở hạ tầng kỹ thuật cho phép truy cập vào các bộ dữ liệu đa dạng cho nghiên cứu Trí Tuệ Nhân Tạo, và một môi trường quy định hỗ trợ và bảo vệ việc sử dụng dữ liệu này trong nghiên cứu,” ông nói.
Vikash Gupta, một nhà khoa học nghiên cứu tại Mayo Clinic ở Florida làm việc về việc sử dụng Trí Tuệ Nhân Tạo trong chẩn đoán hình ảnh, nói rằng việc đơn giản chỉ việc thêm vào các bộ dữ liệu đa dạng có thể loại bỏ thiên vị. “Hiện tại khó có thể nói làm thế nào để giải quyết vấn đề này,” ông nói.
Tuy nhiên, trong một số tình huống, Gupta nói rằng việc một thuật toán tập trung vào một phần của dân số có thể hữu ích, ví dụ khi chẩn đoán một căn bệnh ảnh hưởng không cân đối đến nhóm đó.
Bác sĩ mắt kính Liu hy vọng sẽ có sự đa dạng lớn hơn trong dữ liệu huấn luyện Trí Tuệ Nhân Tạo y tế khi công nghệ này trở nên phổ biến hơn. “Sau mười năm, khi chúng ta sử dụng Trí Tuệ Nhân Tạo để chẩn đoán bệnh, nếu tôi đối diện với một bệnh nhân da màu hơn, tôi không muốn nói ‘Xin lỗi, nhưng tôi phải đưa cho bạn một liệu pháp khác, vì cái này không hoạt động với bạn,’” cô nói.
Những câu chuyện tuyệt vời hơn từ Mytour
- 📩 Muốn cập nhật tin tức về công nghệ, khoa học và hơn thế nữa? Đăng ký nhận bản tin của chúng tôi!
- Kế hoạch của YouTube để làm im lặng các lý thuyết âm mưu
- Một loại virus thực vật phổ biến trở thành đồng minh không tưởng trong cuộc chiến chống lại ung thư
- Làm thế nào công việc trở thành một hang hốc không thể trốn thoát
- Bây giờ là thời điểm tuyệt vời để thử 5 sản phẩm kinh nguyệt này
- Bản tin đỉnh điểm? Đó là cách đây 80 năm
- 🎮 Mytour Games: Nhận các mẹo mới nhất, đánh giá và hơn thế nữa
- 💻 Nâng cấp trò chơi làm việc của bạn với những chiếc laptop, bàn phím, các lựa chọn nhập liệu và tai nghe chống ồn yêu thích của đội ngũ Gear của chúng tôi
