Sinh viên khoa khoa học dữ liệu hiện nay hiếm khi hiểu rõ về đạo đức — và điều này là một vấn đề
Ý tưởng lớn
Đào tạo đại học cho những người khoa học dữ liệu – được đặt tên là nghề hot nhất của thế kỷ 21 theo đánh giá của Harvard Business Review – không đủ để chuẩn bị sinh viên cho việc sử dụng dữ liệu một cách đạo đức, nghiên cứu mới của chúng tôi đã phát hiện.
Khoa học dữ liệu nằm tại sự giao điểm của thống kê và khoa học máy tính áp dụng vào một lĩnh vực cụ thể như thiên văn học, ngôn ngữ học, y học, tâm lý học hoặc xã hội học. Ý tưởng đằng sau việc xử lý dữ liệu này là sử dụng dữ liệu lớn để giải quyết những vấn đề mà ngược lại là không thể giải quyết được, như cách các nhà cung cấp dịch vụ chăm sóc sức khỏe có thể tạo ra y học cá nhân dựa trên gene của bệnh nhân và làm thế nào doanh nghiệp có thể đưa ra dự đoán mua hàng dựa trên hành vi của khách hàng.
Cơ quan Thống kê lao động Hoa Kỳ dự đoán tăng trưởng 15% trong sự nghiệp khoa học dữ liệu trong giai đoạn từ 2019-2029, tương ứng với sự tăng cầu về đào tạo khoa học dữ liệu. Các trường đại học và cao đẳng đã đáp ứng theo nhu cầu bằng cách tạo ra các chương trình mới hoặc cải tiến những chương trình đã có. Số lượng chương trình đào tạo khoa học dữ liệu cho đại học tăng từ 13 vào năm 2014 lên ít nhất 50 vào tháng 9 năm 2020.
Là giáo viên và người hành nghề trong lĩnh vực khoa học dữ liệu, chúng tôi đã được kích thích bởi sự gia tăng về các chương trình để điều tra những điều được bao gồm, và những điều không được bao gồm, trong giáo dục đại học về khoa học dữ liệu.
Trong nghiên cứu của chúng tôi, chúng tôi so sánh các chương trình đào tạo khoa học dữ liệu đại học với mong đợi của đào tạo khoa học dữ liệu đại học đề xuất bởi Học viện Khoa học, Kỹ thuật và Y học Quốc gia. Những kỳ vọng đó bao gồm đào tạo về đạo đức. Chúng tôi phát hiện rằng hầu hết các chương trình đều dành nhiều chương trình học cho toán học, thống kê và khoa học máy tính, nhưng ít đào tạo về xem xét đạo đức như quyền riêng tư và độ chệch hệ thống. Chỉ có 50% trong số các chương trình học vụ mà chúng tôi nghiên cứu yêu cầu các chương trình học vụ về đạo đức.
Tại sao điều này quan trọng
Như với mọi công cụ mạnh mẽ, việc áp dụng có trách nhiệm của khoa học dữ liệu đòi hỏi sự đào tạo về cách sử dụng và hiểu rõ về tác động của nó. Kết quả của chúng tôi tương ứng với công việc trước đó đã phát hiện rằng có ít sự chú ý đến đạo đức trong các chương trình đào tạo khoa học dữ liệu. Điều này ngụ ý rằng các chương trình đào tạo khoa học dữ liệu đại học có thể tạo ra một lực lượng lao động mà không có đào tạo và sự đánh giá để áp dụng phương pháp khoa học dữ liệu một cách có trách nhiệm.
Không khó để tìm thấy các ví dụ về việc sử dụng không có trách nhiệm của khoa học dữ liệu. Ví dụ, mô hình cảnh sát có độ chệch dữ liệu tích hợp có thể dẫn đến sự hiện diện của cảnh sát tăng lên ở những khu vực đã từng bị quá đặc cư. Trong một ví dụ khác, các thuật toán được sử dụng bởi hệ thống chăm sóc sức khỏe ở Hoa Kỳ có độ chệch theo cách khiến bệnh nhân da màu nhận ít chăm sóc hơn so với bệnh nhân trắng có nhu cầu tương đương.
Chúng tôi tin rằng việc đào tạo rõ ràng về thực hành đạo đức sẽ chuẩn bị tốt hơn cho lực lượng lao động khoa học dữ liệu có trách nhiệm xã hội.
Những điều vẫn chưa biết
Mặc dù khoa học dữ liệu là một lĩnh vực tương đối mới – vẫn đang được định nghĩa như một ngành học – nhưng đã có hướng dẫn để đào tạo sinh viên đại học về khoa học dữ liệu. Những hướng dẫn này đặt ra câu hỏi: Chúng ta có thể mong đợi bao nhiêu đào tạo trong một bằng cấp đại học?
Học viện Khoa học, Kỹ thuật và Y học Quốc gia đề xuất đào tạo trong 10 lĩnh vực, bao gồm giải quyết vấn đề đạo đức, giao tiếp và quản lý dữ liệu.
Công việc của chúng tôi tập trung vào các bằng cấp đại học về khoa học dữ liệu tại các trường được phân loại là R1, có nghĩa là họ tham gia vào mức độ hoạt động nghiên cứu cao. Nghiên cứu tiếp theo có thể xem xét mức độ đào tạo và chuẩn bị trong các khía cạnh khác nhau của khoa học dữ liệu ở các cấp độ Thạc sĩ và Tiến sĩ cũng như bản chất của đào tạo khoa học dữ liệu đại học ở các trường với các cấp độ nghiên cứu khác nhau.
Với việc nhiều chương trình khoa học dữ liệu là mới, có nhiều cơ hội để so sánh việc đào tạo mà sinh viên nhận được với mong đợi của nhà tuyển dụng.
Bước tiếp theo

Bài viết của Jeffrey C. Oliver, Chuyên gia Khoa học Dữ liệu, Đại học Arizona và Torbet McNeil, Nghiên cứu sinh Tiến sĩ về Chính sách Giáo dục và Thực hành, Đại học Arizona
Bài viết này được tái xuất bản từ The Conversation dưới giấy phép Creative Commons. Đọc bài viết gốc.
