
Lược dịch từ bài viết của phóng viên Mack DeGeurin, Gizmodo
Nghiên cứu mới tiết lộ, việc trò chuyện với ChatGPT tương đương với việc đổ một hồ bơi Olympic nước sạch xuống đất.
Những chatbot lớn như ChatGPT và Bard tiêu thụ năng lượng và nước lớn. Việc huấn luyện chúng đòi hỏi nguồn dữ liệu khổng lồ và làm mát trung tâm dữ liệu tăng lượng nước tiêu thụ. Nghiên cứu mới cho thấy, chỉ riêng việc đào tạo GPT-3 đã sử dụng lượng nước lớn tương đương với việc lấp đầy một hồ bơi Olympic. Trong khi đó, trò chuyện với ChatGPT tương đương với việc đổ một chai nước sạch lớn xuống đất.
Nhà nghiên cứu từ Đại học Colorado Riverside và Đại học Texas Arlington ước tính lượng nước cần thiết để huấn luyện GPT-3 tương đương với lấp đầy tháp làm mát của lò phản ứng hạt nhân. Việc này đặt ra những thách thức về nước và năng lượng. ChatGPT, dù ra đời sau GPT-3, vẫn đòi hỏi một lượng nước đáng kể để thực hiện các cuộc trò chuyện.
Số lượng nước cần thiết để đào tạo các mô hình AI có thể tăng gấp ba lần nếu quá trình diễn ra tại các trung tâm dữ liệu kém hiệu quả về năng lượng. Dự báo cho thấy nhu cầu về nước này sẽ tiếp tục tăng lên với sự ra đời của các mô hình AI mới, như GPT-4.
Trung tâm dữ liệu có ‘dấu chân nước’: lượng nước sử dụng để làm mát trung tâm dữ liệu và để sản xuất điện. Nhiều mô hình AI được đào tạo và triển khai tại các trung tâm này.Làm thế nào để chatbot sử dụng nước?
Khi tính toán mức tiêu thụ nước của AI, các nhà nghiên cứu phân biệt giữa “rút” và “tiêu thụ” nước. Ví dụ, “rút” nước từ các nguồn khác nhau, trong khi “tiêu thụ” đề cập đến việc nước bị mất do bay hơi trong quá trình sử dụng trong các trung tâm dữ liệu. Nghiên cứu về việc sử dụng nước của AI tập trung vào phần “tiêu thụ” nước, nơi nước không thể tái sử dụng được. Ai từng bước vào phòng máy chủ của công ty đều biết rằng trước tiên phải mặc áo len. Phòng máy chủ được duy trì ở nhiệt độ từ 50 đến 80 độ F (10 đến 26.6 độ C) để bảo vệ thiết bị khỏi hỏng hóc. Duy trì nhiệt độ lý tưởng đó luôn là thách thức vì máy chủ tự chuyển đổi năng lượng thành nhiệt. Các tháp làm mát như tháp giải nhiệt sử dụng nước để làm mát phòng máy chủ và giữ cho chúng ở nhiệt độ lý tưởng bằng cách bay hơi nước lạnh. Sức mạnh tính toán mạnh mẽ bên trong các trung tâm dữ liệu tạo ra nhiệt, làm cho việc làm mát hiệu quả là điều quan trọng khi xây dựng hệ thống. Các tháp làm mát dựa vào sự bay hơi là một phần quan trọng của nhiều hệ thống làm mát cho trung tâm dữ liệu. Các tháp giải nhiệt hoạt động hiệu quả nhưng đòi hỏi lượng nước lớn. Các nhà nghiên cứu ước tính rằng mỗi kilowatt-giờ tiêu thụ trong một trung tâm dữ liệu trung bình cần một gallon nước. Nước sạch là lựa chọn duy nhất để tránh sự ăn mòn và sự phát triển của vi khuẩn. Nước cũng cần để kiểm soát độ ẩm trong phòng máy. Các trung tâm dữ liệu cần phải tính toán lượng nước cần để tạo ra năng lượng mà chúng tiêu thụ, được gọi là “tiêu thụ nước gián tiếp bên ngoài”.Tình hình tại các trung tâm dữ liệu của Google
Vấn đề về tiêu thụ nước không chỉ ảnh hưởng đến các mô hình của OpenAI hay trí tuệ nhân tạo nói chung. Vào năm 2019, Google đã tiêu thụ hơn 2.3 tỷ gallon (khoảng 8.7 triệu mét khối) nước cho các trung tâm dữ liệu chỉ trong ba tiểu bang. Tính đến nay, công ty đã xây dựng 14 trung tâm dữ liệu trải dài khắp Bắc Mỹ để hỗ trợ các dịch vụ như Google Search, Google Workspace và gần đây là các mô hình ngôn ngữ lớn như LaMDa và Bard. Theo báo cáo gần đây, chỉ cần LaMDa một lượng nước khổng lồ để huấn luyện, vượt xa GPT-3 vì một số trung tâm dữ liệu của Google đặt ở những tiểu bang có khí hậu khô hanh như Texas; tuy nhiên, các nhà nghiên cứu cảnh báo rằng con số này chỉ là ước lượng gần đúng.
Một chuyên gia làm việc tại trung tâm dữ liệu của Google ở Dalles, Oregon. Nguồn: SAP
Ngoài nước, các mô hình ngôn ngữ lớn mới cũng tiêu tốn một lượng điện lớn đáng kinh ngạc. Một báo cáo về trí tuệ nhân tạo từ Stanford được công bố gần đây đã so sánh mức tiêu thụ năng lượng của bốn mô hình AI nổi tiếng, ước tính rằng GPT-3 của OpenAI đã gây ra 502 tấn carbon trong quá trình huấn luyện. Tổng thể, năng lượng cần thiết để huấn luyện GPT-3 có thể cung cấp đủ năng lượng cho một ngôi nhà trung bình ở Mỹ trong hàng trăm năm.
Kevin Kent, Giám đốc điều hành của Giải pháp Hiệu quả Cơ sở Cơ bản, trong một cuộc phỏng vấn với tạp chí Time: “Cuộc đua của các trung tâm dữ liệu để theo kịp các đối thủ của họ thật sự là điên rồ. “Họ không luôn có thể đưa ra những lựa chọn tốt nhất cho môi trường.”Biến đổi khí hậu và hạn hán ngày càng trầm trọng có thể khiến mối lo ngại về sử dụng nước của trí tuệ nhân tạo tăng lên
Hiện nay, theo ước tính của Diễn đàn Kinh tế Thế giới, khoảng 2.2 triệu cư dân ở Mỹ đang phải đối mặt với tình trạng thiếu nước và hệ thống cấp nước trong nhà. 44 triệu người khác sống với hệ thống nước “thiếu thốn”. Các nhà nghiên cứu lo ngại rằng sự kết hợp của biến đổi khí hậu và tăng dân số có thể làm cho tình hình trở nên tồi tệ hơn vào cuối thế kỷ này. Đến năm 2071, theo ước tính của Stanford, gần một nửa số lưu vực nước ngọt ở Mỹ sẽ không thể đáp ứng được nhu cầu nước hàng tháng. Nhiều khu vực có thể sẽ chứng kiến việc giảm một phần ba nguồn cung cấp nước của họ trong vòng 50 năm tới.
Sự chênh lệch về mực nước tại bến du thuyền ở khu vực Browns Ravine Cove của hồ điều hòa Folsom, gần thủ đô Sacramento, California, Mỹ, vào ngày 22/5/2021 và ngày 26/3/2022 cho thấy những cơn bão giải nhiệt gần đây đã giảm đáng kể tình hình hạn hán kéo dài 3 năm qua ở bang này. Nguồn: ZingNews
Tất cả những điều này đều cho thấy nhu cầu nước khổng lồ của trí tuệ nhân tạo có thể trở thành một vấn đề tranh cãi ngày càng nổi lên, đặc biệt nếu công nghệ này được áp dụng rộng rãi hơn vào nhiều lĩnh vực và dịch vụ. Yêu cầu về dữ liệu ngày càng lớn hơn cho các Mô hình Ngôn ngữ Lớn, điều này đồng nghĩa với việc các công ty cần phải tìm cách tăng hiệu quả sử dụng nước cho trung tâm dữ liệu của họ.Các nhà nghiên cứu đưa ra một số phương pháp khá rõ ràng để giảm tiêu thụ nước của trí tuệ nhân tạo. Đối với các công ty mới, việc quan trọng là lựa chọn thời gian và địa điểm để đào tạo các mô hình AI. Ví dụ, việc đào tạo có thể được thực hiện vào ban đêm khi nhiệt độ ngoài trời thấp hơn hoặc tại các trung tâm dữ liệu sử dụng nước hiệu quả hơn để giảm thiểu tiêu thụ nước. Ngoài ra, người dùng của các Chatbot có thể tham gia vào cuộc trò chuyện với các mô-đun trong 'giờ tiết kiệm nước', tương tự như cách chính quyền đô thị khuyến khích sử dụng máy rửa chén ngoài giờ. Tuy nhiên, bất kỳ thay đổi nào từ phía người dùng cũng đòi hỏi sự minh bạch cao hơn từ một số công ty công nghệ xây dựng các mô hình này, điều mà các nhà nghiên cứu cho biết là thiếu tính minh bạch một cách đáng lo ngại.Các nhà nghiên cứu khuyến nghị: “Chúng tôi đề xuất các nhà phát triển mô hình AI và các quản lý trung tâm dữ liệu nên trở nên minh bạch hơn. “Mô hình AI được đào tạo khi nào và ở đâu? Và những mô hình AI được đào tạo và/hoặc triển khai trong các trung tâm dữ liệu thuê máy chủ của bên thứ ba hoặc các dịch vụ đám mây công cộng thì sao? Những thông tin như vậy sẽ mang lại giá trị lớn cho cả cộng đồng nghiên cứu và công chúng nói chung.