Dự Báo Bão Của Trí Tuệ Nhân Tạo Đang Gây Sức Mạnh trong Lĩnh Vực Dự Báo Thời Tiết
Bão Lee không làm phiền ai đó vào đầu tháng Chín, xoay vòng xa xa ở giữa đại dương giữa châu Phi và Bắc Mỹ. Một tường áp suất cao đứng trước con đường đi về phía tây của nó, sẵn sàng chuyển hướng bão khỏi Florida và theo một hình vòng cung lớn về phía đông bắc. Điều quan trọng là, nó sẽ đi về đâu? Còn 10 ngày nữa mới đến thời điểm đất liền có thể bị ảnh hưởng - một khoảng thời gian lớn trong dự báo thời tiết - nhưng các nhà khí tượng học tại Trung tâm Dự báo Thời tiết Trung hạn châu Âu, hoặc ECMWF, đang theo dõi một cách sát sao. Những không chắc chắn nhỏ nhất có thể tạo ra sự khác biệt giữa một ngày mưa ở Scotland hoặc rắc rối nghiêm trọng cho Đông Bắc Hoa Kỳ.
Thường, dự báo thời tiết sẽ phụ thuộc vào mô hình về vật lý khí quyển để đưa ra dự đoán. Lần này, họ có một công cụ khác: một thế hệ mới của các mô hình thời tiết dựa trên trí tuệ nhân tạo được phát triển bởi nhà sản xuất chip Nvidia, tập đoàn công nghệ Trung Quốc Huawei và đơn vị Trí tuệ Nhân tạo DeepMind của Google. Đối với bão Lee, ba mô hình của các công ty công nghệ dự đoán một con đường sẽ đi qua giữa Rhode Island và Nova Scotia - những dự báo mà nói chung đồng thuận với triển vọng chính thức dựa trên vật lý. Đến nơi nào đó. Quan trọng là, con quỷ, tất nhiên, ở ở chi tiết.
Người dự báo thời tiết mô tả sự xuất hiện của các mô hình AI bằng ngôn ngữ dường như không đúng đắn trong ngành nghề nhìn về phía trước của họ: “Đột ngột.” “Bất ngờ.” “Dường như chỉ đến từ đâu đó,” nói Mark DeMaria, một nhà khoa học khí tượng tại Đại học Colorado State vừa nghỉ hưu gần đây từ vị trí lãnh đạo một bộ phận của Trung tâm Bão Quốc gia Hoa Kỳ. Khi anh bắt đầu một dự án trong năm nay với Cơ quan Quản lý Đại dương và Khí tượng Quốc gia Hoa Kỳ để xác minh mô hình FourCastNet của Nvidia dựa trên dữ liệu bão thời gian thực, anh là một “người hoài nghi” về các mô hình mới, anh nói. “Tôi nghĩ không có cơ hội gì nó có thể hoạt động.”
DeMaria đã thay đổi quan điểm của mình kể từ đó. Cuối cùng, Bão Lee đổ bộ vào đất liền ở mép phạm vi của các dự đoán của Trí tuệ Nhân tạo, đến Nova Scotia vào ngày 16 tháng 9. Ngay cả trong mùa bão hoạt động—đã hơn một nửa con đường, đã có 16 cơn bão đặt tên ở Đại Tây Dương—là quá sớm để đưa ra bất kỳ đánh giá cuối cùng nào. Nhưng cho đến nay, hiệu suất của các mô hình Trí tuệ Nhân tạo đã tương đương với các mô hình thông thường, đôi khi còn tốt hơn trong việc theo dõi cơn bão nhiệt đới. Và các mô hình Trí tuệ Nhân tạo thực hiện nhanh chóng, đưa ra dự đoán trên laptop trong vài phút, trong khi các dự báo truyền thống mất giờ đồng hồ của thời gian siêu máy tính.
Nhìn Về Tương Lai
Các mô hình thời tiết thông thường được tạo thành từ các phương trình mô tả động lực phức tạp của không khí trái đất. Nhập vào các quan sát thời gian thực về các yếu tố như nhiệt độ, gió và độ ẩm và bạn sẽ nhận lại các dự đoán về điều gì sẽ xảy ra tiếp theo. Trong suốt nhiều thập kỷ, chúng đã trở nên chính xác hơn khi các nhà khoa học cải thiện hiểu biết của họ về vật lý khí quyển và dữ liệu họ thu thập trở nên phong phú hơn.
Về cơ bản, người dự báo thời tiết đang cố gắng thuần phục vật lý của hỗn loạn. Trong những năm 1960, nhà khí tượng và nhà toán học Edward Lorenz đặt nền móng cho lý thuyết hỗn loạn bằng cách nhận thấy rằng sự không chắc chắn nhỏ trong dữ liệu thời tiết có thể dẫn đến dự báo khác nhau một cách dữ dội—như con bướm tụt cánh gây ra cơn lốc xoáy. Anh ước tính rằng tình trạng của không khí có thể được dự đoán nhiều nhất là hai tuần tới. Bất kỳ ai đã quan sát sự tiếp cận của một cơn bão ở xa hoặc nghiên cứu dự báo hàng tuần trước đám cưới ngoại ô đều biết rằng dự báo vẫn còn rất xa so với giới hạn lý thuyết đó.
Một số người hy vọng rằng Trí tuệ Nhân tạo cuối cùng có thể đưa các dự đoán gần hơn đến giới hạn đó. Các mô hình thời tiết mới không có bất kỳ vật lý nào được tích hợp. Chúng hoạt động theo cách tương tự như công nghệ tạo văn bản ở trái tim của ChatGPT. Trong trường hợp đó, các thuật toán học máy không được giảng quy tắc về ngữ pháp hoặc cú pháp, nhưng sau khi tiêu hóa đủ dữ liệu để học các mô hình sử dụng, chúng trở nên có khả năng bắt chước chúng. Tương tự, các mô hình dự báo thời tiết mới học các mô hình từ các thập kỷ dữ liệu khí tượng vật lý được thu thập trong bộ dữ liệu của ECMWF gọi là ERA5.
Điều này không có vẻ chắc chắn sẽ hoạt động, nói Matthew Chantry, người phối hợp máy học tại ECWMF, người đang dành mùa bão này để đánh giá hiệu suất của họ. Các thuật toán làm nền tảng cho ChatGPT được đào tạo với hàng tỷ từ, chủ yếu được rải từ internet, nhưng không có mẫu nào rộng lớn như vậy cho khí quyển Trái Đất. Các cơn bão, đặc biệt là chỉ chiếm một phần nhỏ của dữ liệu đào tạo có sẵn. Việc các đường di chuyển dự đoán cho Lee và những cơn bão khác đã tốt đến vậy có nghĩa là các thuật toán đã nắm bắt được một số nguyên tắc cơ bản của vật lý khí quyển.
Quá trình này đi kèm với nhược điểm. Vì thuật toán học máy tập trung vào các mô hình phổ biến nhất, chúng có xu hướng làm giảm tầm quan trọng của các điểm ngoại lai như lành tính của đợt nhiệt đới hay cơn bão nhiệt đới, Chantry nói. Và có những khoảng trống trong những gì những mô hình này có thể dự đoán. Chúng không được thiết kế để ước tính lượng mưa, ví dụ, mà diễn ra ở độ phân giải tốt hơn so với dữ liệu thời tiết toàn cầu được sử dụng để đào tạo chúng.
Shakir Mohamed, giám đốc nghiên cứu tại DeepMind, nói rằng mưa và các sự kiện cực kỳ—những sự kiện thời tiết mà mọi người có lẽ quan tâm nhất—đại diện cho những trường hợp “khó khăn nhất” đối với các mô hình thời tiết AI. Có những phương pháp khác để dự đoán mưa, bao gồm một phương pháp dựa trên radar địa phương được phát triển bởi DeepMind được biết đến với tên gọi NowCasting, nhưng việc tích hợp cả hai là khó khăn. Dữ liệu chi tiết hơn, dự kiến sẽ xuất hiện trong phiên bản tiếp theo của bộ dữ liệu của ECMWF được sử dụng để đào tạo mô hình dự đoán, có thể giúp các mô hình AI bắt đầu dự đoán mưa. Các nhà nghiên cứu cũng đang khám phá cách điều chỉnh các mô hình để chúng sẵn lòng dự đoán các sự kiện lạ thường hơn.
Kiểm Tra Lỗi
Một so sánh mà mô hình Trí tuệ Nhân tạo thắng thế là hiệu quả. Ngày càng có nhiều nhà khí tượng và quan chức quản lý thảm họa muốn những dự báo xác suất về sự kiện như cơn bão—một tổng hợp của một loạt các kịch bản có thể xảy ra và khả năng xảy ra của chúng. Do đó, các nhà dự báo tạo ra các mô hình tập thể hiện các kết quả khác nhau. Trong trường hợp các hệ thống nhiệt đới, chúng được biết đến với tên gọi là mô hình spaghetti, vì chúng cho thấy chuỗi các đường di chuyển cơn bão có thể có. Nhưng tính toán mỗi sợi mì phụ tốn hàng giờ.
Ngược lại, các mô hình Trí tuệ Nhân tạo có thể tạo ra nhiều dự đoán trong vài phút. “Nếu bạn có một mô hình đã được đào tạo, mô hình FourCastNet của chúng tôi chạy trong 40 giây trên một chiếc thẻ đồ họa cũ nát,” DeMaria nói. “Vì vậy, bạn có thể thực hiện một tổ hợp toàn bộ mà không thể thực hiện được với các mô hình dựa trên vật lý.”
Thật không may, dự báo tổ hợp thực sự mô tả hai hình thức không chắc chắn: cả ở các quan sát thời tiết ban đầu và ở chính mô hình. Hệ thống Trí tuệ Nhân tạo không thể làm điều này. Yếu điểm này xuất phát từ vấn đề “hộp đen” phổ biến trong nhiều hệ thống học máy. Khi bạn đang cố dự đoán thời tiết, việc biết được mức độ nghi ngờ mô hình của bạn là quan trọng. Lingxi Xie, một nhà nghiên cứu Trí tuệ Nhân tạo cấp cao tại Huawei, nói rằng việc thêm giải thích vào dự báo Trí tuệ Nhân tạo là yêu cầu hàng đầu từ phía nhà khí tượng. “Chúng tôi không thể cung cấp một câu trả lời hài lòng,” anh ta nói.
Mặc dù có những hạn chế đó, Xie và những người khác đang kỳ vọng rằng mô hình Trí tuệ Nhân tạo có thể làm cho các dự báo chính xác trở nên phổ biến rộng rãi hơn. Nhưng triển vọng đưa khí tượng do Trí tuệ Nhân tạo điều khiển vào tay bất kỳ ai vẫn còn xa, anh ta nói. Để có các dự đoán bất kỳ loại nào, từ vệ tinh, bè phao, máy bay, cảm biến—được thông qua các tổ chức như NOAA và ECMWF, chúng xử lý dữ liệu thành các bộ dữ liệu có thể đọc được bởi máy. Các nhà nghiên cứu Trí tuệ Nhân tạo, các công ty khởi nghiệp và các quốc gia có khả năng thu thập dữ liệu hạn chế đang háo hức xem họ có thể làm gì với dữ liệu thô đó, nhưng những nhạy cảm tồn tại, bao gồm quyền sở hữu trí tuệ và an ninh quốc gia.
Những trung tâm dự báo lớn dự kiến sẽ tiếp tục kiểm thử các mô hình trước khi nhãn “thử nghiệm” được gỡ bỏ. Theo DeMaria, những người làm khí tượng học là một cách tự nhiên, vì có những sinh mạng và tài sản đang đối diện nguy cơ, và mô hình dựa trên vật lý không thể biến mất. Nhưng anh ấy nghĩ rằng những cải tiến có nghĩa là có thể chỉ còn một hoặc hai mùa bão nữa trước khi Trí tuệ Nhân tạo đóng một vai trò nào đó trong các dự báo chính thức. “Họ chắc chắn nhìn thấy tiềm năng,” anh ấy nói.
