
Giả sử bạn có một cuốn sách nghìn trang, nhưng mỗi trang chỉ có một dòng văn bản. Bạn phải trích xuất thông tin chứa trong cuốn sách bằng cách sử dụng một máy quét, nhưng máy quét cụ thể này đi qua từng trang một cách có hệ thống, quét một inch vuông mỗi lần. Việc này sẽ mất rất nhiều thời gian để đọc hết cuốn sách với máy quét đó, và phần lớn thời gian đó sẽ bị lãng phí quét vào không gian trống rỗng.
Đó là cuộc sống của nhiều nhà vật lý thực nghiệm. Trong các thí nghiệm hạt, các bộ cảm biến thu lại và phân tích lượng lớn dữ liệu, mặc dù chỉ một phần nhỏ của nó chứa thông tin hữu ích. “Trong một bức ảnh của, ví dụ, một con chim bay trên bầu trời, mỗi pixel có thể có ý nghĩa,” giải thích Kazuhiro Terao, một nhà vật lý tại Phòng thí nghiệm Tăng tốc Quốc gia SLAC. Nhưng trong những hình ảnh mà một nhà vật lý đang xem xét, thường chỉ có một phần nhỏ thực sự quan trọng. Trong các tình huống như vậy, xem xét từng chi tiết không cần thiết tiêu thụ thời gian và tài nguyên tính toán.
Nhưng điều đó đang thay đổi. Với một công cụ học máy được biết đến là mạng nơ-ron tích chập thưa (SCNN), các nhà nghiên cứu có thể tập trung vào các phần quan trọng của dữ liệu và loại bỏ phần còn lại. Các nhà nghiên cứu đã sử dụng những mạng này để đẩy nhanh khả năng phân tích dữ liệu thời gian thực của họ. Và họ dự định sử dụng SCNN trong các thí nghiệm sắp tới hoặc đã tồn tại trên ít nhất ba châu lục. Sự chuyển đổi đánh dấu một thay đổi lịch sử cho cộng đồng vật lý.
“Trong vật lý, chúng ta đã quen với việc phát triển thuật toán và phương pháp tính toán của chúng ta,” nói Carlos Argüelles-Delgado, một nhà vật lý tại Đại học Harvard. “Chúng ta luôn ở đầu tiên về sự phát triển, nhưng bây giờ, ở phần tính toán của mọi thứ, khoa học máy thường dẫn đầu đường.”
Nhân Vật Thưa Thớt
Công việc dẫn đến SCNNs bắt đầu vào năm 2012, khi Benjamin Graham, lúc đó tại Đại học Warwick, muốn tạo một mạng nơ-ron có thể nhận diện chữ viết tiếng Trung.
Các công cụ hàng đầu vào thời điểm đó cho các nhiệm vụ liên quan đến hình ảnh như vậy là mạng nơ-ron tích chập (CNN). Đối với nhiệm vụ viết chữ Trung Quốc, một người viết sẽ vẽ một ký tự trên máy tính bảng kỹ thuật số, tạo ra một hình ảnh với khoảng 10,000 pixel. Sau đó, CNN sẽ di chuyển một lưới 3x3 gọi là kernel qua toàn bộ hình ảnh, đặt kernel ở trung tâm của từng pixel cá nhân. Đối với mỗi vị trí của kernel, mạng sẽ thực hiện một phép tính toán phức tạp gọi là tích chập để tìm các đặc điểm phân biệt.
CNN được thiết kế để sử dụng với các hình ảnh chứa đầy thông tin như các bức ảnh. Nhưng một hình ảnh chứa một ký tự Trung Quốc chủ yếu là trống rỗng; các nhà nghiên cứu đều gọi dữ liệu có đặc tính này là thưa thớt. Đó là một đặc điểm phổ biến của bất cứ thứ gì trong thế giới tự nhiên. “Để cho một ví dụ về sự thưa thớt của thế giới,” Graham nói, nếu Tháp Eiffel được bao bọc bằng hình chữ nhật nhỏ nhất có thể, hình chữ nhật đó sẽ bao gồm “99,98 phần trăm không khí và chỉ 0,02 phần trăm sắt.”

Graham thử điều chỉnh phương pháp CNN để kernel chỉ được đặt trên các phần ảnh 3x3 chứa ít nhất một pixel có giá trị khác không (và không chỉ là trắng). Như vậy, anh ta đã thành công trong việc tạo ra một hệ thống có thể nhận diện chữ viết tiếng Trung một cách hiệu quả. Nó giành chiến thắng trong một cuộc thi năm 2013 với tỷ lệ lỗi chỉ 2,61 phần trăm khi nhận dạng các ký tự cá nhân. (Con người có tỷ lệ lỗi trung bình là 4,81 phần trăm.) Sau đó, anh ta chuyển sự chú ý của mình đến một vấn đề lớn hơn nữa: nhận diện đối tượng ba chiều.
Đến năm 2017, Graham đã chuyển đến Facebook AI Research và đã hoàn thiện kỹ thuật của mình và công bố chi tiết về SCNN đầu tiên, kernel chỉ được đặt trên các pixel có giá trị khác không (thay vì đặt kernel trên bất kỳ phần 3x3 nào có ít nhất một pixel “khác không” nào). Đó là ý tưởng chung này mà Terao mang đến thế giới vật lý hạt.
Nghiên cứu Dưới Đất
Terao tham gia vào các thí nghiệm tại Fermi National Accelerator Laboratory để khám phá bản chất của neutrinos, một trong những hạt cơ bản nổi tiếng nhất. Chúng cũng là hạt phổ biến nhất trong vũ trụ với khối lượng (tuy không nhiều), nhưng hiếm khi xuất hiện trong một máy đo. Do đó, hầu hết dữ liệu cho các thí nghiệm về neutrinos là thưa thớt, và Terao luôn tìm kiếm cách tiếp cận tốt hơn cho phân tích dữ liệu. Anh ta đã tìm thấy một trong SCNNs.
Năm 2019, anh ấy áp dụng SCNNs vào mô phỏng dữ liệu dự kiến từ Thí nghiệm Neutrino Dưới Đất Sâu, hoặc DUNE, sẽ là thí nghiệm vật lý neutrino lớn nhất thế giới khi hoạt động vào năm 2026. Dự án sẽ bắn neutrinos từ Fermilab, ngay ngoại ô Chicago, qua 800 dặm của trái đất đến một phòng thí nghiệm dưới lòng đất ở South Dakota. Trên đường đi, các hạt sẽ “dao động” giữa ba loại neutrinos đã biết, và những dao động này có thể tiết lộ các tính chất chi tiết của neutrinos.
SCNNs phân tích dữ liệu mô phỏng nhanh hơn so với phương pháp thông thường và yêu cầu ít sức mạnh tính toán hơn trong quá trình làm điều này. Kết quả hứa hẹn có nghĩa là SCNNs có thể sẽ được sử dụng trong suốt quá trình thực nghiệm thực tế.

Trong năm 2021, trong khi đó, Terao giúp thêm SCNNs vào một thí nghiệm neutrino khác tại Fermilab được biết đến với tên gọi MicroBooNE. Ở đây, các nhà khoa học xem xét hậu quả của các va chạm giữa neutrinos và hạt nhân của nguyên tử argon. Bằng cách nghiên cứu các đường đường tạo ra bởi những tương tác này, các nhà nghiên cứu có thể suy luận thông tin chi tiết về neutrinos gốc. Để làm điều đó, họ cần một thuật toán có thể nhìn vào các pixel (hoặc, kỹ thuật, những voxel ba chiều gọi là voxels) trong biểu đồ ba chiều của máy đo và sau đó xác định rõ ràng các pixel nào liên quan đến các quỹ đạo hạt.
Bởi vì dữ liệu thưa thớt đến mức—một vài đường nét nhỏ trong một bộ cảm biến lớn (khoảng 170 tấn argon lỏng)—SCNNs gần như hoàn hảo cho công việc này. Với một CNN tiêu chuẩn, hình ảnh sẽ phải được chia thành 50 phần, do toàn bộ quá trình tính toán, Terao nói. “Với một SCNN thưa thớt, chúng tôi phân tích toàn bộ hình ảnh cùng một lúc—và làm điều đó nhanh chóng hơn nhiều.”
Kích hoạt Kịp thời
Một trong những nghiên cứu viên làm việc trên MicroBooNE là một sinh viên thực tập dưới tên Felix Yu. Ấn tượng với sức mạnh và hiệu suất của SCNNs, anh ta mang theo công cụ này đến nơi làm việc tiếp theo của mình làm sinh viên nghiên cứu tại một phòng thí nghiệm nghiên cứu của Harvard chính thức thuộc sự liên kết với Trạm quan sát Neutrino IceCube ở Cực Nam.

Vượt Qua Neutrinos
Philip Harris, một nhà vật lý tại Viện Công nghệ Massachusetts, hy vọng SCNNs có thể hỗ trợ ở máy kết hợp hạt lớn nhất: Máy kết hợp hạt lớn (LHC) tại CERN. Harris nghe về loại mạng thần kinh này từ một đồng nghiệp tại MIT, nhà khoa học máy tính Song Han. “Song là chuyên gia về việc làm cho thuật toán trở nên nhanh chóng và hiệu quả,” Harris nói—hoàn hảo cho LHC, nơi có 40 triệu va chạm xảy ra mỗi giây.
Khi họ trò chuyện vài năm trước, Song nói với Harris về dự án xe tự động mà anh đang theo đuổi với các thành viên của lab của mình. Đội ngũ của Song đang sử dụng SCNNs để phân tích bản đồ laser 3D của không gian phía trước của xe, nơi nhiều phần là trống trơn, để xem có tồn tại chướng ngại vật nào phía trước hay không.
Harris và đồng nghiệp đối mặt với những thách thức tương tự tại LHC. Khi hai proton va chạm bên trong máy, va chạm tạo ra một quả cầu mở rộng được tạo thành từ các hạt. Khi một trong những hạt này va chạm vào bộ sưu tập, một làn sóng hạt phụ xuất hiện. “Nếu bạn có thể định vị đầy đủ phạm vi của làn sóng này,” Harris nói, “bạn có thể xác định năng lượng của hạt tạo ra nó,” có thể là một đối tượng đặc biệt quan tâm—như hạt Higgs, mà các nhà vật lý đã phát hiện vào năm 2012, hoặc một hạt vật chất tối, mà các nhà vật lý vẫn đang tìm kiếm.
“Vấn đề chúng tôi đang cố giải quyết giống như việc nối các điểm lại với nhau,” Harris nói, giống như một chiếc ô tô tự lái có thể nối các điểm của bản đồ laser để phát hiện chướng ngại vật.
SCNNs sẽ gia tăng tốc độ phân tích dữ liệu tại LHC ít nhất 50 lần, Harris nói. “Mục tiêu cuối cùng của chúng tôi là đưa [SCNNs] vào bộ cảm biến”—một nhiệm vụ sẽ mất ít nhất một năm để hoàn tất thủ tục và sự hỗ trợ thêm từ cộng đồng. Nhưng anh và đồng nghiệp của mình đều đầy hy vọng.
Nhìn chung, có khả năng cao rằng SCNNs—một ý tưởng ban đầu được nghĩ ra trong thế giới khoa học máy tính—sẽ sớm đóng một vai trò trong những thí nghiệm lớn nhất từng được thực hiện trong vật lý neutrino (DUNE), thiên văn neutrino (IceCube), và vật lý năng lượng cao (LHC).
Graham nói anh rất ngạc nhiên khi biết SCNNs đã tiến vào vật lý hạt, mặc dù anh không hoàn toàn bất ngờ. “Một cách trừu tượng,” anh nói, “một hạt di chuyển trong không gian giống như đỉnh bút di chuyển trên một tờ giấy.”
Chuyện gốc được tái bản với sự cho phép từ Quanta Magazine, một tờ báo độc lập về biên tập của Simons Foundation với sứ mệnh làm tăng cường sự hiểu biết công cộng về khoa học bằng cách đưa ra các phát triển và xu hướng nghiên cứu trong toán học và các ngành khoa học tự nhiên và sinh học.
