Cách một bộ não AI chỉ với một neuron có thể vượt qua khả năng của con người
Một nhóm nghiên cứu đa ngành từ Đại học Kỹ thuật Berlin mới đây đã tạo ra một 'mạng' thần kinh có thể một ngày vượt trội so với sức mạnh của não con người chỉ với một neuron.
Não của chúng ta có khoảng 86 tỷ neuron. Tổng hợp, chúng tạo thành một trong những mạng thần kinh hữu cơ tiên tiến nhất được biết đến.
Các hệ thống trí tuệ nhân tạo hiện đại cố gắng mô phỏng não con người thông qua việc tạo ra các mạng thần kinh nhiều tầng được thiết kế để chứa càng nhiều neuron trong không gian càng nhỏ càng tốt.
Thật không may, các thiết kế như vậy đòi hỏi lượng năng lượng lớn và tạo ra các đầu ra kém so với não con người mạnh mẽ và hiệu quả năng lượng.
Theo một bài viết từ Katyanna Quach của The Register, các nhà khoa học ước tính rằng chi phí để huấn luyện chỉ một 'siêu mạng' thần kinh vượt quá chi phí của một nhiệm vụ vũ trụ cận kề:
Mạng thần kinh và lượng phần cứng cần thiết để huấn luyện chúng bằng cách sử dụng các bộ dữ liệu lớn đang ngày càng tăng kích thước. Hãy xem GPT-3 làm ví dụ: nó có 175 tỷ tham số, nhiều hơn 100 lần so với bản tiền nhiệm của nó là GPT-2.
Có lẽ lớn hơn là tốt hơn khi nói đến hiệu suất, nhưng điều này đến với hành tinh với giá nào? Carbontracker ước tính rằng việc huấn luyện GPT-3 chỉ một lần đòi hỏi lượng năng lượng bằng lượng năng lượng sử dụng bởi 126 ngôi nhà ở Đan Mạch mỗi năm, hoặc lái xe đến Mặt Trăng và quay trở lại.
Đội ngũ ở Berlin quyết định thách thức ý kiến rằng lớn hơn là tốt hơn bằng cách xây dựng một mạng thần kinh sử dụng chỉ một neuron.
Thường thì, mạng cần nhiều hơn một nút. Trong trường hợp này, tuy nhiên, một neuron đơn có thể tạo mạng với chính nó bằng cách lan rộng theo thời gian thay vì không gian.
Theo bài báo nghiên cứu của nhóm:
Chúng tôi đã thiết kế một phương pháp để hoàn toàn gập lại thời gian của một DNN tiến lùi nhiều tầng. Phương pháp Fit-DNN này chỉ đòi hỏi một neuron với các vòng lặp độ trễ được kiểm soát bằng phản hồi. Thông qua việc tuần tự hóa thời gian của các hoạt động phi tuyến tính, một DNN có thể được thực hiện có độ sâu hoặc rộng tùy ý.
Trong một mạng thần kinh truyền thống, chẳng hạn như GPT-3, mỗi neuron có thể được cân nhắc trọng số để điều chỉnh kết quả. Kết quả, thường, là thêm nhiều neuron sẽ tạo ra nhiều tham số hơn, và nhiều tham số tạo ra kết quả tinh tế hơn.
Nhưng nhóm nghiên cứu ở Berlin phát hiện ra rằng họ có thể thực hiện một chức năng tương tự bằng cách trọng số khác nhau cho cùng một neuron qua thời gian thay vì lan rộng các neuron có trọng số khác nhau trong không gian.
Theo một thông cáo báo chí từ Đại học Kỹ thuật Berlin:
Điều này tương tự như một khách duy nhất mô phỏng cuộc trò chuyện tại một bàn ăn lớn bằng cách chuyển chỗ ngồi nhanh chóng và nói mỗi phần.
“Nhanh chóng” nói nhẹ nhàng thôi. Nhóm nghiên cứu cho biết hệ thống của họ lý thuyết có thể đạt đến tốc độ tiệm cận giới hạn vũ trụ bằng cách kích thích các vòng lặp phản hồi dựa trên thời gian trong neuron thông qua laser — mạng thần kinh ở hoặc gần tốc độ ánh sáng.
Điều này có nghĩa là gì đối với trí tuệ nhân tạo? Theo các nhà nghiên cứu, điều này có thể đối phó với chi phí năng lượng ngày càng tăng của việc đào tạo các mạng mạnh. Cuối cùng, chúng ta sẽ hết năng lượng khả thi để sử dụng nếu chúng ta tiếp tục đòi hỏi yêu cầu sử dụng lớn hơn gấp đôi hoặc ba lớn mạng theo thời gian.
Nhưng câu hỏi quan trọng là liệu một neuron duy nhất bị mắc kẹt trong một vòng lặp thời gian có thể tạo ra kết quả giống như hàng tỷ không.
Trong các thử nghiệm ban đầu, nhóm nghiên cứu đã sử dụng hệ thống mới để thực hiện các chức năng thị giác máy tính. Nó có thể loại bỏ nhiễu được thêm vào thủ công từ hình ảnh của quần áo để tạo ra một hình ảnh chính xác — điều mà được coi là khá tiên tiến đối với trí tuệ nhân tạo hiện đại.
Với sự phát triển tiếp theo, các nhà khoa học tin rằng hệ thống có thể được mở rộng để tạo ra “một số lượng không giới hạn” kết nối nơ-ron từ những nơ-ron đang bị treo trong thời gian.
Điều này hoàn toàn có thể khiến hệ thống như vậy vượt qua não người và trở thành mạng nơ-ron mạnh mẽ nhất thế giới, điều mà các chuyên gia trí tuệ nhân tạo gọi là một “siêu trí tuệ.”
