Làm ơn giúp tôi và lấy một vật gần bạn. Bất cứ thứ gì đều được. Ngay cả nếu đó là một thứ bạn chưa bao giờ cầm trước đó, khả năng cao là não của bạn tự động đã làm việc ra làm thế nào bạn nên nắm thứ đó và với lực nào. Đó là loại khéo léo linh hoạt làm cho bạn trở nên con người. (Bạn là con người, tôi hy vọng?)
Yêu cầu một con robot làm điều tương tự và bạn sẽ entiếc một cái nhìn trống trải hoặc một vật thể nhàu nát trong bàn tay lạnh của máy móc. Bởi vì robot giỏi ở những công việc lặp đi lặp lại đòi hỏi nhiều sức mạnh, nhưng chúng vẫn kém khi học cách thao tác với các đối tượng mới lạ. Đó là lý do tại sao hôm nay một công ty có tên Embodied Intelligence đã xuất hiện từ chế độ ẩn danh để kết hợp sức mạnh của robot và con người thành một hệ thống mới có thể làm cho việc dạy robot những nhiệm vụ mới trở nên dễ dàng hơn đối với người thông thường. Hãy tưởng tượng nó giống như một trò chơi video thực tế ảo—chỉ là bạn được kiểm soát một con robot khổng lồ.
Nếu bạn muốn dạy một robot làm điều gì đó như nâng một cái chìa vặn, bạn có thể làm điều đó theo một số cách. Cách đầu tiên là chỉ đơn giản là lập trình chúng với tất cả những chuyển động cần thiết để nắm bắt thứ đó. Các dòng mã, một sau một. Rất nhàm chán và rất công phu.
Một kỹ thuật mới hơn, phức tạp hơn được gọi là học củng cố. Tại UC Berkeley, phòng thí nghiệm đã tách ra Embodied Intelligence sử dụng một con robot có tên là Brett, có thể tự dạy bản thân cách đặt một khối hình vuông vào lỗ vuông bằng cách đoán. Mỗi lần nó thực hiện một cử động ngẫu nhiên đưa khối gần hơn vào lỗ, trí tuệ nhân tạo nhận được một phần thưởng. Thử nghiệm sau thử nghiệm, robot di chuyển gần và gần mục tiêu của mình cho đến khi bùng nổ, nó đã tự dạy mình chơi một trò chơi dành cho trẻ em trong khoảng 10 phút.
Vì vậy, lập trình tất tần tật là không linh hoạt, và học củng cố từ đầu là tốn thời gian cho robot. Đây, sau tất cả, là một máy vật lý bị ràng buộc bởi luật lẻ của vũ trụ vật lý, nên nó chỉ có thể thử nghiệm một số lần trong một khoảng thời gian nhất định. (Sử dụng học củng cố trong mô phỏng nhanh hơn nhiều, vì các thử nghiệm ảo có thể diễn ra nhanh chóng hơn nhiều.)

Một kỹ thuật chính xác hơn được gọi là học theo bắt chước, trong đó một người điều khiển giảng cho robot cách đặt một khối hình vuông vào lỗ vuông. Điều đó chỉ là việc sử dụng tay điều khiển cánh tay của robot xung quanh—nhưng robot đó sẽ không thể tự dạy bản thân những nhiệm vụ mới lạ.
Điều mà Embodied Intelligence đã nghĩ ra là một hệ thống lai tạo của học theo bắt chước và học củng cố. Bằng cách sử dụng kính thực tế ảo và bộ điều khiển, người có thể từ xa điều khiển robot để thực hiện một nhiệm vụ cụ thể. Điều này tạo ra một kết nối động học tự nhiên hơn giữa người điều khiển và robot, khi các thuật toán học máy—đã được đào tạo để phù hợp với những gì con người làm—hướng dẫn các chuyển động của robot. Sau đó, học củng cố bắt đầu, làm cho các chuyển động của robot trở nên tinh tế hơn thông qua thử nghiệm và sai lầm cho đến khi nó giỏi hơn cả người đã dạy nó.
“Thường thì bạn muốn robot của mình siêu hơn con người, bạn không muốn chúng chỉ giỏi như người đã thực hiện,” nói Pieter Abbeel, đồng sáng lập và chủ tịch của Embodied Intelligence. “Bạn muốn chúng, sau khi đã nắm vững một kỹ năng, làm cho kỹ năng đó trở nên nhanh hơn, chính xác hơn, đáng tin cậy hơn thông qua thử nghiệm và sai lầm của chúng mà không cần liên tục có sự tham gia của con người. Bởi vì con người sẽ không thể giảng dạy các cử động nhanh chóng như một robot có thể nguyên tắc chuyển động.”
Hãy tưởng tượng, nếu bạn muốn, nhà máy của tương lai. Thay vì một lập trình viên nghèo nàn viết mã cho mỗi robot để thực hiện một nhiệm vụ khác nhau trên dây chuyền lắp ráp, họ sẽ thay vào đó biểu diễn chuyển động trong thế giới ảo. Ban đầu, robot có thể hơi vụng trộm, nhưng theo thời gian, chúng sẽ sử dụng trí tuệ nhân tạo của mình để làm cho các cử động của chúng trở nên hoàn thiện hơn. Và khi các nhà nghiên cứu xây dựng thuật toán học tốt hơn và tốt hơn, robot có thể lấy một nhiệm vụ cụ thể mà con người đã dạy cho họ và sử dụng nó để tự mình dạy bản thân cách thực hiện điều gì đó khác biệt.
Tuy nhiên, hệ thống này hiện đang ở giai đoạn rất sớm. Hiện tại, nó đang hoạt động trên một robot nghiên cứu PR2, có tốc độ và vụng trộm tương đối. Và bất kỳ robot hiện đại nào cũng không thể linh hoạt như con người, vì vậy mặc dù cái này tuyệt vời khi sao chép các cử động của người điều khiển, nó không thể sao chép cách nắm vững tinh tế. Nhưng nếu Embodied Intelligence làm theo ý muốn của mình, trong thời gian ngắn, nhà máy có thể được trang bị robot học từ con người, sau đó tăng cường khả năng đó bằng cách tự dạy bản thân.
Và hãy tưởng tượng những gì hơn một robot có thể đạt được với loại hệ thống này. Nếu bạn có 100 máy đang trò chuyện với nhau trên đám mây và một máy học được điều gì đó đặc biệt hữu ích, nó có thể phân phối kiến thức đó cho bè bạn của nó. Bây giờ chúng ta đang nói về một tâm trí đám đông có thể mạnh mẽ. Và robot thậm chí không cần phải có hình dạng và kích thước giống nhau. Các nhà nghiên cứu đã tìm ra cách để chuyển đổi kiến thức này giữa các loại máy khác nhau.
Trong tương lai gần, ý tưởng là không chỉ làm cho robot thông minh hơn, mà còn làm cho chúng dễ dàng hơn cho người dạy. Lập trình Brett trong phòng thí nghiệm đòi hỏi nhiều thời gian và cũng cần một cái gì đó được gọi là Tiến sĩ, điều mà hầu hết mọi người đều không có. “Điều chúng ta đang thấy ở đây thay vào đó là bất kỳ ai có thể sử dụng tai nghe thực tế ảo đều có thể dạy robot những kỹ năng mới một cách nhanh chóng,” nói Peter Chen, đồng sáng lập và Giám đốc điều hành của Embodied Intelligence. Đây là loại dân chủ hóa sẽ khiến cho ngành robot học—truyền thống là một lĩnh vực ít được tiếp cận hơn nhiều so với phần mềm, mà bất kỳ ai có máy tính đều có thể nghịch ngợm.
Liệu điều này có làm cho việc robot dễ dàng thay thế con người trong lực lượng lao động không? Chắc chắn, có thể. Nhưng ngày càng nhiều, chúng ta thấy robot đang làm việc cùng với con người, thực hiện những nhiệm vụ phiền toái, lặp lại và giải phóng người lao động để thực hiện những nhiệm vụ độc đáo của con người đòi hỏi sự nhạy bén như cảm giác chạm ví dụ. Và nếu chúng ta muốn hy vọng vào mối quan hệ có lợi này, chúng ta sẽ cần đồng nghiệp robot của chúng ta học nhanh chóng, nếu không chúng có thể trở thành gánh nặng thay vì một phước lành và đánh chúng ta đầu bằng chiếc tua-vít.
