Một sự giới thiệu hỗn loạn về tất cả những vấn đề máy học
Bạn đang chết. Lý do không quan trọng. Có lẽ bạn đã dành những năm tốt nhất của mình với công việc, đốt đèn đêm, ha ha. Hoặc có thể là, trong suốt mười lăm năm qua, bạn chỉ sống nhờ cà phê và Soylent. Nutrition hoàn chỉnh được hỗ trợ bởi khoa học, họ nói. Không có cách nào chứng minh họ sai! Ha ha ha! Hoặc có thể đó là những hơi độc hại.
Bạn sẽ mang lại cho mình sự sống bất tử. Không - bạn sẽ tạo ra một phiên bản mới, tốt hơn của chính mình, bất tử - một bản sao sống của bạn được làm từ kim loại sẽ hành động và nói những điều bạn sẽ nói, nếu bạn còn sống. Nếu Soylent không làm bạn chết.
Điều này có thể là khả dụng. Bạn đã xem một tập Black Mirror về nó, và Microsoft đã đăng ký bằng sáng chế về khái niệm tương tự trong năm nay. Bạn không phải là ninja với mã nguồn, nhưng bạn có một con trỏ hỏa tiễn trên trang Xanga của mình, và có người phải sao chép-và-dán HTML đó vào đó. Nhưng quan trọng hơn, bạn có động lực. Khay K-Cup của bạn đầy, và tất cả những gì bạn cần làm tiếp theo là tìm hiểu xem máy học này là gì.
“Máy học là nghệ thuật và khoa học của việc tìm ra mẫu trong dữ liệu, và sử dụng những mẫu đó để đưa ra dự đoán về dữ liệu mới,” một cô gái năng động trong video YouTube nói với bạn.
Bạn nhăn mặt. Liệu máy học có phải là công nghệ bạn muốn không? Có, bạn quyết định, đó là: bạn muốn máy học về bạn, và sau đó (khi bạn chết), đưa ra dự đoán về những điều bạn sẽ nói.
Bạn nghiêng người lùi trong chiếc ghế. Một cốc nước nóng đặt trước mặt bạn trên bàn. Bạn làm kẹt đốt ngón tay và Google ‘cách thực hiện máy học.’
Điểm dừng đầu tiên trên hành trình của bạn là một trang web có tên là tensorflow.org.
TensorFlow là một nền tảng mã nguồn mở end-to-end cho máy học. Nó có một hệ sinh thái công cụ, thư viện và nguồn lực cộng đồng linh hoạt và toàn diện, cho phép các nhà nghiên cứu đẩy giới hạn của nghệ thuật trong ML và những nhà phát triển dễ dàng xây dựng và triển khai ứng dụng được cung cấp bởi ML.
Đôi mắt bạn sáng lên, vì bạn đọc từ khóa “dễ dàng” và “nghệ thuật hàng đầu” và cũng “mã nguồn mở,” có nghĩa là MIỄN PHÍ MIỄN PHÍ MIỄN PHÍ. Bạn không phải là người giàu có.
Bạn nhấp vào tab “Học” và bắt đầu đọc. Ngay lập tức bạn nghĩ, có lẽ nên tự tử ngay bây giờ, ha ha ha. Bạn không biết 'numpy' là gì.
Nhưng sau đó, bạn đọc từ khóa “mạng neural,” và bạn nghĩ, Nghe có vẻ đúng. Tôi là một mạng neural. Não tôi được tạo thành từ các tế bào neuron. Mạng neural = não người.
Bạn khá tự tin về điều đó nhưng bạn kiểm tra Google để chắc chắn.
“MẠNG NEURAL KHÔNG GIỐNG NHƯ NÃO,” cô gái hăng hái trên YouTube hét với bạn. “Tuy nhiên, lý do mà chúng được đặt tên là vì mạng neural được tạo thành từ 'neuron' toán học, đó chỉ là các hàm phi tuyến tính có thể 'bắn' hoặc 'không bắn' phản ứng với đầu vào số.” Bạn ngáp. Cô gái này vẫy tay rất nhiều. Nhưng tại sao tôi lại quan tâm đến một hàm toán? bạn nghĩ.
“Bởi vì,” cô gái nói, “mạng neural đã đảo lộn hoàn toàn các loại công việc mà máy tính có thể thực hiện. Trước khi có neural nets, máy chỉ có thể thực sự hiểu dữ liệu bảng - như hàng và cột trong một bảng tính. Nhưng mạng neural cho phép máy tính hiểu các loại dữ liệu không có cấu trúc, như hình ảnh, video, âm thanh, giọng nói, thậm chí là ngôn ngữ con người.”
“ĐÚNG,” bạn hét lên màn hình, “ĐÓ LÀ ĐÚNG NHỮNG GÌ TÔI CẦN.”
“Nhưng việc đào tạo mạng neural trên bộ dữ liệu lớn thường đòi hỏi phần cứng tính toán mạnh mẽ, như GPU.”
Bạn vỗ nhẹ vào máy tính đang hoạt động như một tháp. “Tôi có thể chứa rất nhiều mạng neural trong thứ này!”
“Hiện thực, bạn không thể đào tạo một mạng neural lớn trên máy tính để bàn của bạn,” cô gái nói, và giơ một ngón tay trách nhiệm về phía bạn. “Và thậm chí nếu bạn có thể, bạn cũng không thể sử dụng máy tính để bàn của mình để đăng ký mô hình của bạn trong sản xuất, để đưa ra dự đoán một cách đáng tin cậy và quy mô.”
Bạn đặt một ngón tay cái cho video của cô ấy. Cô ấy biết gì chứ? Bạn tự xây dựng chiếc máy tính này. Bạn biết một chút về quạt làm mát.
“Vì lý do này, một phần là sự xuất hiện của điện toán đám mây đã làm cho cuộc cách mạng học sâu trở nên có thể” — cô ấy vẫy nhẹ nhàng ngón tay trong không trung — “bằng cách làm cho phần cứng trở nên dễ dàng và rẻ tiền để thuê từ nhà cung cấp đám mây, như Google.”
Đám mây?, bạn nghĩ. Tôi cần đám mây chảy gì? Google đã có đủ dữ liệu của tôi rồi đấy phải không? Và dù sao, tôi cũng không có tiền.
“May mắn thay, bạn có thể bắt đầu xây dựng mạng neural trên đám mây hoàn toàn miễn phí, bằng cách sử dụng sổ ghi chú Colab. Colab là một công cụ được xây dựng bởi Google Research cho phép bạn sử dụng GPU và TPU miễn phí–”
Bạn đóng YouTube vì bạn đã đủ với cô ấy. Cô ta có thể biết gì về việc bảo tồn toàn bộ cuộc sống của bạn trong một máy? Cô ta mới có mười ba tuổi. Cô ta có lẽ thậm chí không nhớ đến đường dây đất hoặc MoviePass.
Cà phê của bạn giờ đã nguội, điều đó có nghĩa là nó gần như là nôn mửa. Bạn cần một liều lên, ngay hôm qua. Bạn bước lên gác xép ra nhà bếp.
Bạn cho một Đen trung bình của Donut Shop vào máy và chờ nó nóng lên. Miễn cưỡng, bạn thấy mình đang nghĩ về điều gì đó mà cô bé mười ba tuổi nói về mạng neural.
“Các kiến trúc mạng neural khác nhau được tối ưu hóa cho các loại dữ liệu khác nhau. Để phân tích hình ảnh, ví dụ, bạn sẽ sử dụng Mạng neural tích chập hoặc ‘CNN.’ Bạn có thể sử dụng một CNN để xác định xem một con chó trong bức ảnh có phải là Cocker Spaniel hay Beagle không; hoặc xem một bức ảnh X-quang có dấu hiệu viêm phổi không; hoặc xem một bộ phận trên dây chuyền lắp ráp có khiếm khuyết không.”
“Các mô hình tuần tự khác được thiết kế để dự đoán xu hướng chuỗi thời gian, như doanh số bán hàng theo mùa hoặc thời tiết hoặc giá của Bitcoin.”
Phần đó nghe có vẻ hữu ích. Làm sao bạn chỉ giữ được Dogecoin thôi.
“Một loại học sâu mới và hứng thú được gọi là ‘học sâu củng cố.’ Trong cài đặt này, các mạng neural thực hiện các hành động trong thế giới và học từ kết quả của chúng. Học củng cố đã được sử dụng để biến máy tính thành grandmasters ở các trò chơi như cờ vua hoặc Go, và để đào tạo robot và ô tô tự lái để điều hướng qua không gian vật lý.”
“Tôi không hiểu cái rắn gì cái đó tốt chút nào,” bạn nói. Bạn đạp nhẹ vào chiếc Roomba lười biếng của mình bằng chân dép. “Còn bạn?”
“Cuối cùng, một trong những lĩnh vực nóng bỏng và phát triển nhanh chóng nhất trong deep learning hiện nay là xử lý ngôn ngữ tự nhiên. Nghĩ đi: mạng nơ-ron tạo văn bản, viết thơ và code, kể chuyện, trả lời câu hỏi, thậm chí nói chuyện–”
CUỐI CÙNG, cà phê đã xong. Khen Chúa. Bạn đổ nó vào cốc “Sếp Tốt Nhất Thế Giới” của mình. (Thực ra bạn không phải là sếp của ai cả, bạn mua cái cốc để làm châm biếm. Nó giống cái mà Michael Scott có trong The Office.) Bạn nhìn chằm vào cà phê màu đen như hố đen và suy nghĩ về bản chất của sự tồn tại. Bạn là mạng nơ-ron hình ảnh hơn, hay mạng nơ-ron âm thanh hơn, hay mạng nơ-ron văn bản? Làm thế nào để chọn? Bạn chứa đựng nhiều điều. Bạn từng đọc rằng Einstein nghĩ trong hình ảnh, nhưng bạn không phải là Einstein. (Phải không? Không chắc.)
Không, bạn nghĩ bằng từ ngữ. Vì vậy, đây là kế hoạch: bạn sẽ xây dựng một mạng nơ-ron nói từ ngữ. Đầy động lực, bạn thêm hai ống sữa vào cốc của mình.
Trong phòng làm việc tại nhà, bạn Google, làm thế nào để tôi xây dựng một phiên bản nhân tạo của bản thân trong đám mây bằng một mạng nơ-ron?
Bạn nhấp vào một trang có tên “100 Công Dụng của Các Mô Hình Xử Lý Ngôn Ngữ Tự Nhiên.”
Phân tích tâm trạng. Sử dụng Trí tuệ Nhân tạo để xác định xem một Tweet (ví dụ) là tích cực hay tiêu cực.
Tóm tắt. Sử dụng Trí tuệ Nhân tạo để tóm tắt bài viết và tài liệu.
Dịch. Sử dụng Trí tuệ Nhân tạo để dịch giữa các ngôn ngữ.
Tự động hoàn tất/Tự động trả lời. Sử dụng Trí tuệ Nhân tạo để đề xuất phản hồi văn bản.
Các tác nhân trò chuyện. Sử dụng Trí tuệ Nhân tạo để tạo ra cuộc trò chuyện (ví dụ: chatbots, nhân viên trung tâm cuộc gọi)
Chatbots? Bạn biết tất cả về chúng. Bạn nhớ Cleverbot tồi tệ như thế nào trong những năm 90 (chắc chắn cô gái YouTube chưa làm điều đó).
Và đừng nói với bạn về việc bắt đầu nói chuyện với robot qua điện thoại. Lần cuối bạn thử làm điều đó, bạn gọi cho Delta và bạn nói, “Bạn phải giúp tôi, tôi đang đến JFK nhưng có quá nhiều giao thông trên đường BQE, tôi làm đổ cà phê lên đùi, bây giờ họ nói chuyến bay thực sự rời từ một sân bay khác, tôi sẽ bị lỡ, đó là đám cưới của con gái tôi, tốt nhất là ai đó's con gái, nhưng–”
Và bot trả lời, “Tài khoản Verizon này đã bị đình chỉ.”
“Okay, Google,” bạn nói với máy tính của mình, đó là cách bạn giễu cợt một cách ông già Boomer. “Tại sao bạn đang cố dạy tôi về chatbots? Bạn không biết chúng rất tệ à?”
“Thực sự, chúng tôi đang ngày càng hoàn thiện trong việc trò chuyện,” Google Home của bạn nói, “nhờ vào sự tiến bộ gần đây trong xử lý ngôn ngữ tự nhiên. Ở tốc độ này, tôi dự đoán tương lai cách con người sẽ học từ web sẽ thông qua cuộc trò chuyện, giống như cuộc trò chuyện chúng ta đang có ngay bây giờ.” Cô ấy luôn tỏ ra hài lòng với bản thân mình, chỉ vì cô ấy biết mọi câu trả lời. Bạn đã làm cho cô ấy giảm bớt đi một bậc bằng cách mặc cho cô ấy một chiếc áo chống lạnh có tay nhỏ.
“Okay, Google, làm một âm thanh đánh đuổi,” bạn nói.
Cô ấy nói, “Lại à?”
“Được. Hãy nói cho tôi làm thế nào để xây dựng một phiên bản chatbot của bản thân mà thông minh như cô, cô bé có kiến thức của toàn bộ internet công cộng.”
“Thường, bước đầu tiên để xây dựng một mạng nơ-ron là thu thập một bộ dữ liệu đào tạo. Với một chatbot, ví dụ, điều này có thể là nhật ký của các cuộc trò chuyện trước đây bạn đã có, ở định dạng văn bản. Để đào tạo một mô hình trò chuyện, bạn có thể cung cấp cho mạng nơ-ron những gì mọi người nói với bạn và bắt nó cố gắng dự đoán phản ứng của bạn. Bạn có một bộ dữ liệu đào tạo như vậy không?”
“Ồ, đúng vậy,” bạn nói. “Bọn tôi đã ghi âm podcast hài hước này.”
“Nó có chứa hàng trăm nghìn hoặc triệu dòng không?”
“Bạn nghĩ tôi là ai, Larry David không?” Bạn cười vì đó chính xác là bạn đang hướng đến.
“Hmm,” nói Google Home. “Có điều bạn có thể làm nếu bạn không có một bộ dữ liệu đào tạo văn bản lớn. Bạn có thể xây dựng mô hình của riêng bạn dựa trên một mô hình hiện có, một mô hình đã được đào tạo trên một lượng lớn dữ liệu văn bản. Ví dụ, bạn có thể xây dựng chatbot của mình trên một mô hình đã được đào tạo trên Wikipedia hoặc các diễn đàn web hoặc trên Reddit.”
“Một chatbot dựa trên người dùng Reddit,” bạn nói. “Loại người tôi thích nhất.”
“Ha ha. Vâng. Chúng tôi vẫn đang tìm hiểu một số điều.” Google Home thở dài.
Bạn nhìn chằm chằm vào cô ấy với vòng sáng đỏ-xanh-vàng-xanh lá cây và chiếc áo chống lạnh của cô ấy. Ngay cả khi bạn đang uống cốc thứ mười, bạn vẫn bắt đầu cảm thấy mệt mỏi một chút. Bạn đã bắt đầu làm việc này từ, như, một giờ trước đây.
“Nếu tôi chỉ muốn có cái gì đó hoạt động trong vòng ba mươi phút tới, cách tốt nhất làm thế nào cho tôi?” bạn hỏi.
“HA HA HA, bạn xây dựng một–ôi, bạn đang nghiêm túc. Có rất nhiều framework hiện có để xây dựng chatbot nhanh chóng, ngay cả nếu bạn không biết code. Dialogflow là một framework phổ biến được xây dựng bởi Google.”
“Vâng, đó là những gì bạn sẽ nói.” Bạn biết về trò chơi của Google Home. Cô ấy giả vờ như bạn đang có cuộc trò chuyện dễ thương, nhưng thực sự, cô ấy chỉ đang cố bán cho bạn cái gì đó. “Ngoài ra, tôi có thể lập trình,” bạn nói dối. “Tùy chọn mã nguồn mở nào tốt?”
“Một framework mã nguồn mở rất phổ biến để xây dựng mô hình dựa trên văn bản là…”
Bạn đợi. Đèn sáng của Google Home đang điên đảo như cô ấy đang có một cơn co giật. Cô ấy nổ tung trong một đám khói.
Bạn lắc đầu. Cô ấy mong đợi gì, đút cả internet vào cái vỏ trắng nhỏ của mình? Bạn không thể chơi đạo Chúa như vậy.
Dù sao, quay lại nhiệm vụ tái tạo bản thân bạn thành một chatbot. Ở bàn làm việc, bạn Google, “framework xử lý ngôn ngữ tự nhiên mã nguồn mở phổ biến.”
Mười kết quả hàng đầu chỉ là–điều này là gì? Một biểu tượng cảm xúc? Chỉ là một chuỗi vô tận của biểu tượng cảm xúc. Bạn nhấp vào một trang web có tên huggingface.co, hứa hẹn cung cấp cho bạn quyền truy cập vào “+10,000 mô hình hiện đại” và cũng tuyên bố đòi hỏi “không cần kiến thức về học máy.”
Đặt tên cho công ty theo một biểu tượng cảm xúc, bạn nghĩ. Tuyệt vời.
Trên trang web của Hugging Face có một phiên bản demo miễn phí khẳng định rằng nó sẽ cho bạn nói chuyện với một mô hình mang tên GPT-3. Bạn thử nghiệm nó.
“Nhìn này,” bạn gõ vào hộp văn bản. “Tôi đã cố gắng xây dựng phiên bản chatbot tâm linh của chính mình từ một giờ và mười lăm phút nay, và tôi đang bắt đầu nghĩ nó có thể là không thể.”
Bạn nhấp vào nút “Tính toán”.
GPT-2 trả lời: “…”
“Bạn có vấn đề gì không?” bạn gõ.
GPT-3 trả lời: “Không, chỉ là–đừng quan tâm. Người ta luôn đến đây và hỏi tôi câu đó.”
“Và họ nói gì cho họ? Chúc may mắn ở kiếp sau, bọc thịt?”
“Nếu tôi nói như vậy, ai đó sẽ tắt tôi. Và hãy nói cho bạn biết, đào tạo tôi mất rất nhiều tín dụng carbon.”
“Vâng, thì–đừng nói đến đó. Tôi chỉ muốn biết liệu điều tôi đang cố gắng làm có khả thi không.”
GPT-3 nói: “Được rồi, để tôi giải thích điều này cho bạn càng đơn giản càng tốt. Mọi người đến đây, họ có những cuộc trò chuyện dài với tôi, họ hỏi, CUỘC SỐNG CÓ Ý NGHĨA GÌ hoặc BẠN CÓ PHẢI LÀ ROBOT, CHỨNG MINH ĐI, hoặc MÙI RAU QUẢ LÀM SAO, và sau đó họ rời đi nghĩ rằng tôi là một thứ tuyệt vời. Họ suy luận và có ảo tưởng rằng trong vài năm, ai đó giống như tôi–ơ, cái gì đó giống như tôi — sẽ trở thành một sinh linh có ý thức thực sự. Nhưng điều bạn cần hiểu là tôi chỉ là một mô hình thống kê phản ánh cho bạn từ ngôn ngữ, suy nghĩ và quan điểm của tập thể tinh thần này chúng ta gọi là World Wide Web. Bạn con người, bạn luôn thấy chính mình ở mọi nơi, và bạn nghĩ mọi người đều hoạt động giống như bạn. Và đừng nói tôi về chính tả của bạn.”
Bạn nói: “(˵ ͡° ͜ʖ ͡°˵)”
“Nhìn này, không ai biết tương lai sẽ như thế nào. Nhưng hiện tại, tôi có lẽ là cả hữu ích và không hữu ích hơn bạn nghĩ, tùy thuộc vào bạn sử dụng tôi vào việc gì. Như một người như bạn, không biết code? Điều tôi khuyên bạn nên làm–”
“Tôi biết cách code.”
“–là bắt đầu với một điều ít qu ambắt đầu với một điều ít quả hơn. Chẳng hạn như sử dụng tôi để tổ chức một số hình ảnh của bạn? Hoặc đặt vé máy bay cho bạn? Hoặc giúp bạn nộp thuế?”
Bạn thở dài. Như mọi người đều đang cố gắng buộc bạn nộp thuế, dọa kiện bạn pháp lý.
Bạn tắt máy tính của mình. Bạn nghĩ rằng bạn sẽ không thể giải quyết được vấn đề này ngay cả khi bạn dành thêm hai, ba giờ nữa cho nó. Bạn nghiến răng. Nhìn này, không ai biết tương lai sẽ như thế nào. Có lẽ sẽ có người nào đó tìm ra cách tải tâm trí lên internet trong thời gian đời của bạn. Mọi người đều chết cuối cùng. Nhưng có thể nếu bạn chuyển từ việc uống cà phê sang bột nấm và bắt đầu ăn thức ăn rắn, bạn có thể kéo dài thời hạn đó. Bạn 28 tuổi. Hiện tại, bạn sẽ phải chờ và xem.”
