5 điều cần biết về xu hướng mới nổi trong lĩnh vực AI: các mô hình nền tảng
Nếu bạn đã nhìn thấy những bức ảnh về một ấm trà hình cà chua hoặc đọc một bài viết viết rất hay nhưng lạc lõng theo hướng hơi kỳ cục, có thể bạn đã tiếp xúc với một xu hướng mới trong trí tuệ nhân tạo (AI).
Các hệ thống máy học như DALL-E, GPT và PaLM đang làm nổi bật bằng khả năng tuyệt vời của họ trong việc tạo ra công việc sáng tạo.
Các hệ thống này được biết đến là “các mô hình nền tảng” và không chỉ là sự sốt sảy và các màn ảo thuật. Vậy cách tiếp cận mới này của AI hoạt động như thế nào? Và liệu nó có làm kết thúc sự sáng tạo của con người và mở đầu cho một cơn ác mộng về deep-fake không?
1. Foundation models là gì?
Các mô hình nền tảng hoạt động bằng cách huấn luyện một hệ thống lớn duy nhất trên lượng lớn dữ liệu tổng quát, sau đó điều chỉnh hệ thống đó cho các vấn đề mới. Các mô hình trước đó thì thường bắt đầu từ đầu cho mỗi vấn đề mới.
TNW Conference 2024 - Kêu gọi tất cả các Startups tham gia vào ngày 20-21 tháng 6
Trình diễn startup của bạn trước các nhà đầu tư, những người thay đổi và khách hàng tiềm năng với các gói Startup được chọn lọc của chúng tôi.
Ví dụ, DALL-E 2 được đào tạo để phù hợp với các hình ảnh (như là một bức ảnh về chú mèo thú cưng) với phần mô tả ("Mr. Fuzzyboots, chú mèo tam thể, đang thư giãn dưới ánh nắng mặt trời") bằng cách quét hàng trăm triệu ví dụ. Một khi được đào tạo, mô hình này biết những thứ như mèo (và những thứ khác) trông như thế nào trong hình ảnh.
Nhưng mô hình cũng có thể được sử dụng cho nhiều nhiệm vụ trí tuệ nhân tạo khác thú vị, như tạo ra hình ảnh mới chỉ từ một phần mô tả ("Cho tôi xem một chú koala đang ghi bàn bóng rổ") hoặc chỉnh sửa hình ảnh dựa trên hướng dẫn bằng văn bản ("Làm cho nó trông giống như chú khỉ này đang nộp thuế").
2. Làm thế nào chúng hoạt động?
Các mô hình nền tảng chạy trên “mạng nơ-ron sâu”, được lấy cảm hứng từ cách não hoạt động. Chúng bao gồm toán học phức tạp và một lượng lớn sức mạnh tính toán, nhưng chúng có thể rút gọn thành một loại kiểu mẫu rất tinh vi.
Ví dụ, bằng cách nhìn vào hàng triệu hình ảnh mẫu, một mạng nơ-ron sâu có thể liên kết từng từ với các kiểu mẫu của pixel xuất hiện thường xuyên trong hình ảnh của đối tượng đó - như những hòn đậu mềm mại, mịn màng, lông lẻo. Càng nhiều ví dụ mô hình nhìn thấy (càng nhiều dữ liệu nó được hiển thị), và càng lớn mô hình (càng nhiều “lớp” hoặc “độ sâu” nó có), thì mẫu và sự tương quan này càng phức tạp.
Mô hình nền tảng, ở một khía cạnh, chỉ là một sự mở rộng của mô hình “học sâu” đã thống trị nghiên cứu trí tuệ nhân tạo trong thập kỷ qua. Tuy nhiên, chúng thể hiện những hành vi tự nhiên hoặc “phát sinh” có thể vừa làm ngạc nhiên vừa mới lạ.
Ví dụ, mô hình ngôn ngữ PaLM của Google dường như có thể tạo ra giải thích cho các tập tục phức tạp và trò đùa. Điều này vượt ra khỏi việc đơn giản bắt chước các loại dữ liệu mà nó được đào tạo ban đầu để xử lý.
The PaLM language model can answer complicated questions. Image: Google AI3. Truy cập bị hạn chế - tạm thời
Quy mô khổng lồ của những hệ thống trí tuệ nhân tạo này là khó tưởng tượng. PaLM có 540 tỷ tham số, có nghĩa là ngay cả khi mọi người trên hành tinh này ghi nhớ 50 số, chúng ta vẫn không đủ không gian lưu trữ để tái tạo mô hình.
Những mô hình này quá to lớn nên việc đào tạo chúng đòi hỏi lượng lớn tài nguyên tính toán và các nguồn lực khác. Một ước lượng đặt chi phí đào tạo mô hình ngôn ngữ GPT-3 của OpenAI khoảng 5 triệu đô la Mỹ.
Do đó, chỉ có các công ty công nghệ lớn như OpenAI, Google và Baidu mới có khả năng xây dựng các mô hình nền tảng hiện tại. Những công ty này giới hạn ai có thể truy cập vào các hệ thống, điều này là hợp lý về mặt kinh tế.
Các hạn chế về việc sử dụng có thể mang lại sự an tâm cho chúng ta rằng những hệ thống này sẽ không sớm được sử dụng cho các mục đích đen tối (như tạo tin giả mạo hoặc nội dung bôi nhọ) trong thời gian ngắn. Nhưng điều này cũng có nghĩa là các nhà nghiên cứu độc lập không thể thẩm vấn những hệ thống này và chia sẻ kết quả một cách mở và có trách nhiệm. Vì vậy, chúng ta vẫn chưa biết đầy đủ tác động của việc sử dụng chúng.
4. Những mô hình này sẽ ý nghĩa gì đối với các ngành nghệ 'sáng tạo'?
Các mô hình nền tảng sẽ được sản xuất nhiều hơn trong những năm tới. Các mô hình nhỏ hơn đã được xuất bản dưới dạng nguồn mở, các công ty công nghệ đang bắt đầu thử nghiệm với việc cấp phép và thương mại hóa những công cụ này và các nhà nghiên cứu trí tuệ nhân tạo đang nỗ lực làm cho công nghệ trở nên hiệu quả và tiện lợi hơn.
Sự sáng tạo đáng kinh ngạc được thể hiện bởi các mô hình như PaLM và DALL-E 2 chứng minh rằng các công việc chuyên nghiệp sáng tạo có thể bị ảnh hưởng bởi công nghệ này sớm hơn so với dự kiến ban đầu.
Tri thức truyền thống luôn nói rằng robot sẽ đẩy lùi công việc 'màu xanh lá cây' trước. Công việc 'màu trắng' được cho là tương đối an toàn khỏi tự động hóa - đặc biệt là công việc chuyên nghiệp yêu cầu sự sáng tạo và đào tạo.
Mô hình trí tuệ nhân tạo học sâu đã thể hiện độ chính xác vượt trội hơn con người trong các nhiệm vụ như đánh giá tia X và phát hiện bệnh mạch vàng. Các mô hình nền tảng có thể sớm cung cấp sự sáng tạo giá rẻ, 'đủ tốt' trong lĩnh vực quảng cáo, viết quảng cáo, hình ảnh chứng khoán hoặc thiết kế đồ họa.
Tương lai của công việc chuyên nghiệp và sáng tạo có thể trông có chút khác biệt so với những gì chúng ta mong đợi.
5. Điều này có nghĩa gì đối với bằng chứng pháp lý, tin tức và truyền thông
Các mô hình nền tảng sẽ không thể tránh khỏi việc ảnh hưởng đến luật lệ trong các lĩnh vực như sở hữu trí tuệ và bằng chứng, vì chúng ta sẽ không thể giả định rằng nội dung sáng tạo là kết quả của hoạt động của con người.
Chúng ta cũng sẽ phải đối mặt với thách thức từ tin đồn và thông tin sai lệch được tạo ra bởi những hệ thống này. Chúng ta đã phải đối mặt với vấn đề lớn với tin đồn, như chúng ta thấy trong cuộc xâm lược của Nga vào Ukraine và vấn đề mới nảy sinh của ảnh và video deep fake, nhưng các mô hình nền tảng đang chuẩn bị nâng cấp mạnh mẽ các thách thức này.
Đến lúc chuẩn bị
Là những nhà nghiên cứu nghiên cứu về tác động của trí tuệ nhân tạo đối với xã hội, chúng tôi nghĩ rằng các mô hình nền tảng sẽ mang lại những biến đổi lớn. Chúng được kiểm soát chặt chẽ (tạm thời), vì vậy chúng ta có thời gian một chút để hiểu rõ về những ảnh hưởng của chúng trước khi chúng trở thành một vấn đề lớn.

Bài viết này được đăng lại từ The Conversation dưới giấy phép Creative Commons. Đọc bài viết gốc.
