Khi xem hai video ngắn, bạn có thể nhìn thấy sức mạnh của GPT-3 đến đâu.
OpenAI, một trong những tổ chức nghiên cứu trí tuệ nhân tạo hàng đầu của thế giới, vừa công bố một công cụ mới có tên là GPT-3, được gọi là 'phát sinh ngôn ngữ tự nhiên'. Họ đã gửi nó cho một số nhà phát triển nội dung đã được chọn trước để dùng thử. Theo các nhận định ban đầu, các đoạn văn mà GPT-3 tạo ra gần như không thể phân biệt được với các sản phẩm do con người tạo ra, và mọi người đều ngạc nhiên trước khả năng của nó trong việc viết code, bắt chước các nhà văn nổi tiếng, thậm chí GPT-3 còn có thể hoàn thiện được nửa sau của một bản thảo về 'cách thức điều hành một buổi họp của ban giám đốc'.
GPT-3 là một thuật toán có khả năng nhận ra các mẫu hình trong một lượng lớn dữ liệu văn bản được tạo ra bởi con người, và dựa vào đó để tự tạo ra các câu và đoạn văn giống với các mẫu hình đã tìm thấy trong cơ sở dữ liệu đó.

Ảnh minh họa bởi Alex Castro.
Các mô hình tạo ngôn ngữ đã và đang xuất hiện ở nhiều nơi và được sử dụng trong nhiều hệ thống. Ví dụ, Smart Compose của Google vẫn đang giúp người dùng hoàn thiện câu chữ trong các email mà họ viết, và trang báo Associated Press đã bắt đầu sử dụng trí tuệ nhân tạo để viết các tin tức thể thao ngắn. Tuy nhiên, lối viết của những công cụ này vẫn còn hạn chế và không tự nhiên do dữ liệu huấn luyện của chúng chưa đủ, và mô hình ngôn ngữ của chúng chưa hoàn thiện.
'Xét về mặt lịch sử, các hệ thống phát sinh ngôn ngữ tự nhiên vẫn thiếu đi sự phong phú trong biểu đạt', Carolyn Rose, giáo sư tại Viện Công nghệ Ngôn ngữ thuộc Đại học Carnegie Mellon nhận định. Tuy nhiên, GPT-3 lại có một cách tiếp cận khác. Dựa trên phản hồi từ những người dùng đầu tiên, GPT-3 vượt trội hơn các mô hình phát sinh ngôn ngữ tự nhiên trước đó nhờ có một lượng dữ liệu khổng lồ và 175 tỷ tham số - đó là những quy tắc cơ bản mà thuật toán dựa vào để đưa ra quyết định về từ nào phù hợp nhất với ngữ cảnh. Phiên bản trước đó của GPT-2 chỉ có 1,5 tỷ tham số, và mô hình tạo ngôn ngữ tự nhiên mạnh nhất của Microsoft chỉ có 17 tỷ tham số.
OpenAI đã công bố thông số kỹ thuật của GPT-3 vào tháng Năm, nhưng cho đến cuối tháng Bảy, họ mới gửi công cụ cho những nhà phát triển nội dung được chỉ định trước. Trên Twitter, những người dùng đã thử nghiệm GPT-3 cho biết sự ngạc nhiên của họ: công cụ này có thể viết mã để tạo ra một trang web dựa trên mô tả bằng tiếng Anh, hoặc viết một bài thơ theo phong cách của Shakespeare. Họ mô tả GPT-3 như một công cụ đột phá có thể làm cho công việc trở nên dễ dàng hơn đối với nhiều người, nhưng cũng có nguy cơ khiến nhiều người mất việc.
Cảm nhận tích cực và tiêu cực
Nghệ sĩ người Đức Mario Klingemann đã sử dụng GPT-3 để tạo ra các câu chuyện với phong cách văn học tương tự các tác giả khác nhau.
'Mọi người coi GPT-3 như một đại diện của những thay đổi lớn trong lĩnh vực xử lý ngôn ngữ tự nhiên và lập trình, tùy thuộc vào lĩnh vực chuyên môn của họ', Oren Etzioni, CEO của Viện Nghiên cứu Allen, phát biểu. Công cụ này được xây dựng trên cơ sở các đột phá trước đó và 30 năm nghiên cứu và thử nghiệm về trí tuệ nhân tạo. 'Chưa rõ đây có phải là một bước tiến lớn hay không, nhưng chắc chắn là nó rất ấn tượng', ông Etzioni nhận xét.
Bởi OpenAI đã công bố GPT-3 dưới dạng API, bất kỳ ai cũng có khả năng sử dụng công cụ mới này, kể cả những người không có khả năng tính toán mạnh mẽ hoặc kiến thức về lập trình và huấn luyện các mô hình ngôn ngữ tự nhiên. Mặc dù GPT-3 không phải là một đột phá mới, nó vẫn có thể dẫn đến các cải tiến lớn trong lĩnh vực tự động tạo ra văn bản. Ví dụ, hệ thống đọc chữ text-to-speech sẽ được cải thiện đáng kể.
Rõ ràng, GPT-3 không hoàn hảo. CEO Sam Altman của OpenAI nhấn mạnh rằng nó vẫn còn nhiều điểm yếu và thậm chí còn mắc phải những lỗi ngớ ngẩn. Mặc dù trí tuệ nhân tạo sẽ thay đổi thế giới, nhưng GPT-3 chỉ là một phần nhỏ của tương lai đó. OpenAI 'vẫn cần khám phá nhiều khía cạnh khác nữa', ông nói.
Thành công ban đầu của GPT-3 đã đặt ra những câu hỏi về đạo đức trong một hệ thống không biết đạo đức. Ông Etzioni cũng lưu ý rằng khả năng giả giọng của GPT-3 có thể làm khó khăn hơn việc lọc nội dung giả mạo. Hơn nữa, nó có thể tự học và củng cố các định kiến tồn tại trong xã hội, bao gồm cả định kiến về một nhóm nhỏ mà đại diện cho toàn bộ cộng đồng.
'Nhìn vào, tất cả chỉ là sự máy móc. Không có khả năng đánh giá giá trị thực sự và phân biệt đâu là cái đẹp”, giáo sư Carolyn Rose nhận định.
Tham khảo từ Business Insider
