(Tổ Quốc) - Công cụ mới được cho là 'chỉ mang tính thủ tục' vì chỉ xuất hiện sau khi có những lo ngại rằng các chatbot AI có thể tạo ra sự không trung thực trong học thuật và cản trở quá trình giảng dạy.
Những người tạo ra chatbot ChatGPT - công cụ AI gây tranh cãi vì khả năng mô phỏng văn phong con người - đã phát hành một công cụ mới được thiết kế để phát hiện văn bản được tạo ra bởi các công cụ trí tuệ nhân tạo.
Thông báo được OpenAI đưa ra đang diễn ra trong bối cảnh tranh luận dữ dội tại các trường học và đại học trên toàn thế giới, liên quan đến lo ngại rằng ChatGPT có thể được sử dụng để hỗ trợ học sinh làm bài tập và gian lận trong các kỳ thi.
Trong một bài đăng trên blog vào ngày 31/1, công ty có trụ sở tại Mỹ cho biết công cụ nhận diện của họ đã được huấn luyện 'để phân biệt giữa văn bản được viết bởi con người và văn bản được viết bởi AI từ nhiều nhà cung cấp khác nhau.'

Ảnh chụp màn hình của công cụ nhận diện văn bản do máy viết của OpenAI.
Tuy nhiên, OpenAI cũng cảnh báo rằng công cụ của họ có thể gặp lỗi, đặc biệt là với các văn bản có ít hơn 1.000 ký tự. Công ty cũng cho biết họ khuyến nghị chỉ sử dụng công cụ phân loại này với văn bản bằng tiếng Anh, vì nó hoạt động kém hơn ở các ngôn ngữ khác.
“Công cụ phân loại của chúng tôi không hoàn toàn đáng tin cậy”, OpenAI thông báo trong một tuyên bố báo chí, nhấn mạnh điều này bằng cách in đậm.
“Mặc dù không thể phát hiện mọi văn bản do AI viết một cách đáng tin cậy, nhưng chúng tôi tin rằng các công cụ phân loại tốt có thể cung cấp thông tin để giảm thiểu các tuyên bố sai lầm về việc văn bản do AI tạo ra có thể viết bởi con người”, OpenAI tuyên bố. “Ví dụ như việc tự động chạy các chiến dịch thông tin sai lệch, sử dụng các công cụ AI để gian lận trong học thuật và việc định danh một chatbot AI như một con người.”
Một trường đại học hàng đầu ở Pháp gần đây đã cấm sinh viên sử dụng ChatGPT để hoàn thành bài tập. Quyết định này được đưa ra ngay sau khi có tin ChatGPT đã vượt qua kỳ thi tại một trường luật ở Mỹ sau khi viết các bài luận về nhiều chủ đề, từ luật hiến pháp đến thuế.
“Chúng tôi nhận ra rằng việc xác định văn bản do AI tạo ra là một vấn đề quan trọng cần thảo luận giữa các nhà giáo dục, và một điều quan trọng không kém là nhận biết các giới hạn và tác động của các công cụ phân loại văn bản do AI tạo ra trong lớp học,” công ty viết trong một bài đăng. “Chúng tôi cũng đang hợp tác với các nhà giáo dục tại Mỹ để tìm hiểu những gì họ đang gặp phải trong lớp học của họ và thảo luận về khả năng cũng như hạn chế của ChatGPT.”
Các quan chức chính quyền ở New York và một số khu vực pháp lý ở Mỹ đã cấm sử dụng chatbot AI này trong các trường học. Một nhóm các trường đại học ở Úc tuyên bố sẽ thay đổi cách thi để loại bỏ các công cụ AI và coi chúng là hành vi gian lận.

Động thái mới của OpenAI được xem là chỉ mang tính hình thức.
Theo PCWorld, công cụ phân loại văn bản mới của OpenAI đã tiết lộ một điểm yếu nghiêm trọng. Đó là nó “dễ dàng bị lừa”. Thực tế, chính nhà sản xuất OpenAI cũng thừa nhận rằng bộ phân loại đã xác định 26% văn bản do AI viết là do con người viết, trong khi coi 9% văn bản do con người viết là do AI tạo ra.
Trong một thử nghiệm nhanh, công cụ này không thể xác định liệu một đoạn văn bản ngẫu nhiên từ cuốn Bắt trẻ đồng xanh của nhà văn JD Salinger có phải do AI viết hay không.
“Công cụ của OpenAI không chỉ đưa ra những kết luận mơ hồ mà còn không đủ để xác định văn bản nào do AI tạo ra”, bài viết trên PCWorld nhận định.
Rõ ràng, không thể kỳ vọng một công ty sản xuất chatbot AI sẽ tung ra một công cụ có thể làm hại đến sản phẩm chính của họ, dù có thực sự làm được việc đó hay không. Một số chuyên gia cho rằng đây chỉ là một động thái mang tính hình thức, nhằm làm dịu các luồng phản đối ChatGPT vì sức mạnh đáng sợ của nó trong lĩnh vực học thuật và giáo dục.

Hive Moderation mang lại kết quả rõ ràng và đáng tin cậy hơn công cụ của OpenAI.
Thay vào đó, trên thị trường hiện cũng có một công cụ miễn phí được sử dụng để phân biệt văn bản có phải do AI viết hay không. Nó được cho là có hiệu suất cao hơn sản phẩm mới của OpenAI, với tên gọi Hive Moderation.
Hive Moderation trả về kết quả kèm theo tỷ lệ phần trăm tin cậy hoặc khả năng bao nhiêu phần trăm mẫu văn bản chứa nội dung do AI tạo ra. Thậm chí khi thử yêu cầu trong ChatGPT viết một đoạn văn theo cách khó có thể nhận ra nó là do AI viết, Hive Moderation cũng không bị lừa.
Đại học Stanford gần đây cũng tuyên bố đã phát hiện ra phương pháp 'lật mặt' ChatGPT với tên gọi mới là DetectGPT. Sử dụng phương pháp 'zero-shot' trong lĩnh vực học máy, DetectGPT có thể phát hiện văn bản do AI viết mà không cần biết về loại AI đã được sử dụng để tạo văn bản đó. Nó hoạt động hoàn toàn ngược lại với các phương pháp kiểm tra khác thường yêu cầu đào tạo một 'bộ phân loại' và sử dụng bộ dữ liệu của các đoạn văn bản thật và giả.
Các thử nghiệm đã cho thấy kết quả đầy hứa hẹn khi phát hiện các văn bản không phải do con người sản xuất, vượt trội so với các phương pháp khác.
Tham khảo PCWorld, SCMP
