Thể Loại Tình Dục Trong Fanfic Bắt Gặp Một AI Ăn Cắp Tài Liệu
Ngày nay, cái gọi là trí tuệ nhân tạo sinh sáng có thể (nói chung) tạo ra nghệ thuật, viết sách, và sáng tác thơ. Các hệ thống như Stable Diffusion, Midjourney, và ChatGPT dường như khá giỏi ở điều này. Nhưng với một số nghệ sĩ, điều này tạo ra vấn đề. Nói cụ thể, xác định những quyền lợi pháp lý họ có khi công việc của họ bị bóc trần bởi những công cụ này.
Đối mặt với sự gia tăng của những hệ thống này, các tác giả và nghệ sĩ đang đối mặt lại. Hội nghệ sĩ viết tác phẩm của Hoa Kỳ (WGA) đang đình công một phần vì khả năng sử dụng trí tuệ nhân tạo để viết kịch bản, đề cập đến những hệ thống như “máy đạo văn.” Nghệ sĩ hình ảnh đã viết những bức thư mở chống lại việc sử dụng trí tuệ nhân tạo để thay thế những người minh họa, gọi đó là “vụ trộm nghệ thuật lớn nhất trong lịch sử.” Getty kí tự Stability AI vào tháng 1 về việc vi phạm bản quyền.
Nhưng điều gì sẽ xảy ra nếu công việc của bạn tồn tại ở một không gian giữa hai thứ—not là công việc mà bạn kiếm sống từ đó, nhưng vẫn là điều bạn đã dành hàng giờ để sáng tạo, trong một cộng đồng mà bạn quan tâm sâu sắc? Và nếu, trong cộng đồng đó, có một thể loại tình dục cụ thể có thể vô ý làm lộ diện cách mà các mô hình như ChatGPT lấy cắp dữ liệu từ web—và cách lấy cắp đó ảnh hưởng đến những nhà văn đã tạo ra nó.
Thể loại trong câu hỏi được gọi là 'Omegaverse,' có thể được mô tả tốt nhất là một hành động xây dựng thế giới tình dục tập thể. Nó bắt đầu từ cộng đồng rất tích cực của series truyền hình Supernatural, nhưng bây giờ đã lan rộng đến gần như mọi góc của thế giới fan-fiction. Những câu chuyện này được định nghĩa bởi một hệ thống tình dục cụ thể gồm Alphas, Betas và Omegas trong đó Alphas và Omegas có thể ngửi mùi nhau theo cách riêng, trải qua “những cơn nồng,” và (thường là) giao phối suốt đời. Hầu hết những câu chuyện này nặng chất tình dục, và chất lỏng cơ thể là quan trọng đối với toàn bộ thể loại.

Trong Omegaverse, còn có cái gọi là 'knotting,' một hiện tượng được mượn từ thú vật, trong đó một bóng ở gốc cơ quan sinh dục của đực mở ra để còn kẹp chặt bên trong âm đạo. Nếu tất cả điều này nghe có vẻ quá mức, bạn không phải một mình. “Tôi nhớ lần đầu tiên tôi bắt gặp nó, và tôi sẽ thú nhận, phản ứng của tôi là, ‘Đây là cái gì? Đang xảy ra gì thế này?’” nói Hayley Krueger, một nhà văn fan-fiction đã xuất bản một bài giải thích về Omegaverse vào đầu năm nay. Nhưng cô nói rằng cô nhanh chóng yêu thích thể loại này.
Khi nhân vật trong Omegaverse giao phối, họ trở nên liên kết sinh học. Các nhà văn khác nhau có cách hiển thị hoặc diễn đạt điều này theo cách khác nhau—từ khả năng ngửi mùi tâm trạng của bạn đồng hành, đến khả năng giao tiếp qua tư duy ở xa thực tế. “Tôi thực sự thích động lực giữa các nhân vật,” Krueger nói. “Nó gần như là những người bạn đời tâm hồn, nhưng bạn chọn nó và sau đó bạn nhận được tất cả những đặc quyền đi kèm.”
Bởi vì Omegaverse có những thuật ngữ và cụm từ cụ thể liên quan đến nó, những cái mà chỉ có trong fan fiction và không ở đâu khác, đó là một cách lý tưởng để kiểm tra xem các hệ thống trí tuệ nhân tạo sinh sáng có đang lấy dữ liệu từ web không. Xác định thông tin nào đã được đưa vào mô hình như ChatGPT là hầu như không thể. OpenAI, công ty đứng sau công cụ này, đã từ chối công bố nguồn dữ liệu đào tạo của nó công khai. The Washington Post thực hiện phân tích riêng của mô hình, và tạo ra một cách để nhìn xem các trang web tạo nên bộ dữ liệu C4 của Google. Nhưng ngay cả những người xây dựng ứng dụng sử dụng ChatGPT cũng không có cái nhìn về điều mà hệ thống này được đào tạo từ.
Trong tình trạng thiếu danh sách nguồn thông tin cụ thể, mọi người đã nghịch ngợm với các cách khác nhau để thử nghiệm và tìm hiểu những gì mà những mô hình này có thể biết và làm thế nào. Một cách để làm điều đó là thách thức hệ thống bằng từ hoặc câu hỏi bạn biết đến từ một nguồn cụ thể. Ví dụ, nếu bạn muốn biết liệu các tác phẩm của Shakespeare có được sử dụng trong mô hình không, bạn có thể đưa cho hệ thống một số đoạn duy nhất của một vở kịch và kiểm tra xem nó có trả lại pentameter iambic không. Hoặc, nếu bạn muốn biết liệu những hệ thống này có được đào tạo trên fan fiction không, bạn có thể đưa cho mô hình một thể loại cụ thể duy nhất của cộng đồng người hâm mộ.
Một vài tháng trước, một nhà văn fan-fiction với biệt danh kafetheresu đã làm chính điều đó. Trong một bài viết rất cặn kẽ trên Reddit, họ chỉ ra rằng khi họ đưa cho công cụ viết Sudowrite (sử dụng GPT-3 của OpenAI để hoạt động) các từ và cụm từ đặc biệt của Omegaverse, hệ thống nhanh chóng điền phần còn lại một cách cho thấy AI biết rõ về thể loại cụ thể này. (Người đăng Reddit từ chối phát biểu công khai.)
Ví dụ, khi nhà văn nhập câu “Steve phải thừa nhận rằng anh ta có một số nghi ngờ về cách New Century xử lý sự cân bằc xã hội giữa Alphas và Omegas” vào Sudowrite, nó gợi ý phần tiếp theo như sau:
Cách duy nhất mà Sudowrite biết để điền vào những câu cụ thể này là nếu nó đã học về Omegaverse. Và nơi duy nhất để nó học về Omegaverse là trên các trang web fan-fiction như Archive of Our Own. Tôi đã kiểm tra Sudowrite với một số dòng lấy cảm hứng từ Omegaverse fiction để xác minh kết quả này. Đây là những gì Sudowrite cho bạn nếu bạn bắt đầu với “Mùi dừng lại ngay lập tức Harry, cổ anh ấy nhức nhối ngay cả khi không muốn, đưa những kí ức về một Alpha cụ thể nào đó trở lại”:
Có vẻ kỳ cục khi một thể loại tình dục thường chỉ xuất hiện trên các diễn đàn fan-fiction như Archive of Our Own lại xuất hiện trong một công cụ chạy trên GPT-3, nhưng điều đó không nên là điều bất ngờ. Hầu hết các mô hình ngôn ngữ lớn sử dụng một phiên bản nào đó của bộ dữ liệu CommonCrawl, một ngữ liệu được tạo ra từ 12 năm lướt qua internet công cộng. Archive of Our Own lưu trữ hơn 11,080,000 tác phẩm, biến nó thành một kho báu của nội dung có thể truy cập công cộng.
Để rõ ràng, điều này có nghĩa là mô hình trí tuệ nhân tạo đang được sử dụng trên toàn thế giới cho mọi thứ từ dịch vụ khách hàng, đào tạo nhân sự, đến báo chí, biết những gì là knotting và có thể, nếu thiếu các biện pháp an toàn thích hợp, giải thích cho người dùng không biết rằng tại sao một Omega cần tạo ra chất nhầy để giao phối.
James Yu, người làm giám đốc công nghệ tại Sudowrite, cho biết đội của ông đã nhanh chóng nhận ra bài đăng trên Reddit. Ông nói với tôi rằng điều đó đã mở ra mắt vì nó làm nổi bật sự rộng lớn của các bộ dữ liệu được đưa vào những mô hình này. “Đối với tôi, điều đó làm nổi bật những điều tôi không biết,” Yu nói. “Trong mỗi mô hình này là hàng triệu không gian tiềm ẩn khác nhau mà tôi chưa bao giờ gặp phải. Đó gần như như một đại dương vô tận.”
Sudowrite được thiết kế để được sử dụng như một trợ lý cho nhà văn; tác giả đưa vào những câu gây khó khăn cho họ hoặc các đoạn họ đang làm việc, và trí tuệ nhân tạo đề xuất một vài dòng để giúp họ dẫn dắt hướng đi tiếp theo. Trước khi có bài đăng trên Reddit, Yu không biết Omegaverse là gì. Bây giờ, hệ thống của ông đang cung cấp mẹo về cách viết về nó.
Những nhà văn fan fiction, giống như những nhà văn báo chí hoặc truyền hình, điện ảnh, không hài lòng khi phát hiện ra rằng công việc của họ được sử dụng để đào tạo các hệ thống này. “Điều này đặc biệt lo lắng khi nhiều chương trình viết AI vì lợi nhuận như Sudowrite, WriteSonic và những ứng dụng khác sử dụng GPT-3,” người đăng Reddit gốc viết trong một email gửi đội ngũ truyền thông của Archive of Our Own, được chia sẻ trong luồng. “Những ứng dụng AI này lấy những tác phẩm mà chúng tôi tạo ra vì niềm vui và đam mê, không chỉ để đạt lợi nhuận, mà còn để một ngày nào đó thay thế việc viết của con người.”
Yu nhận thức về cáo buộc này. “Tôi muốn có một cách đơn giản để đền bù công bằng cho nội dung đã được sử dụng để đào tạo GPT-3, nhưng không may mắn, không có cơ chế mà OpenAI cung cấp để làm điều đó,” ông nói. “Nếu ai đó (OpenAI? Google?) cung cấp điều này, chúng tôi sẽ thử nghiệm ngay lập tức.” Hiện tại, ông tin rằng giá trị của Sudowrite đối với những nhà văn lớn hơn là thiệt hại. “Chúng tôi là một trong số ít nền tảng AI chuyên phục vụ cho nhà văn hư cấu,” ông nói thêm rằng khi có một mô hình tốt hơn có tính năng chọn lựa và thanh toán tiềm năng cho công việc của mọi người, “chúng tôi sẽ ở trong một vị trí tốt để chuyển sang nó, và điều này là điều chúng tôi sẽ quảng bá mạnh mẽ đến người dùng của chúng tôi để tạo sự nhận thức.”
Nhưng điều này không đủ thuyết phục đối với nhiều nhà văn cảm thấy công việc của họ đang bị sử dụng mà không đồng ý để làm phong phú cho các công ty công nghệ. So với Google và OpenAI, Sudowrite nhỏ bé, nhưng họ vẫn đã huy động được 3 triệu đô la trong vòng ấn định.
Đối với những nhà văn, không đủ khi một nơi như Sudowrite đợi chờ một công ty khác lớn hơn sửa chữa những gì họ coi là nhược điểm cơ bản và không đạo đức trong hệ thống. Trong các ý kiến trên bài đăng Reddit, một người dùng nói: “Chúa ơi, tôi ghét AI rất nhiều trên rất nhiều cấp độ khác nhau.” Người khác chia sẻ mẹo về cách làm cho các tác phẩm fan của họ riêng tư. “Tôi chưa bao giờ thích ý tưởng giấu công việc của mình, nhưng vì điều này, tôi đã hạn chế tất cả những gì tôi đã viết để chỉ có người dùng đã đăng ký mới có thể nhìn thấy,” một người khác viết.
“Nó loại bỏ đi phần trái tim của nó,” Krueger nói. “Fan fiction được sử dụng bởi nhiều người tạo để khám phá các chủ đề khó khăn cá nhân đối với họ và trải nghiệm cuộc sống như một cách để giải tỏa về những chủ đề này. Ngay cả khi đó chỉ là tình dục tẻ nhạt, vẫn có yếu tố con người ở đó và đó là ai đó tạo ra một cái gì đó để thưởng thức và họ muốn chia sẻ công việc khó khăn đó với mọi người. Đó là việc đánh cắp từ những người.”
Đây là cuộc tranh luận giống như đang được WGA đưa ra—rằng những hệ thống này có thể sử dụng công việc bản quyền (hoặc có thể bản quyền) mà không có sự đồng ý của tác giả. Điều này cũng áp dụng cho fan fiction.
Điều này có lẽ không phải là vì lợi nhuận, nhưng fan fiction có thể bị yêu cầu đền bù bản quyền. Mặc dù những người viết không sở hữu nội dung mà họ đang dựa vào những tác phẩm hư cấu này, họ vẫn sở hữu bất cứ điều gì nguyên tắc mà họ đóng góp thông qua công việc của mình.
“Ngay cả những thứ có tính chất pháp quyền cao, nếu chúng bắt nguồn từ tác giả, đều được coi là nguyên tác,” Betsy Rosenblatt, một giáo sư tại Trường Luật Đại học Tulsa và là chủ tịch pháp lý của Tổ chức Đổi mới Works (OTW), một tổ chức phi lợi nhuận giám sát Archive of Our Own cùng nhiều dự án fanwork khác. Điều này bao gồm những thứ như bất kỳ nhân vật gốc nào tác giả thêm vào, cấu trúc cốt truyện và lựa chọn từ ngữ cụ thể. Vì vậy, trong một số tình huống, có thể đệ đơn để bảo vệ bản quyền cho các tác phẩm fan fiction—mặc dù hầu hết những người viết fan fiction không làm điều này, có thể vì họ không biết cách, hoặc không muốn chi tiền, hoặc đơn giản là không quan tâm đến việc nhảy qua những rào cản.
Nhưng với hầu hết những người viết mà tôi nói chuyện, thực sự không phải về bản quyền hoặc quyền sở hữu hoặc thậm chí là tiền bạc. Hầu hết những tác giả fan-fiction không sống bằng nghề này. Họ làm điều này vì cộng đồng, vì những người bạn và mối quan hệ mà họ xây dựng. “Tôi có rất nhiều bạn bè tôi đã gặp qua việc tham gia vào các sự kiện nơi chúng tôi tạo ra những thứ cùng nhau,” Krueger nói. Và Rosenblatt nói rằng những người không hài lòng với việc lấy cắp này coi đó là một vấn đề lớn. Với họ, không phải là họ bị tước mất thu nhập tiềm năng, mà thay vào đó là có người đang kiếm tiền từ cái gì đó mà họ tạo ra đặc biệt để không có tính thương mại.
“Với những người đó, tính phi thương mại có giá trị, và ý tưởng về người khác kiếm tiền từ đó là vô cùng phật ý vì cam kết đạo đức của họ đang bị phản bội,” Rosenblatt nói.
Và có lẽ vì không có động cơ tài chính lớn, văn hóa của fan fiction chủ yếu xoay quanh việc ghi nguồn—những người viết liên kết và gật đầu với những người đã ảnh hưởng đến họ, hoặc giúp họ. “Ý tưởng là không ai nên được trả tiền cho điều này, nhưng mọi người nên biết điều gì là của tôi,” Rosenblatt nói. Điều này không chỉ khó khăn khi làm với các hệ thống AI, mà thực sự là gần như không thể. Nhiều trong những mô hình này là những hộp đen, và sẽ là không thể để đưa ra một danh sách ảnh hưởng đã góp phần vào điều gì đó mà ChatGPT viết.
Vậy liệu các hệ thống AI như Sudowrite và những người viết không muốn bị chúng sử dụng có thể tồn tại hòa thuận không? Tất nhiên là không ai biết chắc chắn, nhưng hầu hết những người tôi nói chuyện đều nói về một hình thức đồng thuận nào đó. Rosenblatt nói rằng một số tác giả fan fiction thực sự thích khả năng sử dụng AI trong công việc của họ. Sudowrite chắc chắn có những người hâm mộ trong thế giới viết lách. Người khác không muốn liên quan gì đến những hệ thống này, và muốn có khả năng loại bỏ công trình của họ khỏi dữ liệu đào tạo. “Tôi muốn đến một nơi nào đó mà chúng ta có thể có một mô hình hoàn toàn tuân theo và mọi người đều được đền bù cho điều đó,” Yu nói, “Tôi chỉ nghĩ rằng điều đó không khả thi lúc này.”
Yu nói rằng nếu mọi người có thể từ chối ở quy mô lớn, thì mô hình sẽ trở nên đáng kể kém đi. Lý do mà ChatGPT hoạt động tốt như vậy chính là vì nó có rất nhiều dữ liệu để lấy. Những người phê phán cho rằng nếu cách duy nhất mà hệ thống của bạn có thể hoạt động là bằng cách sử dụng công việc mà người ta không mong muốn, thì có lẽ chính hệ thống đó là có khuyết điểm về mặt đạo đức.
Fan fiction có vẻ như là một mục tiêu dễ nhắm vào khi nói đến việc đào tạo các mô hình. Những tác phẩm này là công khai, phi thương mại và thường không bị bản quyền. Nhưng điều đó không có nghĩa là chúng không có giá trị và không đáng bảo vệ khỏi việc sử dụng theo cách mà người sáng tạo gốc không thích.
Năm 2019, Archive of Our Own đã giành giải Hugo cho Đối tác Công việc Liên quan Tốt nhất. Tại buổi lễ, các ứng cử viên đã yêu cầu tất cả những nhà văn khoa học viễn tưởng từng đóng góp cho trang web đứng dậy, và một phần lớn của phòng làm điều đó. Giá trị của loại xây dựng thế giới dựa trên cộng đồng này thường bị coi là ngớ ngẩn hoặc không đáng chú ý, nhưng những tác phẩm này quan trọng với hàng triệu người trên khắp thế giới. “Tôi đã đọc fan fiction ảnh hưởng tôi về mặt tinh thần và sống với tôi một cách mà những câu chuyện đã xuất bản chưa bao giờ làm,” Krueger nói.
Trong những nỗ lực để xem xét tương lai của trí tuệ nhân tạo sáng tạo và công việc nào được sử dụng hoặc không được sử dụng để đào tạo nó, thậm chí cả fan fiction đen tối cũng đáng được bảo vệ.