Người hâm mộ Tốt Hơn Công Nghệ Trong Việc Tổ Chức Thông Tin Trực Tuyến

Dành lời khen cho những người hâm mộ. Một trong những ứng viên cho giải thưởng Hugo năm nay là Archive of Our Own, một kho lưu trữ fanfiction chứa gần 5 triệu tác phẩm của người hâm mộ—về kích thước bằng Wikipedia tiếng Anh, và mới hơn một vài năm. Điều làm cho Archive of Our Own đáng giá một trong những vinh dự lớn nhất trong khoa học viễn tưởng và phương tiện giả tưởng không chỉ là fanfic, fanart, fanvids, và các tác phẩm khác của người hâm mộ, mặc dù chúng đều ấn tượng, mà còn là kiến trúc của chính trang web.
Trong thời điểm mà chúng ta đang cố gắng tìm ra cách làm cho internet trở nên sống được cho con người, mà không lợi dụng con người khác trong quá trình đó, AO3 (AO3, theo cách gọi thân thiện) mang đến điều gì đó mà toàn bộ công nghệ có thể học từ đó.
Dưới đây là một vấn đề mà người dùng AO3, giống như toàn bộ internet, phải đối mặt mỗi ngày: Làm thế nào bạn tìm kiếm một thứ cụ thể mà bạn quan tâm, trong khi lọc ra tất cả những thứ khác bạn không quan tâm? Hầu hết các trang web cuối cùng đều có các thẻ nào đó. Tôi có thể xem qua cơ sở dữ liệu tạp chí y học để tìm các bài viết được đánh dấu "đục thủy tinh," tìm kiếm trên trang web ảnh chứng khoán để nhìn thấy những hình ảnh được đánh dấu "doanh nhân," hoặc nhấp vào hashtag truyền thông xã hội để xem những gì mọi người nói về tập mới nhất của #GameOfThrones.

Thẻ có ích nhưng cũng gặp vấn đề. Mặc dù "đục thủy tinh," "doanh nhân," và #GameOfThrones có vẻ như là những thẻ rõ ràng nhất đối với tôi, người khác có thể đã đánh dấu những chủ đề tương tự này là "phẫu thuật đục thủy tinh," "doanh nhân," và #GoT. Một người khác có thể đã chọn "sclerosis hạch" (một loại cụ thể của đục thủy tinh), "cuộc sống văn phòng," và #Daenerys. Và cứ như vậy.
Có hai cách chính để giải quyết vấn đề về sự gia tăng của việc đánh dấu. Một là hoàn toàn laissez-faire—để người đăng tag bất cứ thứ gì họ muốn và hy vọng người tìm kiếm có thể xác định được từ ngữ họ cần tìm kiếm. Điều này dễ thiết lập, nhưng thường dẫn đến một sự nổ tung của các thẻ, khi người đăng thêm vào nhiều thẻ chỉ để đề phòng và người tìm kiếm không biết thẻ nào là tốt nhất. Thẻ laissez-faire thường xuất hiện nhiều trên mạng xã hội; nếu tôi đăng một bức ảnh thẩm mỹ về quyển sách tôi đang đọc trên Instagram, tôi có hơn 20 thẻ liên quan để chọn, như #sách #sách #độc giả #độc giả #đọc #đọc #goodreads #đọc #booksofig #độc giảofig #booksofinstagram #độc giảinstagram #đọcstagram #bookstagram #kệsách #kệsách #kệsách #bookshelfie #booknerd #bookworm #bookish #bookphotography #bookcommunity #booklover #booksbooksbooks #bookstagrammer #booktography #độc giả #đọc một quyển sách #đọc thêm sách #thời gian đọc #luôn đọc #igreads #instareads #amreading. "Am reading" thật sự—đọc đoạn văn nguyên của thẻ.
Giải pháp khác cho vấn đề về sự gia tăng của các thẻ cạnh tranh là triển khai một hệ thống đánh dấu kiểm soát, từ trên xuống, cứng nhắc. Như Hệ thống phân loại thư viện Dewey có một tiểu mục duy nhất cho Shakespeare để người duyệt thư viện có thể chắc chắn tìm thấy Hamlet gần Romeo và Juliet, hệ thống đánh dấu cứng nhắc định nghĩa một danh sách đơn các thẻ không chồng lấn và yêu cầu mọi người phải sử dụng chúng. Chúng phổ biến hơn trong cơ sở dữ liệu chuyên nghiệp và kỹ thuật hơn là trong các mạng xã hội công cộng, nhưng chúng là một ý tưởng tốt trong lý thuyết—nếu chỉ cho phép thẻ "đục thủy tinh" thì không ai cần phải lặp lại công việc bằng cách tìm kiếm cả dưới "đục thủy tinh" và "phẫu thuật đục thủy tinh."
Vấn đề là thẻ cứng nhắc yêu cầu nỗ lực để học; khó thuyết phục công chúng nắm vững một phân loại to lớn. Hơn nữa, chúng trở nên lạc hậu. Hệ thống đánh dấu là một cách để áp đặt trật tự trong thế giới thực, và thế giới không chỉ dừng lại và thay đổi khi bạn đã thiết lập các danh mục tốt đẹp của mình. Hãy xem các từ liên quan đến giới tính và tình dục: Cách chúng ta nói về những chủ đề này đã phát triển rất nhiều trong vài thập kỷ gần đây, nhưng các cơ sở dữ liệu thư viện và y học đã chậm hơn trong việc cập nhật.
Archive of Our Own không có vấn đề nào trong số những vấn đề này. Nó sử dụng một hệ thống đánh dấu thứ ba, kết hợp những yếu tố tốt nhất của cả hai phong cách.
Trên AO3, người dùng có thể nhập bất kỳ thẻ nào họ muốn. (Tự động hoàn thiện ở đó để giúp đỡ, nhưng họ không bắt buộc phải sử dụng nó.) Sau đó, phía sau hậu trường, những tình nguyện viên con người tìm kiếm bất kỳ thẻ mới nào mà không có người khác sử dụng trước đó và phối hợp chúng với bất kỳ thẻ hiện có nào có thể áp dụng được, một quá trình được biết đến là tag wrangling. Wrangling có nghĩa là bạn không cần biết liệu thẻ phổ biến nhất cho fanfic mới của bạn với Sherlock Holmes và John Watson có phải là Johnlock hay Sherwatson hay John/Sherlock hay Sherlock/John hay Holmes/Watson hay bất kỳ cái gì khác không. Và bạn chắc chắn không cần đánh dấu fic của bạn với tất cả chúng chỉ để đề phòng. Thay vào đó, bạn chọn bất kỳ cái nào bạn thích, những người wrangler thực hiện công việc của họ sau cánh cửa, và độc giả tìm kiếm bất kỳ từ đồng nghĩa nào vẫn có thể tìm thấy bạn.
Mánh khóe của AO3 là nó liên quan đến con người theo thiết kế—khoảng 350 tình nguyện viên tag wrangler vào năm 2019, tăng lên từ 160 người vào năm 2012—mỗi người dành vài giờ mỗi tuần để quyết định liệu các thẻ mới có nên được coi là từ đồng nghĩa hoặc là tập hợp con của các thẻ hiện có, hoặc đơn giản là để nguyên. Chủ Nhật Tag Wrangling của AO3 ước tính rằng nhóm này đang trên đà xử lý khoảng 2.7 triệu thẻ chưa bao giờ được sử dụng vào năm 2019, tăng lên từ 2.4 triệu vào năm 2018.
Cả hai hệ thống đánh dấu laissez-faire và cứng nhắc đều thất bại vì chúng giả định quá nhiều—rằng người dùng có thể tạo ra trật tự từ một hệ thống hoàn toàn mở, hoặc một phân loại thuốc trước có thể bao gồm mọi loại thẻ mà một người có thể muốn. Khi những giả định này không được chứng minh, luôn dường như là lỗi của người dùng. Niềm tin của AO3 về bản chất của con người là một cách thiết thực hơn, giống như một kiến trúc sư thiết kế lối đi nơi người đi bắt đầu mặc cỏ, nhận ra cách biến đổi và tiêu chuẩn hóa có thể phù hợp với nhau. Hệ thống wrangler là một nơi mà hành vi người dùng thông thường có thể thành công, một hệ thống chấp nhận rằng người dùng đôi khi cần sự giúp đỡ từ ai đó có cái nhìn tổng quan về bức tranh lớn hơn.
Người dùng đánh giá cao sự giúp đỡ này. Theo Chủ nhật Tag Wrangling briar_pipe, "Đôi khi chúng tôi có những người dùng đến từ Instagram hoặc Tumblr hoặc một trang web khác không được kiểm duyệt. Chúng tôi có thể nói rằng họ mới sử dụng AO3 vì họ đánh dấu mọi biến thể của một khái niệm—viết tắt, thứ tự từ ngữ khác nhau, tất cả đều có. Tôi thích cách mọi người hào hứng khi họ nhận ra họ không cần phải làm như vậy ở đây."
Khi tôi tweet về các thẻ của AO3 cách đây một thời gian, tôi nhận được nhiều ý kiến từ những người muốn hệ thống đánh dấu chuyên nghiệp của họ tốt như vậy, bao gồm người dùng trang tin tức, thư viện, trang web bán hàng thương mại, trang web trợ giúp khách hàng, và PubMed (cơ sở dữ liệu nghiên cứu y học nổi bật nhất). Những trang web khác so sánh tốt với AO3 cũng nằm ở phía fannish của phổ và sử dụng một hệ thống wrangling tag tương tự được t facilitation. Bibliotheca (một trang web nơi bạn có thể liệt kê tất cả sách của mình) và Danbooru (một bảng hình ảnh anime). Nhưng, chúng ta có thể tự hỏi, tại sao sử dụng con người? Có thể máy học hoặc trí tuệ nhân tạo hoặc một từ ngôn công nghệ nổi bật khác có thể wrangle thẻ thay vì đó?
Một lý do cho việc sử dụng con người là AO3 bắt đầu phát triển các qui trình của mình vào năm 2007, khi công nghệ chưa phát triển và họ có rất nhiều tình nguyện viên nhiệt tình. Nhưng ngay cả bây giờ, những người wrangler tag vẫn nghi ngờ liệu máy có thể thay thế nhiệm vụ của họ. Một người wrangler, có tên spacegandalf, đã trỏ tôi đến ví dụ về một nhân vật từ một bản podcast âm thanh mang tên The Penumbra Podcast không có tên chính thức trong văn bản trong một số tập sau khi được giới thiệu. Tuy nhiên, mọi người đã viết fanfic—và cố gắng đánh dấu theo nhân vật—trước khi họ có bất kỳ tên nào để đánh dấu.
Bởi vì spacegandalf đã nghe podcast này—AO3 cố ý tuyển dụng và phân công tag wranglers là thành viên của các fandom mà họ wrangle—họ có ngữ cảnh cần thiết để biết rằng "Big Guy Jacket Man Or Whatever His Name Is" đề cập đến cùng một người như cái tên chính thức ít chính thức hơn "the Man In the Brown Jacket" và cái tên sau này, chính thức hơn, Jet Sikuliaq (và rằng không nên nhầm lẫn với một nhân vật có tên bí ẩn khác từ một bản podcast âm thanh khác, the Man in the Tan Jacket từ Welcome to Night Vale).
Với tất cả những thẻ này được wrangled đúng cách, tôi không chỉ có thể tìm thấy "Big Guy Jacket Man" và "the Man in the Brown Jacket" và "Jet Sikuliaq" trong kết quả tìm kiếm cùng một lúc, mà còn có thể đào sâu và tìm kiếm crossover fic chứa cả người đàn ông trong áo khoác nâu và người đàn ông trong áo khoác nâu của tôi—và, hy vọng rằng, một thế giới toàn bộ của những người bạn áo khoác màu sắc. Thật đáng tiếc, không có gì, nhưng ít nhất tôi biết mình có một câu trả lời kết luận.
Mà không có tag wranglers, tôi sẽ phải làm một tìm kiếm bình thường cho "jacket" hoặc "jacket man"—đầu tiên đưa cho tôi hàng trăm kết quả về những nhân vật không liên quan khác chỉ mặc áo khoác lần này, và thứ hai bỏ lỡ một số kết quả thực sự liên quan về những người đàn ông áo khoác chúng ta quan tâm.
Một trong những Tag Wrangling Chairs, Qem, cũng nghĩ rằng việc wrangling tag của máy là không khả thi, trỏ vào dịch máy như một câu chuyện cảnh báo. “Có những thuật ngữ trong fandom mà, mặc dù hiểu thông thường trong bối cảnh giữa các fan, nhưng không sẽ khi bạn đưa nó ra khỏi bối cảnh fandom," Qem nói. Ví dụ, những từ dường như vô hại như "slash" và "lemon" không đề cập đến dấu câu hoặc trái cây chanh trong ngữ cảnh fannish, và tag wranglers đã nhận thức rõ rằng máy dịch chỉ có thể quản lý nghĩa đen, không phải nghĩa văn hóa con người. Người đồng trưởng nhóm của Qem, briar_pipe, lạc quan hơn một chút: "Cá nhân tôi nghĩ nó có thể thú vị nếu có sự hợp tác AI/người cho loại công việc dữ liệu này, nhưng bạn phải có những người hiểu rõ về giới hạn của AI và sẵn lòng chỉ trích AI khi gặp sai sót, hoặc ngược lại đối tác đó là vô dụng."
Trong thực tế, AI có những hạn chế. Luôn có vẻ như có một báo cáo mới về các sản phẩm tuyên bố là AI—Amazon's Mechanical Turk, Facebook's M, Google Duplex, máy quét biên nhận Expensify—nhưng thực tế thường liên quan đến đám đông những người làm công việc "ghost work" ít lương, không được đền bù đầy đủ, và trở nên vô hình hóa mà được gán cho AI.
Những người wranglers tag trên AO3 không nhận được tiền bất cứ. Tổ chức mẹ của lưu trữ, Tổ chức Vì Những Tác Phẩm Chuyển Đổi, là một tổ chức phi lợi nhuận, và tất cả mọi người liên quan đều là tình nguyện viên. Nhưng cũng khó để coi họ là "bị lợi dụng" như những con người AI giả. Wranglers giống như những người tình nguyện biên tập Wikipedia hoặc quản lý nhóm Facebook. Thay vì làm việc cho một tập đoàn không mặt mũi mà thà giả vờ họ là máy móc, những tình nguyện viên này hưởng lợi từ cộng đồng mà họ phục vụ. Bản chất hướng cộng đồng này là tâm huyết của sự thành công của AO3—nó được tạo ra bởi các fan mệt mỏi với chính sách thu hồi ý kiến thoái thác của các trang web chia sẻ fanfiction có lợi nhuận và quyết định mua máy chủ riêng, tự học cách lập trình, và tạo ra một trang web chính xác như họ muốn, bao gồm một hệ thống đánh dấu chức năng không ngừng so với cả cơ sở dữ liệu chuyên nghiệp và các nền tảng xã hội tỷ đô.
Khi những người kỹ sư công nghệ than thở về sự thống trị ngày càng tăng của internet bởi một số công ty lớn, có xu hướng tìm kiếm nguồn cảm hứng đối nghị, nếu bạn muốn, trong các dự án hợp tác như Wikipedia hoặc phần mềm mã nguồn mở. Nhưng các fan cũng đã tự do sáng tạo cho nhau từ những ngày đầu của internet, và fandom chứa đựng nhiều người từ các phân khúc dân số ít được đại chúng phân tích thường xuyên—có lẽ là cả một lý do cho sự thành công của Archive of Our Own và là một lý do mà sự thành công này đã bị lãng quên. Cho dù nó có giành Huy chương Hugo hay không, đề cử này là một bước tiến để đưa AO3 được chú ý như nó xứng đáng.
Cập nhật 7-14-19, 8 giờ tối EST: Câu chuyện này đã được cập nhật để sửa số lượng tags AO3 đã wrangled trong những năm gần đây.
Những câu chuyện tuyệt vời khác từ MYTOUR
- Vẻ đẹp và điên đảo của việc gửi một người lên mặt trăng
- Bên trong kho robot của Amazon trong tương lai
- Bạn có thể sống mãi mãi với chiêu thức thời gian khoa học viễn tưởng này
- Làm thế nào Mattel thu nhỏ ô tô thành Hot Wheels
- Cuộc sống tại Huawei: tàu hỏa, thiết kế Châu Âu và giấc ngủ trưa
- ✨ Tối ưu hóa cuộc sống tại nhà với những lựa chọn tốt nhất của đội ngũ Gear chúng tôi, từ robot hút bụi đến đệm giá rẻ đến loa thông minh.
- 📩 Muốn thêm nữa không? Đăng ký nhận bản tin hàng ngày của chúng tôi và đừng bao giờ bỏ lỡ những câu chuyện mới nhất và tuyệt vời nhất của chúng tôi
