Trí tuệ nhân tạo giúp chứng minh rằng có hai báng bổng viết văn bản của một cuốn sách Biển Chết

Hầu hết các báng bổng sao chép văn bản nằm trong Cuộn sách Biển Chết đều ẩn danh, vì họ đã không ký tên vào công việc của họ. Điều này khiến cho việc xác định xem một bản thảo cụ thể có nên được quy attribution cho một báng bổng duy nhất hay nhiều hơn dựa trên các yếu tố đặc biệt trong phong cách viết của họ (một nghiên cứu gọi là paleography) trở nên khó khăn cho các học giả. Bây giờ, một phân tích chữ viết mới của Cuộn Isai Vĩ đại, áp dụng công cụ trí tuệ nhân tạo, đã tiết lộ rằng văn bản có lẽ đã được viết bởi hai báng bổng, phản ánh phong cách viết của nhau, theo một nghiên cứu mới được công bố trong tạp chí PLOS One.
Như chúng tôi đã đưa tin trước đó, những văn bản tiếng Hebrew cổ này - khoảng 900 cuộn sách đầy đủ và một số cuộn sách không đầy đủ, được lưu trữ trong các lọ đất sét - lần đầu tiên được phát hiện rải rác ở các hang động khác nhau gần nơi trước đây là địa điểm của Qumran, ngay bắc Biển Chết, bởi những người chăn dê Bedouin vào năm 1946-1947. (Rõ ràng, một người chăn đánh mất một thành viên của bầy của mình và tình cờ phá vỡ một trong những lọ đất sét, dẫn đến phát hiện.) Qumran đã bị người La Mã phá hủy, khoảng năm 73 sau Công nguyên, và các nhà sử học tin rằng những cuộn sách đã được giấu trong các hang động bởi một tôn giáo gọi là người Essene để bảo vệ chúng khỏi việc bị phá hủy. Đá vôi tự nhiên và điều kiện trong các hang động đã giúp bảo quản các cuộn sách hàng ngàn năm; chúng có niên đại từ từ thế kỷ thứ ba trước Công nguyên đến thế kỷ thứ nhất sau Công nguyên.
Nhiều trong số các tảo đã được xác định tuổi bằng phương pháp carbon, và tia bức xạ synchrotron - cùng với các kỹ thuật khác - đã được sử dụng để làm sáng tỏ về các tính chất của mực được sử dụng cho văn bản. Gần đây nhất, vào năm 2018, một nhà khoa học người Israel tên là Oren Ableman đã sử dụng một kính hiển vi hồng ngoại được gắn vào máy tính để nhận diện và giải mã các đoạn văn bản của Cuộn sách Biển Chết được lưu trữ trong hộp cigar từ những năm 1950.
Một nghiên cứu năm 2019 về Cuộn sách Đền thờ được gọi là kết luận rằng da có một lớp phủ không bình thường của muối sulfate (bao gồm lưu huỳnh, natri, thạch anh và canxi), có thể là một lý do khiến cuộn sách được bảo quản tốt. Và năm ngoái, các nhà nghiên cứu phát hiện ra rằng bốn đoạn văn bản được lưu trữ tại Đại học Manchester, lâu nay được cho là trống trơn, thực sự chứa văn bản ẩn, có thể là một đoạn từ Sách Ê-ze-ki-en.
Bài báo hiện tại tập trung vào Cuộn Isai Vĩ đại, một trong những cuộn sách gốc được phát hiện trong Hang 1 Qumran (được chỉ định là 1QIsa). Nó là duy nhất một cuộn sách từ các hang động được bảo tồn hoàn toàn, ngoại trừ một số khu vực nhỏ bị hỏng nặng nơi da đã bong tróc. Văn bản tiếng Hebrew được viết trên 17 tờ da, có chiều dài 24 feet và chiều cao khoảng 10 inches, chứa toàn bộ văn bản Sách Isai. Điều này làm cho Cuộn Isai trở thành bản sao hoàn chỉnh nhất của cuốn sách cách đây khoảng 1.000 năm. (Bảo tàng Israel, phối hợp với Google, đã số hóa Cuộn Isai cùng với bản dịch tiếng Anh như một phần của Dự án Sách Biển Chết Kỹ thuật số của mình.)
Hầu hết các học giả tin rằng Cuộn Isai đã được sao chép bởi một báng bổng duy nhất vì phong cách viết hình thức đồng đều. Nhưng người khác đã đề xuất rằng có thể là công việc của hai báng bổng viết theo cùng một phong cách, mỗi người sao chép một nửa rõ ràng khác nhau của cuộn sách. "Họ sẽ cố gắng tìm 'vật chứng' trong chữ viết, ví dụ, một đặc điểm rất cụ thể trong một chữ cái có thể xác định được một báng bổng," nói ông đồng tác giả Mladen Popović của Đại học Groningen. Popović cũng là giám đốc của Viện Qumran của trường, chuyên nghiên cứu về các Cuộn sách Biển Chết.
Nói cách khác, phương pháp paleographic truyền thống có tính chủ quan và dựa trên kinh nghiệm của một học giả cụ thể. Điều này khó khăn vì một báng bổng có thể có một lượng biến động khá lớn trong phong cách viết của họ, vì vậy làm thế nào để xác định điều gì là biến động tự nhiên hay một sự khác biệt tinh tế chỉ ra một bàn tay khác? Làm phức tạp thêm, việc chia sẻ một phương pháp đào tạo chung, dấu hiệu của sự mệt mỏi hoặc bị thương, hoặc dấu hiệu của việc thay đổi dụng cụ viết có thể dẫn đến việc viết giống nhau.
"Bộ não con người là tuyệt vời và có lẽ cũng tính đến những cấp độ này. Điều này cho phép các chuyên gia 'nhìn thấy' bàn tay của các tác giả khác nhau, nhưng quyết định đó thường không được đưa ra thông qua một quá trình minh bạch," nói Popović. "Hơn nữa, đối với những chuyên gia này, gần như là không thể để xử lý lượng lớn dữ liệu mà các cuộn sách cung cấp." Cuộn Isai, ví dụ, chứa ít nhất 5.000 trường hợp của chữ aleph ("a"), làm cho nó gần như không thể so sánh từng aleph bằng mắt. Popović nghĩ nhận diện mô hình và kỹ thuật trí tuệ nhân tạo sẽ phù hợp rất tốt cho nhiệm vụ này.
Trước tiên, Popović và đồng nghiệp của ông—Lambert Schomaker và sinh viên cao học Maruf Dhali—đã phát triển một mạng nơ-ron nhân tạo mà họ có thể huấn luyện để phân tách ("nhị phân hóa") mực của văn bản khỏi da hoặc giấy cây mà nó được viết, đảm bảo rằng hình ảnh kỹ thuật số giữ nguyên chính xác các đánh dấu ban đầu. "Điều này quan trọng vì các vết mực cổ điển liên quan trực tiếp đến sự di chuyển cơ bắp của một người và đặc biệt cho từng người," nói Schomaker.
Tiếp theo, họ tạo ra hai bản đồ tự tổ chức 12 x 12 của chữ aleph và bet toàn bộ từ trang Cuộn Isai, mỗi chữ được tạo ra từ nhiều trường hợp của các ký tự tương tự. Những bản đồ như vậy hữu ích cho phân tích phát triển theo kiểu lịch sử. Fraglets (hình dạng ký tự bị phân mảnh) được sử dụng thay vì hình dạng ký tự đầy đủ để đạt được kết quả mạnh mẽ hơn.
Kết quả cho thấy hai phong cách viết khác nhau, một kết quả đã tồn tại ngay cả sau khi nhóm thêm nhiễu thêm vào dữ liệu như một kiểm tra bổ sung. Phân tích cũng cho thấy rằng phong cách viết của báng bổng thứ hai biến động hơn so với báng bổng đầu tiên, mặc dù hai phong cách này khá giống nhau, cho thấy một khả năng đào tạo chung có thể.
Cuối cùng, Popović và đồng nghiệp đã tạo ra "bản đồ nhiệt" để phân tích một cách hình thức, tích hợp tất cả các biến thể của một ký tự cụ thể trong suốt cuộn sách. Họ sử dụng điều này để tạo ra một phiên bản trung bình của ký tự cho 27 cột đầu tiên và 27 cột cuối cùng, làm cho rõ ràng với mắt thường rằng hai ký tự trung bình là khác nhau nhau—và do đó là thêm chứng cứ về việc có một báng bổng thứ hai sao chép nửa cuối của cuộn sách.
"Bây giờ chúng tôi có thể xác nhận điều này thông qua một phân tích định lượng về chữ viết cũng như qua các phân tích thống kê mạnh mẽ," nói Popović. "Thay vì dựa vào đánh giá dựa trên ấn tượng hơn hoặc kém chính xác, với sự trợ giúp thông minh của máy tính, chúng tôi có thể chứng minh rằng sự tách biệt này có ý nghĩa thống kê."
Các tác giả nhận thức rằng phân tích của họ không hoàn toàn loại trừ khả năng các biến thể do sự mệt mỏi, chấn thương của báng bổng hoặc sự thay đổi của bút mực, nhưng "giải thích trực tiếp hơn là một sự thay đổi trong báng bổng đã xảy ra," họ viết. Các nhà nghiên cứu kết luận rằng nghiên cứu của họ chỉ ra giá trị thêm mà các học giả tham gia nghiên cứu paleographic có thể đạt được thông qua việc hợp tác với các lĩnh vực khác.
Bước tiếp theo là áp dụng phương pháp của họ vào thêm nhiều Cuộn sách Biển Chết. "Chúng tôi hiện có khả năng xác định được các báng bổng khác nhau," nói Popović về ý nghĩa của những phát hiện của họ. "Chúng ta sẽ không bao giờ biết tên của họ. Nhưng sau 70 năm nghiên cứu, cảm giác như chúng ta cuối cùng cũng có thể bắt tay với họ thông qua chữ viết của họ."
Câu chuyện này ban đầu xuất hiện trên Ars Technica.
- 📩 Những tin tức mới nhất về công nghệ, khoa học, và nhiều hơn nữa: Đăng ký nhận bản tin của chúng tôi!
- Khi ông chủ của tất cả các ứng dụng hẹn hò gặp đại dịch
- Phục vụ thức ăn tại các nhà hàng xa xôi—ngay từ ghế sofa của bạn
- Bacterium mới tinh tế trên ISS có thể xây dựng một tương lai trên Sao Hỏa
- Hãy chỉ đơn giản thừa nhận rằng Stadia thực sự tốt
- Sức mạnh chữa lành của JavaScript
- 👁️ Khám phá trí tuệ nhân tạo như chưa bao giờ có với cơ sở dữ liệu mới của chúng tôi
- 🎮 MYTOUR Games: Nhận những mẹo, đánh giá, và nhiều hơn nữa
- 📱 Lưỡng lự giữa những chiếc điện thoại mới nhất? Đừng lo sợ—kiểm tra hướng dẫn mua iPhone của chúng tôi và những chiếc điện thoại Android yêu thích
