Project Gutenberg áp dụng trí tuệ nhân tạo để chuyển văn bản thành giọng nói, phát hành 5.000 cuốn sách nói miễn phí

Buzz

Ngày cập nhật gần nhất: 15/7/2026

Nội dung bài viết

Sách nói đã trở nên phổ biến trong những năm gần đây nhưng việc tiếp cận vẫn là một thách thức lớn và tốn kém.

Xem thêm

Đọc tóm tắt

- Project Gutenberg cung cấp miễn phí hàng nghìn sách nói văn học cổ điển qua phần mềm chuyển văn bản thành giọng nói tự nhiên của Microsoft và MIT. Bộ sưu tập bao gồm các tác phẩm của Shakespeare, Agatha Christie, và Jane Austen.
- Người dùng có thể nghe trên Internet Archive, Spotify, Apple Podcasts và Google Podcasts.
- Mã nguồn mở có trên GitHub, tuy nhiên cũng gây lo ngại như dự án của Apple.

Sách nói đã trở nên phổ biến trong những năm gần đây nhưng việc tiếp cận vẫn là một thách thức lớn và tốn kém.

Bây giờ, độc giả có thể nghe hàng nghìn cuốn sách nói về văn học cổ điển miễn phí và các tài liệu thuộc phạm vi công cộng khác qua Project Gutenberg. Các nhà nghiên cứu của Microsoft và MIT đã tạo ra bộ sưu tập này bằng cách quét sách bằng phần mềm chuyển văn bản thành giọng nói nghe có vẻ tự nhiên và có thể phân tích định dạng đầy đủ.

Các văn bản bao gồm các tác phẩm của Shakespeare, Agatha Christie, Jane Austen, Leonardo Da Vinci và những người nổi tiếng khác. Người dùng có thể nghe chúng trên Internet Archive, Spotify, Apple Podcasts và Google Podcasts. Mã được sử dụng để xây dựng bộ sưu tập có sẵn trên GitHub.

Project Gutenberg áp dụng trí tuệ nhân tạo để chuyển văn bản thành giọng nói, phát hành 5.000 cuốn sách nói miễn phí

Apple đã bắt đầu bán sách nói từ tháng 1 bằng công nghệ tự động chuyển văn bản thành giọng nói. Tuy nhiên, dự án này đã gây ra sự quan ngại từ các tác giả văn học vì sử dụng thương mại và dữ liệu này được dùng để huấn luyện trí tuệ nhân tạo của công ty. Phương pháp tiếp cận của Gutenberg cũng có thể gây ra phản ứng tương tự như Apple vì sử dụng mã nguồn mở.

Dự án Gutenberg đã dành nhiều thập kỷ để tập hợp một thư viện tài liệu miễn phí dưới dạng văn bản và sách nói, giúp làm cho tài liệu này trở nên dễ tiếp cận hơn. Chúng hữu ích cho những độc giả đang lái xe, làm việc, mắc bệnh thị lực, học đọc hoặc học một ngôn ngữ mới.

Vấn đề quan trọng đầu tiên là xác định những cuốn sách số mà phần mềm có thể phân tích. Project Gutenberg thu thập tài liệu của mình ở nhiều định dạng và nhiều tập tin của nó có lỗi hoặc không hoàn hảo. Vì vậy, các nhà nghiên cứu đã tập trung vào những cuốn sách được lưu trữ dưới dạng tệp HTML và xây dựng một công cụ để khám phá những mục nào hiển thị định dạng tương tự.

Project Gutenberg sử dụng trí tuệ nhân tạo để chuyển văn bản thành giọng nói, phát hành 5.000 cuốn sách nói miễn phí

Một vấn đề khác mà các nhà nghiên cứu đã giải quyết là đảm bảo hệ thống nhận biết được văn bản nào cần đọc hoặc bỏ qua. Nó giải quyết các thành phần như mục lục, số trang, chú thích cuối trang và các tài liệu không liên quan khác.

Hơn nữa, văn bản được đọc bằng giọng nói tự nhiên của con người. Các nhà nghiên cứu tập trung vào việc truyền tải giọng đọc phù hợp nhất cho các tác phẩm phi hư cấu và tường thuật, nhưng người dùng có thể điều chỉnh phần mềm để thử đọc kịch tính.

Các câu hỏi thường gặp

Project Gutenberg cung cấp sách nói miễn phí cho những tác phẩm nào?

Project Gutenberg cung cấp sách nói miễn phí cho hàng nghìn tác phẩm nổi tiếng, bao gồm các tác phẩm của Shakespeare, Agatha Christie, Jane Austen, và Leonardo Da Vinci.

Cách thức hoạt động của bộ sưu tập sách nói từ Project Gutenberg là gì?

Bộ sưu tập sách nói hoạt động bằng cách quét sách và chuyển đổi văn bản thành giọng nói tự nhiên, cho phép người dùng nghe qua các nền tảng như Internet Archive và Spotify.

Dự án sách nói của Apple đã gây ra những lo ngại gì trong ngành văn học?

Dự án sách nói của Apple đã gây lo ngại về việc sử dụng dữ liệu cho mục đích thương mại và huấn luyện trí tuệ nhân tạo, ảnh hưởng đến quyền của tác giả.

Sách nói có những lợi ích gì cho người dùng hiện nay?

Sách nói mang lại lợi ích lớn cho người dùng như giúp họ tiếp cận tài liệu dễ dàng hơn, đặc biệt là cho những ai lái xe, làm việc hoặc mắc bệnh thị lực.

Các nhà nghiên cứu đã giải quyết vấn đề gì trong phát triển sách nói cho Project Gutenberg?

Các nhà nghiên cứu đã giải quyết việc nhận biết văn bản cần đọc và bỏ qua, đảm bảo hệ thống loại bỏ mục lục và chú thích không cần thiết, cung cấp giọng đọc tự nhiên.

Nội dung từ Mytour nhằm chăm sóc khách hàng và khuyến khích du lịch, chúng tôi không chịu trách nhiệm và không áp dụng cho mục đích khác.

Nếu bài viết sai sót hoặc không phù hợp, vui lòng liên hệ qua Zalo: 0978812412 hoặc Email: [email protected]