Logo Google Dịch | |
Màn hình chính của Google Dịch | |
Loại website | Dịch tự động |
---|---|
Có sẵn bằng | 133 ngôn ngữ, xem các ngôn ngữ được hỗ trợ |
Chủ sở hữu | |
Website | https://translate.google.com |
Số người dùng | Hơn 200 triệu người mỗi ngày |
Bắt đầu hoạt động | 28 tháng 4 năm 2006; 18 năm trước (2006-04-28) (dưới dạng dịch máy dựa trên quy luật) 22 tháng 10 năm 2007; 16 năm trước (2007-10-22) (dưới dạng dịch máy thống kê) |
Tình trạng hiện tại | Đang hoạt động |
Google Dịch (còn được gọi là Google Thông dịch ban đầu, hay là Google Translate) là một công cụ dịch thuật trực tuyến do Google phát triển. Nó cung cấp giao diện trang web, ứng dụng trên thiết bị di động chạy hệ điều hành Android và iOS, cũng như giao diện lập trình ứng dụng để nhà phát triển có thể xây dựng các tiện ích mở rộng cho trình duyệt và ứng dụng. Google Dịch hỗ trợ hơn 100 ngôn ngữ ở các cấp độ khác nhau và tính từ tháng 5 năm 2017, nó đã phục vụ hơn 500 triệu người mỗi ngày.
Công cụ này cho phép dịch tự động đoạn văn ngắn hoặc trang web sang ngôn ngữ khác. Đối với các tài liệu lớn, người dùng có thể tải lên để dịch. Sau khi xem bản dịch, người dùng có thể cung cấp góp ý giúp Google cải thiện dịch vụ, điều này hữu ích trong các lần dịch sau.
Google Dịch được ra mắt vào tháng 4 năm 2006 với tư cách là một dịch vụ dịch máy thống kê, sử dụng bảng điểm từ Liên Hợp Quốc và Châu Âu để thu thập dữ liệu ngôn ngữ. Thay vì dịch trực tiếp từ ngôn ngữ này sang ngôn ngữ khác, công cụ ban đầu dịch văn bản sang tiếng Anh trước, sau đó dịch sang ngôn ngữ đích. Trong quá trình dịch, nó sử dụng hàng triệu mẫu văn bản để chọn ra bản dịch tối ưu nhất. Tuy nhiên, độ chính xác của nó đã từng bị chỉ trích và chế nhạo nhiều lần. Vào tháng 11 năm 2016, Google thông báo Google Dịch sẽ chuyển sang một công cụ dịch máy mô phỏng mạng thần kinh - Google Neural Machine Translation (GNMT) - dịch 'toàn bộ câu một lần, thay vì từng mảnh nhỏ. Với cách tiếp cận rộng hơn này, công cụ có thể tạo ra các bản dịch phù hợp hơn với ngữ cảnh và điều chỉnh để giống như cách một người nói với ngữ pháp chính xác hơn'. Ban đầu, GNMT chỉ áp dụng cho một số ngôn ngữ vào năm 2016, nhưng sau đó nó được mở rộng dần cho nhiều ngôn ngữ hơn.
Lịch sử
Google Dịch là một dịch vụ dịch miễn phí do Google phát triển từ tháng 4 năm 2006. Nó hỗ trợ dịch nhiều loại văn bản và phương tiện như từ ngữ, cụm từ và trang web.
Ban đầu, Google Dịch được phát hành dưới dạng dịch máy thống kê (Statistical Machine Translation - SMT). Dịch văn bản yêu cầu chuyển sang tiếng Anh trước khi dịch sang ngôn ngữ đích, là một bước bắt buộc mà nó thực hiện. SMT sử dụng thuật toán tiên đoán để dịch văn bản, do đó có độ chính xác ngữ pháp không cao. Tuy nhiên, ban đầu, Google không thuê chuyên gia để giải quyết hạn chế này do bản chất ngôn ngữ không ngừng phát triển.
Vào tháng 1 năm 2010, Google giới thiệu ứng dụng Android và phiên bản iOS vào tháng 2 năm 2011 để phục vụ như một trợ lý thông dịch cá nhân di động. Đến tháng 2 năm 2010, nó đã được tích hợp vào các trình duyệt như Chrome và đã có khả năng phát âm văn bản, tự động nhận diện từ trong hình ảnh và phát hiện các văn bản và ngôn ngữ lạ.
Vào tháng 5 năm 2014, Google đã mua lại Word Lens để cải thiện chất lượng dịch trực quan và giọng nói. Nó có thể quét văn bản hoặc hình ảnh với thiết bị của người dùng và dịch ngay lập tức. Hơn nữa, hệ thống tự động nhận dạng các ngôn ngữ nước ngoài và dịch lời nói mà không cần người dùng nhấn nút micro.
Vào tháng 11 năm 2016, Google đã chuyển đổi phương thức dịch sang một hệ thống gọi là 'Dịch máy mô phỏng hệ thống thần kinh' - Neural Machine Translation. Nó sử dụng các kỹ thuật Học sâu để dịch toàn bộ câu tại một thời điểm và đảm bảo độ chính xác cao hơn.
Đến năm 2018, Google Dịch đã xử lý hơn 100 tỷ từ mỗi ngày.
Chức năng
Google Dịch có khả năng dịch nhiều dạng văn bản và phương tiện như văn bản, giọng nói, hình ảnh, trang web và thậm chí dịch theo thời gian thực từ ngôn ngữ này sang ngôn ngữ khác. Đến tháng 2 năm 2016, công cụ này đã hỗ trợ 103 ngôn ngữ khác nhau và phục vụ hàng ngày 200 triệu người dùng. Đối với một số ngôn ngữ, Google Dịch có thể phát âm văn bản đã dịch, làm nổi bật các từ và cụm từ tương ứng trong văn bản nguồn và văn bản đích, cũng như hoạt động như một từ điển đơn giản cho các từ được nhập vào. Khi sử dụng chức năng 'Phát hiện ngôn ngữ', văn bản bằng ngôn ngữ không xác định có thể được nhận diện tự động. Nếu người dùng nhập URL của văn bản nguồn, Google Dịch sẽ tạo ra một liên kết đến bản dịch máy của trang web. Người dùng cũng có thể lưu các bản dịch vào 'kho từ đã dịch' để sử dụng sau này. Đối với một số ngôn ngữ, văn bản có thể được nhập qua bàn phím ảo, qua nhận dạng chữ viết tay hoặc nhận dạng tiếng nói.
- Tích hợp vào dịch vụ tìm kiếm của Google: Trong kết quả tìm kiếm, nếu phát hiện một đường liên kết bằng ngoại ngữ, ngay bên cạnh sẽ có một liên kết trong dấu ngoặc vuông màu xanh là [dịch trang này].
- Tìm kiếm được dịch: Là chức năng tìm kiếm trên các trang web bằng tiếng mẹ đẻ bằng tiếng nước ngoài. Ví dụ, muốn tìm kiếm về máy tính trên các tài liệu bằng tiếng Pháp mà không biết nghĩa tương đương của từ này. Người dùng có thể gõ từ khóa 'máy tính' vào ô 'ngôn ngữ của tôi' và chọn ngôn ngữ tiếng Pháp của trang web cần tìm kiếm. Google sẽ tự động dịch từ khóa thành ordinateur (tức là máy tính tiếng Pháp) và tìm kiếm trong kho lưu trữ để đưa ra kết quả phù hợp với từ đã dịch đó. Kết quả sẽ được hiển thị trong hai cột, cột bên trái là các liên kết đã được dịch sang tiếng Việt, cột bên phải là các liên kết gốc bằng tiếng Pháp.
- Dịch nhanh: Là chức năng mặc định, khi người dùng sao chép đoạn văn bản vào ô cần dịch, văn bản sẽ tự động chuyển sang ngôn ngữ đích mà không cần nhấn nút Dịch, tiết kiệm thời gian.
- Đóng góp tài liệu: Nếu có nhiều tài liệu song ngữ, người dùng có thể cung cấp cho Google Dịch để giúp cải thiện chất lượng dịch. Điều kiện là các tài liệu này phải có chất lượng cao.
Phương pháp
Trước năm 2016, Google Dịch dựa trên nền tảng dịch máy thống kê. Người đứng đầu chương trình dịch máy của Google là Franz-Josef Och, người từng giành giải nhất cuộc thi DARPA về tốc độ dịch tự động vào năm 2003.
Khác với các công cụ khác như Babel Fish, AOL và Yahoo sử dụng SYSTRAN, Google Dịch sử dụng phần mềm riêng, không đi sâu vào các quy luật ngữ pháp phức tạp mà sử dụng phương pháp gọi là thống kê tri thức. Điều này có nghĩa là chương trình sẽ tiếp nhận hàng tỉ văn bản đã dịch sẵn của con người và phân tích để tìm ra sự tương đồng với yêu cầu của người dùng, từ đó trả về kết quả. Chất lượng dịch ngày càng được cải thiện khi càng có nhiều văn bản được nạp vào với cấu trúc và ngữ cảnh đa dạng.
Hiện nay, Google Dịch sử dụng công nghệ Dịch máy Neural (Neural Machine Translation - NMT) cho hầu hết các cặp ngôn ngữ, mang lại kết quả chính xác hơn so với các phương pháp khác.
Các giai đoạn phát triển
(Sắp xếp theo thứ tự thời gian)
- Các giai đoạn ban đầu:
- Dịch từ tiếng Anh sang tiếng Ả Rập
- Dịch từ tiếng Anh sang tiếng Pháp
- Dịch từ tiếng Anh sang tiếng Đức
- Dịch từ tiếng Anh sang tiếng Tây Ban Nha
- Dịch từ tiếng Pháp sang tiếng Anh
- Dịch từ tiếng Đức sang tiếng Anh
- Dịch từ tiếng Tây Ban Nha sang tiếng Anh
- Dịch từ tiếng Ả Rập sang tiếng Anh
- Giai đoạn 2:
- Dịch từ tiếng Anh sang tiếng Bồ Đào Nha
- Dịch từ tiếng Bồ Đào Nha sang tiếng Anh
- Giai đoạn 3:
- Dịch từ tiếng Anh sang tiếng Ý
- Dịch từ tiếng Ý sang tiếng Anh
- Giai đoạn 4:
- Dịch từ tiếng Anh sang tiếng Trung (giản thể) phiên bản BETA
- Dịch từ tiếng Anh sang tiếng Nhật phiên bản BETA
- Dịch từ tiếng Anh sang tiếng Triều Tiên phiên bản BETA
- Dịch từ tiếng Trung (giản thể) sang tiếng Anh phiên bản BETA
- Dịch từ tiếng Nhật sang tiếng Anh phiên bản BETA
- Dịch từ tiếng Triều Tiên sang tiếng Anh phiên bản BETA
- Giai đoạn 5: (vào khoảng tháng 12 năm 2006)
- Dịch từ tiếng Anh sang tiếng Nga phiên bản BETA
- Dịch từ tiếng Nga sang tiếng Anh phiên bản BETA
- Giai đoạn 6: (vào khoảng tháng 4 năm 2006)
- Dịch từ tiếng Anh sang tiếng Ả Rập phiên bản BETA
- Dịch từ tiếng Ả Rập sang tiếng Anh phiên bản BETA
- Giai đoạn 7: (vào khoảng tháng 2 năm 2007)
- Dịch từ tiếng Anh sang tiếng Trung (phồn thể) phiên bản BETA
- Dịch từ tiếng Trung (phồn thể) sang tiếng Anh phiên bản BETA
- Chuyển đổi giữa tiếng Trung giản thể và tiếng Trung phồn thể phiên bản BETA
- Giai đoạn 8: (vào khoảng tháng 10 năm 2007)
- Tổng cộng có 25 cặp ngôn ngữ được dịch.
- Giai đoạn 9:
- Dịch từ tiếng Anh sang tiếng Hindi (Ấn Độ) phiên bản BETA
- Dịch từ tiếng Hindi sang tiếng Anh phiên bản BETA
- Giai đoạn 10: (trong giai đoạn này với sự áp dụng kiểu dịch trung gian, Google Translate có thể dịch qua lại bất kỳ cặp ngôn ngữ nào trong hệ thống) (vào khoảng tháng 5 năm 2008)
- Dịch sang tiếng Bulgaria
- Dịch sang tiếng Croatia
- Dịch sang tiếng Séc
- Dịch sang tiếng Đan Mạch
- Dịch sang tiếng Phần Lan
- Dịch sang tiếng Hindi
- Dịch sang tiếng Na Uy
- Dịch sang tiếng Ba Lan
- Dịch sang tiếng România
- Dịch sang tiếng Thụy Điển
- Giai đoạn 11: (ngày 25 tháng 9 năm 2008)
- Dịch sang tiếng Catalunya
- Dịch sang tiếng Tagalog
- Dịch sang tiếng Hebrew
- Dịch sang tiếng Indonesia
- Dịch sang tiếng Latvia
- Dịch sang tiếng Litva
- Dịch sang tiếng Serbia
- Dịch sang tiếng Slovak
- Dịch sang tiếng Slovene
- Dịch sang tiếng Ukraina
- Dịch sang tiếng Việt
- Giai đoạn 12: (từ ngày 1 tháng 10 năm 2008 đến ngày 1 tháng 10 năm 2009, sử dụng bàn phím ảo cho một số ngôn ngữ)
- Dịch sang tiếng Azerbaijan Latin
- Dịch sang tiếng Ireland
- Dịch sang tiếng Iceland
- Dịch sang tiếng Armenia
- Dịch sang tiếng Bantu
- Dịch sang tiếng Ba Tư
- Dịch sang tiếng Basque
- Dịch sang tiếng Bengal
- Dịch sang tiếng Belarus
- Dịch sang tiếng Haiti
- Dịch sang tiếng Dravida
- Dịch sang tiếng Estonia
- Dịch sang tiếng Galicia
- Dịch sang tiếng Gruzia
- Dịch sang tiếng Gujarat
- Dịch sang tiếng Hungary
- Dịch sang tiếng Hy Lạp
- Dịch sang tiếng Latinh
- Dịch sang tiếng Mã Lai (hỗ trợ dịch trực tiếp từ tiếng Indonesia)
- Dịch sang tiếng Macedonia
- Dịch sang tiếng Tamil
- Dịch sang tiếng Thái
- Dịch sang tiếng Thổ Nhĩ Kỳ
- Dịch sang tiếng Urdu
- Dịch sang tiếng Wales
- Dịch sang tiếng Yid***h
- Giai đoạn 13: (giai đoạn thay đổi của Google)
- Ngôn ngữ toàn cầu
- Dịch sang tiếng Lào
- Dịch sang tiếng Afrikaans