
Tìm kiếm Google đang tiến xa hơn trong việc đọc.
Google cho biết họ đã cải tiến hệ thống xếp hạng tìm kiếm của mình bằng phần mềm có tên là BERT, hoặc Bidirectional Encoder Representations from Transformers theo cách gọi thân thiện. Nó được phát triển tại các phòng thí nghiệm trí tuệ nhân tạo của công ty và được công bố vào mùa thu năm ngoái, phá vỡ kỷ lục về câu hỏi hiểu đọc mà các nhà nghiên cứu sử dụng để kiểm tra phần mềm trí tuệ nhân tạo.
Pandu Nayak, Phó Chủ tịch tìm kiếm của Google, cho biết tại cuộc họp hôm thứ Năm rằng phần mềm có tên mang tính hài hước đã làm cho thuật toán tìm kiếm của Google trở nên xuất sắc hơn trong việc xử lý các truy vấn dài, hoặc những truy vấn nơi mối quan hệ giữa các từ quan trọng. Bạn hiện giờ ít có khả năng nhận được các phản hồi khó chịu đối với các truy vấn phụ thuộc vào các giới từ như “đối với” và “đến,” hoặc phủ định như “không” hoặc “no.”
“Đây là sự thay đổi tích cực lớn nhất chúng ta đã có trong năm ngoái,” Nayak nói—theo ít nhất là theo các tiêu chí của Google về cách thay đổi xếp hạng giúp mọi người tìm thấy những gì họ muốn. Google từ chối chia sẻ chi tiết. Google nói rằng họ đã thử nghiệm bản nâng cấp nhưng hiện đang triển khai rộng rãi.
Một minh họa về sức mạnh của BERT mà Google đưa ra là cách nó giúp trình diễn máy tìm kiếm của mình hiểu truy vấn “Đỗ xe trên đồi không có lề đường.” Phiên bản hiện tại của thuật toán tìm kiếm của họ đáp ứng như là nó đề cập đến một đồi có lề đường. Phiên bản sử dụng BERT nhấn mạnh một trang web khuyến cáo người lái xe hướng bánh xe về phía lề đường.

Một truy vấn khác là “2019 người du lịch Brazil đi Mỹ cần visa.” Đối với con người, đó là một cố gắng rõ ràng để tìm hiểu về yêu cầu đối với người Brazil đi Mỹ, nhưng trước BERT, Google hiểu nhầm “đến” quan trọng và trả về một bài viết về công dân Mỹ đi du lịch đến Brazil làm kết quả hàng đầu. Với BERT, máy tìm kiếm đưa ra một trang về yêu cầu đối với công dân Brazil đi về phía bắc.
Google nói rằng họ nhận được tỷ lệ tìm kiếm tỷ giáo hàng ngày và bản nâng cấp BERT sẽ ảnh hưởng đến xếp hạng một trong mỗi 10 kết quả. Nhưng Nayak nói rằng hầu hết người dùng có lẽ sẽ không chú ý. Điều đó không có nghĩa là sự thay đổi không quan trọng đối với người dùng, hoặc Google. Bất kỳ ai đã cố gắng chuyển đổi công cụ tìm kiếm biết rằng cách xếp hạng của Google núi vào kỳ vọng của bạn đối với internet có thể rất mạnh mẽ.
Những người ở ngoài Hoa Kỳ tìm kiếm sự trợ giúp từ Google sẽ thấy một số thay đổi đáng kể nhất. Nayak nói rằng bản nâng cấp BERT đã giúp hệ thống của họ trở nên xuất sắc hơn trong việc xác định các đoạn trích đặc sắc, đặc biệt là trong các ngôn ngữ khác ngoài tiếng Anh.
Bản nâng cấp của Google là một ví dụ đáng chú ý về sự tiến bộ gần đây trong phần mềm cố gắng hiểu ngôn ngữ. Nó đã làm cho các thuật toán học máy trở nên xuất sắc hơn trong việc giải mã những sự tinh tế của ngôn ngữ bằng cách chú ý đến ngữ cảnh xung quanh một từ cụ thể.
Học máy đã chứng minh là một cách mạnh mẽ để dạy cho phần mềm sắp xếp hoặc diễn giải dữ liệu như hình ảnh hoặc văn bản. Nhưng mỗi chương trình thường phải được “huấn luyện” bằng dữ liệu ví dụ. Điều đó thường khá khó khăn khi áp dụng cho tài liệu văn bản. Các dự án thường phụ thuộc vào việc trả tiền cho người để đánh dấu các ví dụ cụ thể, chẳng hạn như đánh giá nhà hàng tốt và xấu.

Vào mùa xuân và mùa hè năm 2018, OpenAI và Viện Nghiên cứu AI Allen đã cho thấy một phương pháp đơn giản và mạnh mẽ hơn. Họ đã dạy cho các chương trình học máy sự khác biệt giữa các từ, thậm chí là từ đồng âm như Tháng Năm, có thể làm động từ, và May là tên—bằng cách nhìn vào các từ khác trong văn bản, ngay cả khi chúng ở trong một câu khác. Các mô hình được huấn luyện theo cách đó trên các bộ sưu tập văn bản rất lớn đã hiểu một loại ý chung về ngôn ngữ và sau đó có thể được chuyên sâu hóa cho các nhiệm vụ cụ thể bằng cách sử dụng các bộ sưu tập dữ liệu được gắn nhãn tương đối nhỏ.
Hệ thống của Allen AI được đặt tên là ELMo, cho Embeddings từ Mô hình Ngôn ngữ. Điều này khiến các nhà nghiên cứu của Google nghĩ đến Sesame Street vào tháng 10 năm 2018 khi họ thông báo về cách mạnh mẽ hơn của họ trong việc học ngôn ngữ thông qua máy học, BERT. Giống như các hệ thống từ OpenAI và Allen AI, phần mềm của Google đã thiết lập kỷ lục mới trong các bài kiểm tra ngôn ngữ AI, chẳng hạn như việc trả lời các câu hỏi.
“Mọi người rất hứng thú, vì tiến triển diễn ra rất nhanh,” nói Jeff Wu, một kỹ sư nghiên cứu đã làm việc trên các dự án ngôn ngữ của OpenAI. Một tác động phụ: Các nhà nghiên cứu đã phải sáng tạo ra các bài kiểm tra mới và khó khăn hơn cho phần mềm trên các nhiệm vụ như hiểu đọc cơ bản.
Điều đó không có nghĩa là BERT sẵn sàng phê phán bài luận đại học của bạn. “Ngôn ngữ là vô cùng tinh tế và tinh tế,” Nayak nói. Mỗi lần Google cải thiện khả năng của ô tìm kiếm với ngôn ngữ, anh ta nói, mọi người đưa ra các truy vấn phức tạp và thách thức hơn, hiệu quả nâng cao độ khó cho robot đọc của Google.
More Great Mytour Stories
- Ripper—câu chuyện bên trong về trò chơi điện tử tệ hại đến đáng kinh ngạc
- Việc đặt chip gián điệp nhỏ trong phần cứng có thể chỉ tốn khoảng 200 đô la
- Netflix, cứu lấy bản thân và đưa cho tôi một cái gì đó ngẫu nhiên để xem
- Công nghệ và phụ kiện tốt nhất cho chó của bạn
- Hệ thống tàu điện ngầm tuyệt vời của Liên Xô cũ
- 👁 Chuẩn bị cho thời đại video giả mạo sâu; ngoài ra, kiểm tra tin tức mới nhất về trí tuệ nhân tạo
- 🎧 Âm thanh không ổn định? Hãy kiểm tra tai nghe không dây, thanh âm thanh và loa Bluetooth yêu thích của chúng tôi
