
Vào ngày 30/11/2022, OpenAI chính thức giới thiệu ChatGPT, một chatbot có khả năng tạo ra văn bản tự nhiên nhờ vào mô hình ngôn ngữ AI. Lúc đó, khái niệm về một thế giới công nghệ với các công cụ hỗ trợ người dùng bằng AI vẫn còn rất mới, chưa ai tưởng tượng được công năng và tác động đối với thị trường công nghệ.
Trước khi ChatGPT xuất hiện, chúng ta đã biết đến các chatbot có khả năng cung cấp câu trả lời được lập trình sẵn. Tuy nhiên, chưa từng có một giải pháp nào có thể trở thành một công cụ mạnh mẽ như vậy, cho phép máy móc tương tác với con người, đàm phán về mọi chủ đề và thậm chí hỗ trợ người dùng trong các công việc lặp đi lặp lại tốn thời gian, từ việc lên kế hoạch đến việc viết văn bản dựa trên chủ đề có sẵn.
Chỉ sau một năm, ChatGPT đã trải qua nhiều biến động lớn. Từ việc bị cấm tại Ý vì lo ngại về quyền riêng tư cho trẻ em, đến những tranh cãi nội bộ khi Sam Altman bị sa thải khỏi vị trí CEO rồi lại quay trở lại và loại bỏ 3 thành viên ban quản trị OpenAI. Mặc dù gây ra nhiều tranh cãi, nhưng ChatGPT vẫn giữ được lòng tin của hàng triệu người dùng và trở thành trợ lý ảo đáng tin cậy, hỗ trợ trong nhiều tác vụ khác nhau từ web đến di động, với hàng tỷ lượt truy cập.
Theo thống kê từ SimilarWeb, chỉ trong tháng 10/2023, ChatGPT đã thu hút gần 1.7 tỷ lượt truy cập từ cả hai nền tảng web và di động, với khoảng 193 triệu người dùng và thời gian truy cập trung bình là 8 phút. Số liệu này vượt xa so với Zoom và Google Meet, đánh dấu sức hút lớn của ChatGPT trong cộng đồng người dùng.
Đặc biệt, ngoài việc là một trợ lý ảo hữu ích, ChatGPT còn đóng góp tích cực vào sự phát triển toàn diện của ngành công nghệ AI. Chỉ trong vài tháng, AI tạo nội dung đã trở thành một xu hướng nổi bật, thú vị trong cộng đồng công nghệ, và đã tạo ra hàng chục sản phẩm tiêu dùng mới dựa trên công nghệ này, không chỉ giới hạn ở văn bản và mã code mà còn bao gồm cả hình ảnh, âm thanh và video.
Bây giờ, việc trò chuyện để tìm thông tin hoặc được hỗ trợ lập trình dễ dàng hơn bao giờ hết với Github Copilot và Perplexity AI. Các phiên bản này được điều chỉnh từ mô hình ngôn ngữ GPT để phục vụ các nhu cầu cụ thể. Nhiều doanh nghiệp và startup đã liên hệ với OpenAI để thuê API mô hình ngôn ngữ của họ, tạo ra những GPT tùy chỉnh để sử dụng trong các giải pháp doanh nghiệp, bao gồm cả việc phân tích dữ liệu.
Trong cuộc đua phát triển công nghệ AI, nhiều startup và tập đoàn công nghệ lớn như Microsoft, Google, Meta và Amazon đã bắt đầu phát triển mô hình ngôn ngữ riêng của họ. Mục tiêu là tạo ra các chatbot có khả năng hiểu và đáp ứng các yêu cầu của người dùng. Mặc dù chúng không thể sánh kịp với ChatGPT ở mức độ phổ biến và tính hiệu quả, nhưng đó là dấu hiệu cho thấy thị trường mô hình ngôn ngữ đang trở nên ngày càng đa dạng và sôi động.
Sau khi OpenAI giới thiệu ChatGPT, Anthropic và Google cũng không chần chừ. Vài tháng sau, Anthropic ra mắt Claude, trong khi Google tung ra Bard.
Anthropic được thành lập vào năm 2021 bởi những cựu nhân viên của OpenAI, tập trung vào khía cạnh đạo đức và an toàn của trợ lý ảo sử dụng mô hình ngôn ngữ. Anthropic phát triển Claude với mục tiêu tuân thủ các nguyên tắc đạo đức và tự cải thiện dựa trên phản hồi của người dùng. Trong khi đó, Bard của Google được xây dựng từ mô hình ngôn ngữ Pathways Language Model 2, sử dụng kết quả tìm kiếm trực tuyến của Google để cung cấp thông tin cho mỗi yêu cầu từ người dùng, tirng cả kết nối internet và khả năng xử lý ngôn ngữ tự nhiên để cung cấp thông tin dễ hiểu.
Cả hai đều được coi là đối thủ lớn nhất của ChatGPT.
Tiếp theo, Inflection AI ra mắt trợ lý ảo Pi, được thiết kế để tạo ra câu trả lời cá nhân hóa và gần gũi hơn ChatGPT. Corhere cũng giới thiệu Coral, trong khi Meta, chủ sở hữu của Facebook và Instagram, phát triển Llama 2 dưới dạng mã nguồn mở miễn phí, tạo điều kiện cho việc phát triển ứng dụng sử dụng mô hình ngôn ngữ của họ.
Gần đây, Reka, một đơn vị mới thành lập chỉ sau 6 tháng đã giới thiệu Yasa-1, sử dụng một mô hình đồng nhất để xử lý ngôn ngữ, hình ảnh, âm thanh và video ngắn. Cùng trong thời gian gần đó, xAI, do Elon Musk sáng lập, công bố Grok, sử dụng dữ liệu thời gian thực từ mạng xã hội X để cung cấp thông tin mới nhất.
Bên cạnh việc tạo ra các giải pháp hỗ trợ người dùng trong nhiều tác vụ khác nhau như tìm kiếm thông tin và tóm tắt văn bản, cần nhớ rằng mô hình ngôn ngữ hiện tại liên tục biến đổi. Sức mạnh và hạn chế của chúng có thể thay đổi hoàn toàn chỉ trong vài tháng.
Trong vòng 1 năm kể từ khi ChatGPT ra mắt, mô hình ngôn ngữ đã trải qua nhiều biến đổi. Từ việc chỉ là công cụ hỗ trợ văn bản, chúng đã phát triển thành những công cụ có khả năng nhận diện cả giọng nói và hình ảnh. Thậm chí, khi kết hợp với các công cụ AI khác để tạo nội dung âm thanh, những LLM có thể trở thành những trợ lý thông minh hơn rất nhiều so với những gì Siri, Alexa hoặc Cortana có thể làm trước đây.
Trong lĩnh vực phục vụ doanh nghiệp, đã bắt đầu xuất hiện các công cụ trợ lý ảo phục vụ từng nhu cầu cụ thể, từ các ngành nghề, ngôn ngữ đến đối tượng khách hàng, và mỗi loại đều có những chatbot riêng.
Ở Hàn Quốc, Naver đang phát triển HyperClovaX. Trung Quốc có Ernie với chatbot DeepSeek mới được công bố, cùng với Poro và Nucleus. Nucleus đặc biệt hướng đến thị trường nông nghiệp. Reliance Industries Ấn Độ cũng sắp ra mắt trợ lý ảo từ AI tạo nội dung, phục vụ riêng cho các ngôn ngữ của đất nước rộng lớn này, họ đã hợp tác với Nvidia để xây dựng cơ sở hạ tầng vận hành chatbot tiếng Ấn.
Thị trường chatbot và AI tạo nội dung ngày càng sôi động và cạnh tranh trở nên khốc liệt. Mỗi ai cũng muốn biến những lời hứa về các công cụ AI có khả năng giao tiếp tự nhiên thành hiện thực. Nhưng cuộc đua mới chỉ bắt đầu. Khi mô hình ngôn ngữ sử dụng cho việc phát triển chatbot trở nên ngày càng hoàn thiện, ít gặp phải các vấn đề về 'loạn ngôn', khoảng cách công nghệ giữa các đối thủ được liệt kê ở trên sẽ ngày càng thu hẹp.
Bước sang tuổi 1, ChatGPT vẫn đứng đầu thị trường chatbot AI một cách vững vàng. Tuy nhiên, sự cạnh tranh trong việc giữ vị trí này không hề dễ dàng. OpenAI sẽ phải nỗ lực không ngừng để duy trì vị thế dẫn đầu. Đồng thời, việc tạo ra những hệ thống trí tuệ nhân tạo tổng hợp (AGI) cũng là một mục tiêu quan trọng, nơi mà máy móc không chỉ có khả năng hiểu và tạo ra ngôn ngữ và nội dung mà còn có khả năng phân tích dữ liệu như bộ não con người. Tiềm năng và nguy cơ của AGI đều rất lớn và đáng quan ngại.