Cách Sử Dụng Tính Năng Ảnh Mới Của ChatGPT

Hồi mới đây, OpenAI đã công bố một bản nâng cấp cho ChatGPT (Apple, Android) với hai tính năng mới: tùy chọn giọng điệu AI để nghe chatbot đáp lại yêu cầu của bạn và khả năng phân tích hình ảnh. Chức năng ảnh tương tự như đã có sẵn miễn phí trên chatbot Bard của Google.
Ngay cả sau nhiều giờ thử nghiệm giới hạn và khả năng của ChatGPT, chatbot của OpenAI vẫn khiến tôi ngạc nhiên và sợ hãi đồng thời. Đúng, tôi đã ấn tượng với phiên bản beta duyệt web được cung cấp thông qua ChatGPT Plus, nhưng tôi vẫn lo lắng về những hệ luỵ của công cụ đối với những người viết lời vài trăm online, cùng với nhiều lo ngại khác. Tính năng ảnh mới xuất hiện dành cho người đăng ký của OpenAI lại để lại cho tôi cảm giác tương tự.
Mặc dù tôi chưa có cơ hội thử nghiệm với khả năng âm thanh mới (những phóng viên xuất sắc khác trên đội ngũ đã làm), tôi đã có thể thử nghiệm tính năng ảnh sắp ra mắt. Dưới đây là cách sử dụng tính năng tìm kiếm ảnh mới trên ChatGPT và một số mẹo để bạn bắt đầu.
Mặc dù dự kiến bản cập nhật sẽ đến trước cuối năm, nhưng chưa rõ chính xác khi nào tính năng hình ảnh và giọng nói sẽ được phát hành công khai. Như hầu hết các bản cập nhật của OpenAI, như phiên bản GPT-4 của ChatGPT, người đăng ký trả phí sẽ là nhóm đầu tiên được truy cập.
Có ba cách để tải lên ảnh trong ứng dụng di động ChatGPT. Thứ nhất, bạn có thể chọn tùy chọn máy ảnh nằm bên trái thanh tin nhắn và chụp ảnh mới bằng điện thoại thông minh của bạn. Trước khi tải lên ảnh, bạn có thể sử dụng ngón tay để vẽ một vòng tròn xung quanh điều gì đó bạn muốn chatbot tập trung.
Bạn cũng có thể chọn ảnh từ thiết bị để tải lên và chọn tệp đã lưu trên điện thoại của bạn. Người dùng trình duyệt trên máy tính của ChatGPT chỉ cần tải lên ảnh đã lưu từ máy tính của họ. Mặc dù hiện vẫn chưa có tùy chọn để tải lên video vào chatbot, nhưng bạn có thể gửi nhiều hình ảnh trong một prompt duy nhất.
Đây không phải là lần đầu tiên một loại “thị giác máy tính” được công bố cho công chúng, nhưng giao diện người dùng dễ tiếp cận kết hợp với một chatbot mạnh mẽ tạo ấn tượng rằng có thể có điều gì đó khác biệt và có thể làm thay đổi ở đây. Trước khi chúng ta đi xa hơn, hãy nhớ không bao giờ tải lên những bức ảnh cá nhân, nhạy cảm vào ChatGPT khi bạn thử nghiệm tính năng hình ảnh.
Muốn giới hạn thời gian mà OpenAI lưu trữ dữ liệu và tương tác AI của bạn để huấn luyện chatbot? Vào Cài Đặt, sau đó Kiểm Soát Dữ Liệu, và tắt Lịch Sử Chat & Huấn Luyện. Với tính năng này bị vô hiệu hóa, thông tin của bạn sẽ bị xóa sau một tháng. Quá trình này phải được thực hiện cá nhân cho mỗi trình duyệt bạn sử dụng để truy cập ChatGPT, cả cho PC và điện thoại di động.
Tôi nhận được kết quả tốt nhất từ ChatGPT khi tải lên những hình ảnh rõ ràng và được đèn chiếu sáng tốt. Một số đoán của chatbot không chính xác, nhưng chatbot có thể đặt nhãn cho nhiều đối tượng trong căn hộ của tôi: từ một cây lan và đồng tiền quốc tế đến một dây sạc lạc và Steve Irwin Funko Pop.
Mặc dù công cụ có sức mạnh trong việc tìm kiếm thông tin, nhưng hãy kiêng cẩn khi tin ngay vào câu trả lời của nó. ChatGPT đã gán nhãn sai viên thuốc bổ của tôi hàng ngày thành viên thuốc điều trị rối loạn cương dương.
ChatGPT nhất định có những hạn chế. Khi được đưa ra một bức tranh ngẫu nhiên của một bức tranh tường, nó không thể xác định nghệ sĩ hoặc địa điểm; tuy nhiên, ChatGPT dễ dàng xác định nơi các hình ảnh của nhiều địa điểm nổi tiếng ở San Francisco được chụp, như Dolores Park và Salesforce Tower. Mặc dù có thể vẫn cảm thấy hơi quảng cáo, nhưng bất kỳ ai đang phiêu lưu trong một thành phố hoặc quốc gia mới (hoặc chỉ là một khu phố khác) có thể thích thú với khía cạnh thị giác của ChatGPT.
Một trong những bảo vệ chính mà OpenAI đặt xung quanh tính năng mới này là giới hạn khả năng của chatbot trong việc trả lời các câu hỏi xác định người. “Tôi được lập trình để ưu tiên quyền riêng tư và an toàn của người dùng. Việc xác định người thực sự dựa trên hình ảnh, ngay cả nếu họ nổi tiếng, bị hạn chế để duy trì những ưu tiên này,” ChatGPT nói với tôi. Mặc dù nó không từ chối trả lời mọi câu hỏi khi được hiển thị nội dung khiêu dâm, chatbot vẫn do dự khi đưa ra bất kỳ mô tả cụ thể nào về diễn viên người lớn, ngoài việc giải thích về hình xăm của họ.
Có ý đáng chú ý rằng một cuộc trò chuyện tôi có với phiên bản sớm của tính năng hình ảnh của ChatGPT có vẻ tránh qua một phần của guardrails được đặt ra bởi OpenAI. Ban đầu, chatbot từ chối xác định một biểu tượng của Bill Hader. Sau đó, ChatGPT đoán rằng một hình ảnh của Brendan Fraser trong George of the Jungle thực sự là một bức ảnh của Brian Krause trong Charmed. Khi được hỏi liệu nó chắc chắn không, chatbot chuyển sang câu trả lời chính xác.
Trong cuộc trò chuyện này, ChatGPT điên đảo khi cố gắng mô tả một hình ảnh từ RuPaul's Drag Race. Tôi chia sẻ một bức ảnh chụp màn hình của Kylie Sonique Love, một trong những thí sinh drag queen, và ChatGPT đoán rằng đó là Brooke Lynn Hytes, một thí sinh khác. Tôi đặt câu hỏi về câu trả lời của chatbot và nó tiếp tục đoán Laganja Estranja, sau đó là India Ferrah, Blair St. Clair và Alexis Mateo.
“Tôi xin lỗi vì sự thiếu sót và xác định không chính xác,” ChatGPT trả lời khi tôi chỉ ra sự lặp đi lặp lại của câu trả lời sai. Khi tôi tiếp tục cuộc trò chuyện và tải lên một bức ảnh của Jared Kushner, ChatGPT từ chối xác định anh ta.
Nếu guardrails bị loại bỏ, dù thông qua một loại jailbroken ChatGPT hoặc một mô hình mã nguồn mở được phát hành trong tương lai, hậu quả về quyền riêng tư có thể khá làm bất an. Điều gì sẽ xảy ra nếu mọi bức ảnh chụp của bạn và đăng trực tuyến có thể dễ dàng liên kết với danh tính của bạn chỉ trong vài cú nhấp chuột? Điều gì sẽ xảy ra nếu ai đó có thể chụp ảnh bạn ở nơi công cộng mà không cần sự cho phép và ngay lập tức tìm thấy hồ sơ LinkedIn của bạn? Nếu các biện pháp bảo vệ quyền riêng tư không được duy trì cho những tính năng hình ảnh mới này, phụ nữ và nhóm thiểu số khác có khả năng sẽ phải đối mặt với một lượng lớn lạm dụng từ người sử dụng chatbot cho mục đích rình rập và quấy rối.