
Công nghệ mới tại nơi làm việc thường bắt đầu như những biểu tượng của địa vị và hỗ trợ năng suất. Những chiếc điện thoại ô tô đầu tiên và các bản trình bày PowerPoint đã đóng cửa thương vụ và cũng là dấu hiệu về uy tín của người sử dụng.
Một số đối tác tại EY, tập đoàn kiểm toán trước đây được biết đến với tên gọi Ernst & Young, đang thử nghiệm một trò đùa mới tại nơi làm việc cho thời đại trí tuệ nhân tạo. Họ làm phong phú thêm các bài thuyết trình cho khách hàng hoặc các email thông thường với các đoạn video tổ chức giọng nói giống như đầu người nhân tạo của chính họ, được tạo ra bằng phần mềm trí tuệ nhân tạo—một sự quay số doanh nghiệp trên một công nghệ phổ biến thường được biết đến với tên gọi deepfakes.
Sự thăm dò về công nghệ này của công ty, được cung cấp bởi công ty khởi nghiệp Anh Quốc Synthesia, diễn ra trong bối cảnh đại dịch đã làm chết chân các phương thức truyền thống để củng cố mối quan hệ kinh doanh. Golf và những buổi trưa dài là khó khăn hoặc không thể, cuộc gọi Zoom và PDF quá phổ biến.
Đối tác của EY đã sử dụng bản sao của họ trong email và để cải thiện bài thuyết trình. Một đối tác không nói tiếng Nhật đã sử dụng chức năng dịch tích hợp vào công nghệ của Synthesia để hiển thị hình ảnh AI của mình nói bằng ngôn ngữ bản địa của một khách hàng tại Nhật Bản, có vẻ đã có hiệu quả tốt.
“Chúng tôi sử dụng nó như một yếu tố phân biệt và làm nổi bật người đó là ai,” nói Jared Reeder, người làm việc tại EY trong một nhóm cung cấp sự trợ giúp sáng tạo và kỹ thuật cho đối tác. Trong vài tháng qua, anh đã chuyên sâu trong việc tạo ra bản sao AI của đồng nghiệp. “Thay vì gửi email và nói ‘Chào, chúng ta vẫn hẹn gặp vào thứ Sáu,’ bạn có thể thấy tôi và nghe giọng của tôi,” anh nói.
Các đoạn video được trình bày mở cửa như là nhân tạo, không phải là video thực tế nhằm lừa dối người xem. Reeder nói rằng chúng đã chứng minh là một cách hiệu quả để làm sinh động các tương tác thông thường với khách hàng. “Nó giống như mang theo một chú chó con trên camera,” anh nói. “Họ thích nó.”
Công cụ doanh nghiệp mới đòi hỏi ngôn ngữ mới: EY gọi chúng là những bản sao ảo ARI, đại diện cho danh tính thực tế nhân tạo, thay vì deepfakes. Dù bạn gọi chúng là gì, chúng là ví dụ mới nhất về việc thương mại hóa hình ảnh và âm thanh được tạo ra bằng trí tuệ nhân tạo, một khái niệm kỹ thuật xuất hiện rộng rãi lần đầu tiên vào năm 2017 khi các đoạn video tổng hợp và khiêu dâm của các diễn viên Hollywood bắt đầu lan truyền trực tuyến. Deepfakes đã ngày càng trở nên thuyết phục hơn, thương mại hóa và dễ làm hơn kể từ đó.
Công nghệ này đã được sử dụng để tùy chỉnh ảnh cổ phiếu, tạo mô hình để trưng bày quần áo mới và trong các sản phẩm Hollywood thông thường. Công ty Lucasfilm gần đây đã thuê một thành viên nổi bật của cộng đồng trực tuyến phát triển mạnh của những người làm deepfakes không chuyên nghiệp, người đã giành được hàng triệu lượt xem cho các đoạn video trong đó anh ta làm lại khuôn mặt trong các đoạn clip Star Wars. Nvidia, những con chip đồ họa của họ cung cấp năng lượng cho nhiều dự án trí tuệ nhân tạo, đã tiết lộ tuần trước rằng bài diễn thuyết gần đây của CEO Jensen Huang đã được làm giả với sự giúp đỡ của học máy.
Synthesia, người cung cấp công nghệ cho các bản sao ảo ARI của EY, đã phát triển một bộ công cụ để tạo video tổng hợp. Các khách hàng của họ bao gồm công ty quảng cáo WPP, đã sử dụng công nghệ này để phát sóng thông điệp nội bộ của doanh nghiệp bằng nhiều ngôn ngữ khác nhau mà không cần nhiều buổi quay video. EY đã giúp một số khách hàng tư vấn tạo ra các đoạn video tổng hợp cho thông báo nội bộ.
Reeder và nhóm của anh tạo ra ARI đầu tiên của họ vào tháng Ba, cho một đề xuất của khách hàng. EY đã giành được thỏa thuận và tin đồn về hình ảnh avatar AI đã giúp đỡ lan truyền. Sớm, các đối tác khác muốn có bản sao AI của riêng họ. Reeder và nhóm của anh hiện đã tạo ra avatar cho tám đối tác; tất cả đều từ chối nói chuyện với Mytour.
Quá trình nhân bản là không đau đớn: Đối tượng ngồi trước camera khoảng 40 phút, đọc một kịch bản đặc biệt. Hình ảnh và âm thanh cung cấp đủ ví dụ về cử chỉ khuôn mặt của một người và cách họ phát âm các nguyên âm khác nhau để bắt chước diện mạo và giọng của họ. Sau đó, việc tạo video ARI của một người chỉ cần gõ những gì họ nên nói. Công nghệ có thể hiển thị nền khác nhau. Reeder khuyến khích đối tác sử dụng văn phòng tại nhà, phòng khách, hoặc những nơi khác có đồ vật cá nhân có thể tạo điểm nói chuyện.
Trong một đoạn video về ARI của chính Reeder, bản sao của anh xuất hiện từ ngực lên trong một bộ vest tối, trong một văn phòng mang thương hiệu EY và trông giống như Reeder thực tế trong một cuộc gọi Zoom. Avatar nói “Chào, tôi là Jared Reeder” một cách giả mạo giọng của anh, trước khi thêm vào “Thực sự tôi không phải, tôi là avatar của anh ấy.”
Giống như tất cả các khách hàng của Synthesia, EY phải có sự đồng ý của người trước khi tạo phiên bản số của họ. Công ty kiểm toán nói rằng quyền truy cập vào các công cụ tạo ARI được kiểm soát cẩn thận để ngăn chặn việc sử dụng trái phép hoặc không cân nhắc.
EY dự định tiếp tục thử nghiệm với bản sao kỹ thuật số của nhân viên nhưng tính mới lạ của video tổng hợp như một công cụ kinh doanh có thể không kéo dài lâu. Anita Woolley, giáo sư và nhà tâm lý tổ chức tại trường kinh doanh Đại học Carnegie Mellon, nói rằng mặc dù thu hút, video được tạo ra bằng công nghệ của Synthesia cũng có thể trông hơi kỳ cục.
“Khi bạn có một công nghệ hiển thị vẻ ngoại hình giống con người, có một đường ranh giới mỏng từ sự an ủi đến sự kỳ quặc,” Woolley nói. Nghiên cứu của bà cho thấy việc vội vã nhận định video đôi khi có thể là một sai lầm. Có bằng chứng chứng minh rằng cuộc gọi video có thể làm cho việc giao tiếp hoặc giải quyết vấn đề khó khăn hơn, vì hình ảnh có thể làm mất tập trung khỏi nội dung của cuộc trò chuyện.
Reeder tại EY nói rằng anh cũng gặp phải một số hoài nghi khi giới thiệu công nghệ nhân bản video của Synthesia nội bộ. Một số đồng nghiệp đã bày tỏ lo ngại rằng công nghệ có thể cuối cùng làm giảm giá trị của yếu tố con người trong công việc của họ.
Reeder khẳng định rằng các đoạn video tổng hợp có thể tăng cường, thay vì giảm bớt, sự chạm vào con người. Một doanh nhân đang xử lý nhiều khách hàng có thể không có thời gian để quay hàng chục video cá nhân, nhưng với một avatar AI có thể tạo ra chúng trong vài phút. “Có điều gì con người hơn khi tôi nói ‘Chào, buổi sáng tốt lành,’ với giọng điệu của tôi, cử chỉ của tôi, và khuôn mặt của tôi?” anh hỏi.
Những Câu Chuyện Tuyệt Vời Hơn từ Mytour
- 📩 Thông tin mới nhất về công nghệ, khoa học, và nhiều hơn nữa: Nhận bản tin của chúng tôi!
- Lịch sử dân dụ Black Twitter
- Tại sao ngay cả người chạy nhanh nhất cũng không thể chạy nhanh hơn mèo nhà bạn
- Thuyền chiến hình hài đang gieo rối trong khu vực xung đột
- Cách mới này để đào tạo trí tuệ nhân tạo có thể kiểm soát quấy rối trực tuyến
- Cách xây dựng một lò nướng chạy bằng năng lượng mặt trời
- 👁️ Khám phá trí tuệ nhân tạo như chưa bao giờ có với cơ sở dữ liệu mới của chúng tôi
- 🎮 Mytour Games: Nhận những mẹo, đánh giá, và nhiều hơn nữa
- 🏃🏽♀️ Muốn có những công cụ tốt nhất để trở nên khỏe mạnh? Kiểm tra lựa chọn của đội Gear chúng tôi cho các thiết bị theo dõi sức khỏe tốt nhất, trang thiết bị chạy (bao gồm giày và tất), và tai nghe tốt nhất
