Đằng Sau Sự Thăng Hoa Của Các Ông Lớn Nhận Diện Khuôn Mặt Ở Trung Quốc

Những khuôn mặt không quen không được hoan nghênh tại các dự án nhà ở công cộng ở Bắc Kinh. Để ngăn chặn việc cho thuê phi pháp, nhiều dự án có hệ thống nhận diện khuôn mặt chỉ cho phép người dân và một số nhân viên giao hàng cụ thể vào, theo hãng tin nhà nước Xinhua. Dự kiến mỗi trong 59 khu nhà ở công cộng của thành phố sẽ có công nghệ này vào cuối năm.
Công ty khởi nghiệp trí tuệ nhân tạo Megvii đề cập đến một hợp đồng an ninh tương tự tại một thành phố Trung Quốc không được tiết lộ trong đơn đăng ký niêm yết công cộng đầu tiên ở Hong Kong tuần trước. Công ty Trung Quốc, nổi tiếng với công nghệ nhận diện khuôn mặt, quảng cáo các thương vụ của chính phủ, bao gồm việc khóa chặt nhà ở công cộng để kiềm chế việc cho thuê phi pháp, là một điểm bán hàng để thu hút nhà đầu tư tiềm năng.
Đơn đăng ký của Megvii thể hiện quy mô của những hoạch định của Trung Quốc trong lĩnh vực trí tuệ nhân tạo và cách chúng có thể ảnh hưởng đến việc sử dụng các công nghệ giám sát như nhận diện khuôn mặt trên toàn thế giới. Công ty là một trong bốn startup trí tuệ nhân tạo Trung Quốc chuyên sâu về nhận diện khuôn mặt có giá trị hơn 1 tỷ đô la, đủ điều kiện làm kỳ lân theo cách nói của Silicon Valley. Bây giờ, các công ty này đang tìm cách mở rộng ra nước ngoài, với sự hỗ trợ từ thị trường công cộng.
“Các công ty này đã hưởng lợi từ việc Chính phủ Trung Quốc đặt nhiệm vụ quốc gia làm lãnh đạo thế giới về Trí tuệ Nhân tạo,” nói Rebecca Fannin, tác giả của tác phẩm sắp phát hành Tech Titans of China và hai cuốn sách trước về tình hình công nghệ của Trung Quốc. Sự hỗ trợ đó đã dẫn đến các hợp đồng và giải phóng quỹ của chính phủ và tư nhân, bà nói thêm. “Bây giờ bạn bắt đầu thấy những công ty này mở rộng quốc tế.”
Freedom House, một tổ chức phi lợi nhuận được Chính phủ Hoa Kỳ hỗ trợ, đã cảnh báo trong một báo cáo tháng 10 năm ngoái rằng các thỏa thuận giám sát của Trung Quốc cũng xuất khẩu quan điểm về quyền riêng tư của đất nước và có thể khuyến khích các công ty và chính phủ thu thập và tiết lộ dữ liệu nhạy cảm. Báo cáo lý luận rằng các công ty và sản phẩm được xây dựng để phục vụ các cơ quan chính phủ không quan tâm đến quyền riêng tư có khả năng sẽ không trở thành những người bảo vệ đáng tin cậy của quyền con người ở nơi khác, và có thể bị buộc phải phục vụ lợi ích của chính phủ Trung Quốc.
Đơn đăng ký của Megvii cho biết họ đã huy động hơn 1,3 tỷ đô la, chủ yếu từ các quỹ đầu tư và công ty Trung Quốc, bao gồm đại gia thương mại điện tử Alibaba. Một trong những quỹ VC của Trung Quốc do nhà nước sở hữu cũng có cổ phần và chiếm một ghế trong hội đồng quản trị của startup. Những nhà đầu tư khác bao gồm công ty đầu tư của Mỹ GGV và quỹ quốc gia của Abu Dhabi và Kuwait. CB Insights nói rằng công ty này đã được định giá 4 tỷ đô la vào đầu năm nay. Reuters đưa tin rằng việc niêm yết công cộng của nó sẽ huy động ít nhất 500 triệu đô la, nhưng con số này đã bị mờ đi từ đơn đăng ký của công ty. Fannin nói rằng đối thủ lớn hơn SenseTime, được định giá 4,5 tỷ đô la theo CB Insights và cũng mở rộng quốc tế, dự kiến sẽ niêm yết công cộng sớm. Hoạch định quốc tế của nó có thể được hỗ trợ bởi các nhà đầu tư Mỹ Qualcomm và Silver Lake Capital.
Nhu cầu về hệ thống thị giác máy tính của Megvii đang tăng nhanh chóng. Công ty báo cáo doanh thu là 1,4 tỷ nhân dân tệ (200 triệu đô la) vào năm 2018, gấp đội bốn lần so với cùng kỳ năm trước. Công ty ghi nhận lỗ là 3,4 tỷ nhân dân tệ (469 triệu đô la). Phân khúc kinh doanh “City IoT” cung cấp các hệ thống giám sát và an ninh, như kiểm soát truy cập cho nhà ở công cộng, chiếm gần ba tư số doanh thu của mình và có khách hàng ở hơn 15 “quốc gia và vùng lãnh thổ” ngoài Trung Quốc. Bộ phận này cũng cung cấp phần mềm có thể nhận diện vi phạm giao thông hoặc thay đổi luồng giao thông được quay trên video.
Trong 6 tháng đầu năm nay, Megvii cho biết 4,9% doanh thu của họ đến từ ngoại trừ Trung Quốc, so với 2,7% trong cả năm ngoái. Bây giờ, họ dự định thành lập các liên doanh hoặc văn phòng ở Nhật Bản, Singapore, Thái Lan và Trung Đông.
Megvii được thành lập vào năm 2011 bởi Yin Qi và hai người bạn từ Đại học Tsinghua danh tiếng của Bắc Kinh. Tên của công ty là viết tắt của "mega vision"—cũng là bản dịch gần đúng của tên tiếng Trung của nó, 旷视. Dự án của họ được định thời hoàn hảo để lướt sóng sự quan tâm vào trí tuệ nhân tạo do sự xuất hiện của một công nghệ gọi là deep learning vào năm 2012, làm cho phần mềm giải mã hình ảnh trở nên chính xác hơn nhiều.
Kể từ đó, Megvii và đối thủ trí tuệ nhân tạo SenseTime, CloudWalk và Yitu đã làm cho nhận diện khuôn mặt trở nên phổ biến ở Trung Quốc, nơi cảnh sát quét không gian công cộng để tìm nghi phạm, và người dân thanh toán mua sắm và nộp thuế bằng khuôn mặt của họ. Gần đây, các công ty khởi nghiệp Trung Quốc, cùng với một số công ty từ Nga, đã thống trị bảng xếp hạng về độ chính xác nhận diện khuôn mặt của Viện Tiêu chuẩn và Công nghệ Quốc gia Hoa Kỳ.
Một trong những thành công đầu tiên của Megvii đến từ năm 2015, khi đối tác của Alibaba, Ant Financial, sử dụng công nghệ của họ để ra mắt tính năng gọi là Smile to Pay. Hiện nay, Megvii cung cấp nhận diện khuôn mặt cho các dự án giám sát của chính phủ tại Trung Quốc, và xác thực khuôn mặt cho ngân hàng và nhà sản xuất điện thoại thông minh, bao gồm Oppo, mà theo nghiên cứu của Counterpoint Research là nhà sản xuất điện thoại lớn thứ năm thế giới theo lượng gửi hàng. Các nhà nghiên cứu của Megvii thường xuyên giành giải trong các cuộc thi học thuật về thuật toán thị giác máy tính và đã đánh bại các đối thủ từ Google và Microsoft.
Nhận diện khuôn mặt là công nghệ mà Megvii nổi tiếng và đã cung cấp lâu nhất, và an ninh và giám sát được trang bị trí tuệ nhân tạo có vẻ là ngành kinh doanh chính của công ty. Công ty khởi nghiệp cũng có một nhóm robot kho và quảng bá thuật toán làm đẹp có thể loại bỏ mụn và định hình cơ thể trong những bức ảnh tự sướng.
Cảnh sát ở Trung Quốc sử dụng nhận diện khuôn mặt để nhận biết những người quan tâm từ đám đông trong các buổi hòa nhạc, và họ thậm chí đã sử dụng thiết bị giống như kính Google Glass có thể quét khuôn mặt của bất kỳ ai họ đang nhìn. Công nghệ này là một phần của cơ sở an ninh chặt chẽ được tạo ra để theo dõi khu vực Tân Cương tây bắc của Trung Quốc, nơi khoảng 1 triệu người Hồi giáo Uighur đã bị đưa vào các trại giam. The New York Times đưa tin vào tháng 4 rằng Megvii, SenseTime và CloudWalk đã giúp tạo ra phần mềm giám sát tìm kiếm khuôn mặt Uighur. Công ty PR của Megvii nói rằng công ty không thiết kế hoặc tùy chỉnh sản phẩm của mình để nhắm đến các nhóm dân tộc.
Hồ sơ của Megvii đề cập đến việc cảnh sát sử dụng công nghệ của họ, nhưng không đề cập đến Tân Cương hoặc các thuật toán cố gắng phát hiện dân tộc. Nó trình bày các trường hợp nghiên cứu làm cho các dịch vụ giám sát của họ trở nên dễ thương hơn.
Một trong số đó mô tả một sự cố năm 2018, trong đó cảnh sát ở miền bắc Trung Quốc sử dụng công nghệ của Megvii để xác định một người già quên tên và địa chỉ của mình và sau đó đưa anh ta về nhà. Hồ sơ cũng đề cập đến công nghệ mà Megvii đã đăng ký nhãn hiệu để nhận biết chó dựa trên dấu vết mũi, được chính quyền Bắc Kinh sử dụng để quản lý chó hoang.
Các cơ quan chức năng Mỹ có lẽ sẽ không mua từ Megvii, mặc dù công ty khởi nghiệp có một phòng lab nghiên cứu ở ngoại ô Seattle cũng là nơi đóng quân của Microsoft. Các cơ quan Mỹ truyền thống luôn thận trọng với công nghệ an ninh từ những nơi không phải là đồng minh chặt chẽ của Mỹ. Hồ sơ của Megvii cảnh báo rằng nó có thể bị tổn thương do thuế quan của chính quyền Trump đối với Trung Quốc hoặc các ảnh hưởng gián tiếp từ sự nghi ngờ đối với công ty viễn thông Huawei.
Fannin nói rằng công ty sẽ có thời gian dễ dàng hơn ở các khu vực khác của châu Á, Nam Mỹ, Trung Đông và châu Phi. Tất cả đều trở thành thị trường quan trọng đối với các công ty công nghệ Trung Quốc, bao gồm Hikvision, nhà cung cấp camera an ninh lớn nhất thế giới.
Công nghệ giám sát của Megvii đã có mặt tại Thái Lan, và các đối thủ của họ cũng bắt đầu đạt được thành công ngoại ô Trung Quốc. Yitu cung cấp công nghệ nhận diện khuôn mặt cho cảnh sát Malaysia, và CloudWalk đã giành hợp đồng xây dựng hệ thống nhận diện khuôn mặt quốc gia cho Zimbabwe thông qua Chương trình Đường và Dự án Hạ tầng Quốc tế của Trung Quốc.
Hồ sơ của Megvii dành nhiều không gian đảm bảo những nhà đầu tư tiềm năng rằng họ có thể tin tưởng sử dụng trí tuệ nhân tạo một cách đúng đắn. Nó bao gồm mã hành vi đạo đức AI của công ty và nói rằng các hợp đồng với khách hàng cấm sử dụng công nghệ của họ để vi phạm nhân quyền. Megvii cũng liệt kê một ủy ban đạo đức AI báo cáo cho hội đồng quản trị của mình, bao gồm các giám đốc và nhân viên của công ty cũng như một số người bên ngoại.
Một thành viên được liệt kê, Emmanuel Lagarrigue, giám đốc đổi mới của Schneider Electric đặt tại Pháp, mô tả ủy ban này như một “quá trình làm việc.” Anh ta nói rằng việc thành lập ủy ban chưa hoàn thành nhưng Megvii đáng được khen ngợi vì đã tạo ra nhóm này. “Nó thể hiện sự sẵn sàng của công ty đối với việc tích cực và minh bạch về cách họ muốn hoạt động và về cách công nghệ của họ được triển khai,” Lagarrigue nói.
Jeffrey Ding, người nghiên cứu về phát triển Trí tuệ Nhân tạo Trung Quốc tại Viện Tương lai của Nhật bản, cho biết trên giấy, cấu trúc đạo đức của Megvii có vẻ mạnh mẽ hơn so với một số công ty lớn ở Mỹ. Google và Microsoft đã công bố tuyên bố về nguyên tắc AI, nhưng chúng chỉ được triển khai thông qua quy trình đánh giá nội bộ.
Tuy nhiên, các công ty Trung Quốc không hoàn toàn kiểm soát định mệnh của mình. “Kinh tế là một thị trường tương đối tự do, nhưng đảng và nhà nước có thể hoàn toàn kiểm soát bất kỳ công ty nào vào bất kỳ lúc nào,” Ding nói. “Nghĩa vụ đạo đức của các công ty Trung Quốc đến với một chút ít trọng lượng hơn.”
Cập nhật, ngày 4 tháng 9 năm 2019, 1:40 chiều ET: Bài viết này đã được cập nhật để thể hiện rằng Ant Financial đã sử dụng công nghệ của Megvii để ra mắt Smile to Pay.
Chủ đề Tuần của MYTOUR: Làm thế nào chúng ta học
- Hướng dẫn thiên hà này là tương lai của giáo dục AR
- Trở thành một nhạc sĩ bằng cách sử dụng ứng dụng và một chiếc piano sáng tạo
- Trường lập trình miễn phí! (Nhưng bạn sẽ trả giá sau)
- Người máy thực sự cần phải học các lớp đạo đức
- Hỏi những người biết tất cả: Máy học như thế nào
- 👁 Nhận diện khuôn mặt đột ngột xuất hiện ở mọi nơi. Bạn có nên lo lắng không? Ngoài ra, đọc tin tức mới nhất về trí tuệ nhân tạo
- 💻 Nâng cấp công việc của bạn với những chiếc laptop, bàn phím, phương pháp đánh máy và tai nghe chống ồn mà đội ngũ Gear yêu thích của chúng tôi