Khoảng 5 năm trước, Partha Ranganathan, phó chủ tịch công nghệ của Google, nhận ra rằng định luật Moore không còn đúng, kể cả về mật độ transistor lẫn tác dụng của các con chip CPU đa dụng đối với từng nhu cầu cụ thể. Hiện tại, không thể kỳ vọng mỗi 1 năm rưỡi, hiệu năng của chip xử lý tăng gấp đôi như trước, nhưng chi phí không tăng quá cao nữa. Quản lý kinh phí cho việc nâng cấp toàn bộ cơ sở hạ tầng của Google, việc nâng cấp mỗi 4 năm một thế hệ chip mạnh gấp đôi đã trở thành một vấn đề đau đầu với ông Ranganathan. Khi đó, ông biết rằng Google cũng như YouTube phải thử nghiệm điều gì đó mới.Theo dõi kỹ quá trình vận hành, Partha Ranganathan cùng các đồng nghiệp phát hiện ra rằng, đối với dịch vụ YouTube, giai đoạn transcode video đòi hỏi sức mạnh xử lý lớn nhất trong toàn bộ quy trình. Quy trình này cho phép nén các video từ 360p đến 8K mà vẫn đảm bảo chất lượng, nhưng lại tiết kiệm dung lượng băng thông tải về, dù là trên máy tính, laptop, điện thoại hay TV.Để dễ dàng so sánh, chúng tôi ước tính rằng mỗi phút có khoảng 500 giờ video được tải lên YouTube. Thỉnh thoảng, có những video phức tạp đến mức một video cần được xử lý để tạo ra từ 10 đến 15 phiên bản khác nhau, với độ phân giải khác nhau, có HDR tone mapping hay không, và có định dạng quay 360 độ hay không...
Các con chip CPU đa dụng mà Google mua từ Intel hoặc AMD không đáp ứng đúng nhu cầu theo cách kinh tế nhất mà họ mong muốn. Những gì chúng tôi cần là một chip ASIC (application-specific integrated circuit) phục vụ một tác vụ cụ thể, giống như cụm chip Neural Engine hoặc Media Engine trong Apple Silicon. Tương tự, cũng là ASIC nhưng khi được tinh chỉnh để xử lý giải mã blockchain, chúng ta có những hệ thống đào Bitcoin hoặc tiền số với sức mạnh lớn hơn nhiều so với GPU đa dụng...Chúng tôi thực sự muốn lấy tất cả những video được người dùng tải lên YouTube, sau đó transcode chúng sang mọi định dạng có thể, mang lại trải nghiệm tốt nhất cho người dùng.“Với công việc transcoding, một quá trình đặc biệt đòi hỏi sức mạnh phần cứng lớn, chip do Google sản xuất sẽ mang lại hiệu suất cao nhưng chi phí thấp cho họ.”
Hiện nay, Google đang triển khai hàng nghìn chip Argos thế hệ 2 tại nhiều trung tâm dữ liệu của YouTube trên toàn thế giới, và đội ngũ nghiên cứu đang phát triển ít nhất 2 mẫu chip ASIC mới.Thường thì, việc tự phát triển chip xử lý thường được thực hiện với mục đích tiết kiệm chi phí. Tuy nhiên, đôi khi, việc tự sản xuất chip cũng mang lại lợi thế kỹ thuật và tự chủ cho một tập đoàn công nghệ. Hiện nay, số lượng công ty sản xuất chip xử lý cho máy chủ rất ít, bao gồm Nvidia, AMD, Intel. Tất cả họ chỉ tập trung vào chip CPU và GPU đa dụng, không thể so sánh được với ASIC hoặc chip chuyên dụng.Tự phát triển chip transcode không chỉ giúp YouTube có trải nghiệm xem mượt hơn, mà còn mang lại cho Google lợi thế lớn về công nghệ, chi phí vận hành và chiến lược.
Năm 2016, Google không chỉ giới thiệu chip Argos mà còn ra mắt chip ASIC dành cho xử lý AI và học sâu, được gọi là Tensor Processing Unit (TPU). Hiện tại, Google đã phát triển 4 thế hệ chip TPU, trong đó một trong số chúng đã được tích hợp vào Pixel 6 và 6 Pro, tạo ra lợi thế vượt trội về hiệu suất xử lý AI so với các đối thủ khác trên thị trường.Theo Protocol