Lúc này năm ngoái, một cá nhân nổi tiếng từng làm việc cho cả ATI, AMD và Apple đã dọn dẹp nơi làm việc tại Intel và rời đi để 'khởi nghiệp' một công ty mới về Trí tuệ Nhân tạo. Nếu bạn quan tâm đến cả AMD và Intel, chắc hẳn bạn biết đây là ai. Đúng vậy, Raja Koduri, một kỹ sư máy tính người Ấn Độ chuyên về GPU và đồ họa. Ông cũng là người đã thực hiện ước mơ về VGA rời của Intel sau hơn 2 thập kỷ vắng bóng trên thị trường (Intel đã ra mắt mẫu VGA Intel740 dưới dạng card AGP vào năm 1998 nhưng đó là thời kỳ 'tiền sử').
Intel tuyên bố sẽ không sản xuất thêm Ponte Vecchio
Nhưng câu chuyện về Raja tại Intel không chỉ đơn thuần là về các card Intel Arc. Thực tế, những thuật ngữ như oneAPI, Xe GPU, XPU (CPU+GPU), Ponte Vecchio, máy tính siêu hiệu năng Aurora đều liên quan đến cựu Phó Chủ tịch cao cấp của Intel. Trong hơn 1 năm qua, các dự án liên quan đến Raja tại Intel đã bị CEO Pat Gelsinger hủy bỏ...
Nhìn lại lịch sử của Intel
Năm 2013, cựu Chủ tịch kiêm CEO của Intel là Paul Otellini nghỉ hưu. Ông để lại một di sản mạnh mẽ về kiến trúc x86 cho Brian Krzanich tiếp quản. Brian, mặc dù là một cựu kỹ sư và từng giữ vị trí COO tại Intel, nhưng không đạt được nhiều thành tựu đáng chú ý. Đây cũng là thời kỳ chuyển đổi từ 14 nm sang 10 nm của Intel gặp trục trặc và kéo dài nhiều năm với 14+/14++/14+++ nm. Cannon Lake trở thành một câu chuyện hài vì không bao giờ ra mắt.
Brian Krzanich, CEO Intel 2013-2018
Tuy nhiên, Brian không phải là người không có đóng góp gì. Đây là giai đoạn mà Intel đầu tư mạnh mẽ vào việc mua lại nhiều công ty, chủ yếu trong lĩnh vực 5G, Trí tuệ Nhân tạo, xe tự lái, drone, thiết bị đeo thông minh, FPGA... Có thể nói mục tiêu của Brian là 'hãy đến những nơi chưa từng đến'. Tuy nhiên, có vẻ như số phận đã chơi ác với ông... Đến năm 2018, một vụ việc về quan hệ không rõ ràng với cấp dưới đã phát sinh. Hành động này vi phạm chính sách chống quan hệ tình ái của công ty. Một cuộc điều tra được tiến hành và Brian đã mất chức vụ CEO của Intel.
Trong chính trị có một thuật ngữ gọi là 'khoảng trống quyền lực' (power vacuum), và nó hoàn toàn phù hợp với Intel sau khi Brian rời vị trí CEO. Dù Brian có thể không thành công trong việc tạo ra những con chip 'ngon', nhưng ít nhất là Intel vẫn có một người đứng đầu. Sau Brian, không có một nhân vật nào đáng chú ý trong Ban điều hành Intel. Bob Swan, một chuyên gia tài chính chỉ biết giải quyết vấn đề liên quan đến thuế và công nợ (CFO), được bổ nhiệm 'ngồi ghế nóng' tạm thời. Sau 1 năm, Bob trở thành CEO toàn bộ công ty. Đến năm 2021, Hội đồng quản trị đã 'mời' Pat Gelsinger về làm CEO 'ngay lập tức'.
Pat Gelsinger trước khi rời Intel vào năm 2009
Raja Koduri - Trước Khi Bước Vào Đêm Đen
Raja Koduri tại Hội Nghị DevCon 2019
Nếu bạn là fan của AMD, bạn có thể nhớ rằng đó là thời điểm mà GPU của phe đỏ không còn được coi là cạnh tranh đủ mạnh với phe xanh nữa. Tuy nhiên, không thể đổ lỗi hoàn toàn cho Raja vì con đường mà Lisa đã chọn là tập trung vào CPU. Trong tầm nhìn của Lisa, mọi máy tính có thể không cần GPU (như server) nhưng CPU thì luôn cần thiết. Doanh số (theo đơn vị) của CPU luôn áp đảo GPU. Trong khi đó, AMD đang gặp khó khăn về tài chính, nên chỉ tập trung vào các sản phẩm mang lại lợi nhuận. Vì vậy, các dự án của RTG không được coi là quan trọng nữa.
Thêm vào đó, một yếu tố quan trọng khác là sự phát triển của smartphone. Trước đó, AMD và NVIDIA là hai khách hàng lớn nhất của TSMC, thường xuyên đặt hàng cho các dây chuyền sản xuất mới nhất. Nhưng khi smartphone phát triển mạnh mẽ và các công ty như Apple, Qualcomm, Huawei... cùng đặt hàng cho TSMC, AMD không còn được ưu tiên như trước. Có một giai đoạn TSMC tăng giá wafer lên rất cao, khiến NVIDIA cảm thấy bức xúc. AMD cũng không phải là ngoại lệ. Nhiều dự án GPU đã bị hủy bỏ vì chi phí sản xuất quá cao (đặc biệt là ở node 20 nm). Vì vậy, nói rằng Raja 'cùi bắp' cũng không hoàn toàn đúng vì hoàn cảnh chung không cho phép AMD chi tiêu quá nhiều tiền.
Chi phí sản xuất chip ngày càng cao khiến nhiều dự án 20 nm bị hủy bỏ
Công thần hay tội phạm?
Khi Raja rời nhà mình để tham gia Intel vào cuối năm 2017, đó là thời điểm Brian đang giữ vị trí CEO của Intel. Brian giao cho Raja nhiệm vụ tạo ra một GPU 'đỉnh cao' để cạnh tranh với AMD và NVIDIA ('hãy đến nơi chưa từng đến'). Nhưng chưa đến 1 năm sau, Brian mất chức. Lúc đó không có ai ở Intel 'đủ trình' để kiểm soát Raja nữa. Bob ban đầu là CFO, chuyên môn không phải là kỹ sư công nghệ. Và Intel lúc đó đang cần một 'hit' lớn để gây ấn tượng với giới công nghệ. Raja với các dự án như oneAPI, XPU, Ponte Vecchio tự nhiên trở thành trung tâm của sự chú ý. Bob cũng không dám can thiệp vì sợ sẽ gây ra hậu quả không mong muốn.
Mọi sự kiện công nghệ của Intel sau năm 2018 đều liên quan đến Raja
Nếu nhìn lại thời gian Raja làm việc tại Intel, có thể nói rằng hầu hết mọi điều xoay quanh dự án Ponte Vecchio. Đây là một dự án khổng lồ không chỉ về phần cứng mà còn về phần mềm. Để đảm bảo hiệu suất hoạt động của kiến trúc Xe, cần sự tối ưu trong mã code (tương tự như kiến trúc CUDA của NVIDIA). Mục tiêu của Raja là hướng đến các siêu máy tính. Thực tế, Intel đã ký hợp đồng cung cấp chip xử lý cho Aurora, một trong những siêu máy tính hàng đầu trên thế giới (mặc dù chưa hoạt động full công suất). Nếu Raja vẫn làm việc tại Intel, Ponte Vecchio sẽ còn tồn tại rất lâu.
Thiết kế của Ponte Vecchio phức tạp và tốn kém
Siêu máy tính Aurora chỉ sử dụng CPU+GPU của Intel
Tuy nhiên, dự án Ponte Vecchio quá lớn và đã bị trì hoãn nhiều lần. Với thiết kế gồm 47 chiplet, sử dụng 3 dây chuyền bán dẫn khác nhau (10 nm, 7 nm, 5 nm). Dự án bắt đầu được giới thiệu từ SC19, nhưng do ảnh hưởng của đại dịch Covid, cho đến năm 2024 này, Intel vẫn chưa cung cấp đủ chip cho Aurora. Kế hoạch ban đầu của Aurora là đạt sức mạnh 2 EFlops. Tuy nhiên, sau 5 năm, cỗ máy chỉ đạt được 1 EFlops... Trong khi đó, Frontier (dự án cạnh tranh từ AMD) đã hoàn thành từ năm 2022 và đứng đầu TOP500 từ đó đến nay. Một điểm đáng chú ý khác là Aurora tiêu tốn nhiều điện năng hơn (lên đến 70% so với Frontier), do sử dụng các tiến trình sản xuất cũ. Frontier không chỉ đứng đầu TOP500 mà còn đứng hạng 11 trên GREEN500 với hiệu suất tiêu thụ điện là 57 GFlops/Watt.
Raja 'tự hào' về việc sản xuất một số chip siêu lớn vào năm 2020
Cho đến bây giờ, dự án Aurora vẫn chưa hoàn thành
Pat Gelsinger và cuộc 'đổi máu'
Mặc dù vào năm 2019, Bob đã trở thành CEO toàn quyền, nhưng hầu hết các sự kiện công nghệ của Intel vẫn được Raja điều hành. Thực tế, hội đồng quản trị Intel vẫn đang tìm kiếm một người có khả năng lãnh đạo đủ lớn để đưa công ty đi tiếp vì Bob không phù hợp để đánh giá và dự đoán các xu hướng công nghệ, không phải là người chịu trách nhiệm.
Dự kiến Rialto Bridge sẽ thay thế Ponte Vecchio
Ban đầu Falcon Shores là XPU (CPU+GPU)
Lúc đó đã có một số thảo luận rằng Raja sẽ trở thành CEO tiếp theo của Intel. Dĩ nhiên, nếu oneAPI thực sự thành công, không ai thích hợp hơn Raja để đảm nhiệm vị trí đó. Ponte Vecchio có thể không hoàn hảo, nhưng nó là tiền đề cho các thế hệ Xe GPU tiếp theo. Sau Ponte Vecchio, Rialto Bridge là tên gọi tiếp theo được đề cập tại sự kiện ISC 2022. Tiếp theo là Falcon Shores. Chú ý rằng Falcon Shores vẫn mang nhãn hiệu XPU, cho thấy Raja vẫn ảnh hưởng đến lộ trình sản phẩm của Intel.
Các dự án do Raja đứng đầu bị hủy bỏ chỉ sau một năm
Tuy nhiên, đến tháng 3 năm sau đó, Intel bất ngờ thông báo sẽ hủy bỏ dự án Rialto Bridge. Falcon Shores sau đó chỉ còn là sản phẩm GPU (không còn là XPU). Không lâu sau đó, Raja rời Intel. Đáng chú ý là Pat đã tweet 'chia tay' với Raja cùng ngày. Mặc dù có vẻ lịch sự, nhưng có thể hiểu như một cách tỏ ý 'nhổ cỏ phải nhổ cả rễ' như câu nói của Trần Thủ Độ với Lý Huệ Tông.
Thông điệp 'chia tay lịch sự' từ Pat gửi đến Raja qua tweet
Và mới đây nhất, ServeTheHome thông tin Intel sẽ ngừng cung cấp Ponte Vecchio cho đối tác. Thay vào đó, họ tập trung vào Gaudi 2/3 (chuyên về AI hơn) và Falcon Shores (không còn là XPU) cho năm 2025. Dường như Intel đang cố gắng hoàn thành Ponte Vecchio cho Aurora, đánh dấu sự kết thúc của dự án chip siêu lớn và siêu tốn kém này.
Nếu điều này là sự thật, thì thời gian gần 6 năm của Raja tại công ty có thể xem như là một thất bại. Gần đây, có nhiều tin đồn về GPU Xe2 dành cho người dùng thông thường với tên gọi Battlemage. Một số nguồn cho thấy dự án vẫn tồn tại, trong khi khác lại cho rằng nó sẽ bị hoãn hoặc thậm chí không bao giờ được tung ra thị trường. Sự không chắc chắn này thể hiện rằng team GPU do Raja xây dựng vẫn tiếp tục làm việc theo kế hoạch ban đầu. Tuy nhiên, khi Raja ra đi, tương lai của các sản phẩm này trở nên mơ hồ. Việc Intel Arc tiếp tục tồn tại hay không phụ thuộc vào quyết định của Pat.
Tồn tại hay không, đó mới là vấn đề
Thế giới kỳ lạ của Raja?
Từ đây trở đi là nhận định cá nhân của tác giả. Bạn có thể coi như là chuyện hài hước.
Mọi nghi ngờ bắt nguồn từ việc Raja rời AMD vào một ngày và chuyển sang làm việc cho Intel vào ngày tiếp theo. Trong lĩnh vực công nghệ cao, đặc biệt là ở vị trí cao cấp, việc này gây ra nhiều câu hỏi về an ninh thông tin. Liệu Raja có chán nản với Lisa tại AMD và quyết định chuyển sang đối thủ để tìm kiếm cơ hội mới?
Lisa và Raja hồi 2017
Khi Raja chuyển sang Intel, công ty này đang gặp khó khăn với tiến trình sản xuất 10 nm. Cả Lisa và Raja, với kiến thức sâu rộng về công nghệ, đều nhận ra rằng Intel không thể cạnh tranh trong việc sản xuất GPU hàng đầu. Phần cứng của Intel đang dần mất thế trận so với Samsung và TSMC. Phần mềm cho GPU khác hoàn toàn so với CPU. Để tối ưu cho CPU, chỉ cần cập nhật trình biên dịch. Nhưng để tối ưu cho GPU, AMD và NVIDIA phải hợp tác chặt chẽ với các nhà phát triển game. Nói tóm lại, vào năm 2017, Intel chưa thực sự mạnh về GPU (mặc dù có IGP nhưng không đáng kể).
i740, chiếc card VGA duy nhất của Intel từng thời
Tuy nhiên, Ponte Vecchio là một con chip quan trọng và lớn lao, đặc biệt là nó sử dụng ba tiến trình bán dẫn khác nhau. Mặc dù có thể đổ lỗi cho Brian khi Intel mất cơ hội về công nghệ, nhưng việc thuê TSMC gia công chip với Pat có thể coi là một 'sự sỉ nhục' (Pat đã từng làm việc tại Intel dưới sự hướng dẫn của Andrew Grove, cho đến khi anh rời công ty vào năm 2009). Các dự án thuê TSMC đã bắt đầu khi Raja gia nhập Intel (bao gồm cả Meteor Lake, Lunar Lake, Panther Lake, Alchemist, Battlemage). Dễ nhận ra rằng Ponte Vecchio sẽ gặp nhiều vấn đề về thiết kế, sản xuất, kiểm tra, và nhiều vấn đề khác. Việc trì hoãn là điều dễ hiểu. Trong ngành công nghiệp công nghệ, việc trì hoãn càng nhiều thì chi phí càng lớn. Lisa và Raja hiểu điều này hơn bất cứ ai.
Ponte Vecchio còn được biết đến với tên thương mại Intel Data Center Max GPU
Cuối cùng, là cuộc 'đấu đá nội bộ' giữa các dự án chồng chéo. Dù Gaudi và Xe GPU có bản chất khác nhau (một là GPGPU, một là ASIC) nhưng cùng nhau 'cạnh tranh' trong lĩnh vực AI. Gaudi bắt nguồn từ Habana Labs, một công ty AI mà Intel đã mua lại. Trong lộ trình sản phẩm của Intel, Gaudi và Xe GPU đều nhắm tới cùng một tập khách hàng. Vậy nếu có nhu cầu mua card tăng tốc AI từ Intel, các nhà quản lý bán hàng của họ sẽ chọn Gaudi hay Xe GPU? Câu hỏi này không dễ giải quyết! Rõ ràng, 'sự cạnh tranh nội bộ' này đã gây ra nhiều sự chia rẽ. Ai từng đứng ở vị trí cao nhất sẽ hiểu điều này.
Gaudi so với Xe GPU
Dưới góc nhìn của một cựu nhân viên Intel, Pat có lẽ sẽ có nhiều nghi ngờ về những người đến từ công ty đối thủ. Và những dự án mà Raja đã 'vẽ ra' cho đến bây giờ có lẽ không đem lại lợi nhuận nhiều hơn là chi phí, thời gian, và công sức đã đầu tư.
Cá nhân tôi cho rằng nếu thương hiệu Intel Arc phát triển không như kỳ vọng, thì điều đó cũng không quá bất ngờ 😃