Dù không nổi bật như người khác, nhưng đây chính là bộ não đứng sau tham vọng xây dựng trí tuệ nhân tạo tổng quát AGI của OpenAI.
Trong khi Sam Altman là cái tên được biết đến rộng rãi với vai trò CEO của OpenAI, một nhân vật quan trọng khác lại âm thầm điều hành công tác nghiên cứu tại công ty đang dẫn đầu trong cuộc đua trí tuệ nhân tạo toàn cầu. Mark Chen, với vẻ ngoài năng động, áo phông đen và quần jeans, là người đứng sau những đột phá quan trọng nhất của OpenAI trong hành trình hướng tới AGI.
Trong vai trò Giám đốc Nghiên cứu, Chen hiện đang dẫn dắt phát triển mô hình và điều phối tất cả nỗ lực nghiên cứu tại OpenAI, công ty tư nhân có giá trị lớn thứ hai trên thế giới. Đây là một công việc không hề nhỏ khi xét đến quy mô hoạt động của OpenAI: công ty đã thu hút được 57,9 tỷ USD đầu tư và có hơn 400 triệu người dùng sản phẩm hàng tuần.
Chen là người đứng sau nhiều bước đột phá công nghệ lớn của OpenAI. Ông đã dẫn dắt việc phát triển o1 – một loạt mô hình lập luận được huấn luyện để giải quyết những câu hỏi phức tạp hơn so với các mô hình trước đó. Ngoài ra, ông còn chỉ đạo các nhóm phát triển mô hình text-to-image Dall-E và tích hợp khả năng nhận thức hình ảnh vào GPT-4, giúp AI có thể hiểu và xử lý hình ảnh cũng như video.

Mark Chen, người dẫn dắt tham vọng AGI của OpenAI
Đối với Chen, con đường dẫn đến vị trí hiện tại hoàn toàn không được lên kế hoạch từ trước. Ban đầu, sau khi được đào tạo tại Đài Loan và Hoa Kỳ, ông dự định trở thành giáo sư. Sau khi tốt nghiệp MIT với bằng kép về toán học và khoa học máy tính, Chen đã định theo đuổi con đường tiến sĩ. Tuy nhiên, ông đã thay đổi hướng đi khi người giáo sư mà ông dự định làm việc cùng đã thành lập một quỹ đầu cơ, và Chen quyết định gia nhập công ty này.
Chen đã dành sáu năm tiếp theo trong ngành tài chính, một công việc mà ông mô tả là "đáp ứng được một số khía cạnh, nhưng cũng thiếu thỏa mãn ở một số khía cạnh khác." "Khi bạn làm việc trong lĩnh vực như giao dịch tần suất cao, bạn phải cạnh tranh với một nhóm đối thủ duy nhất, mọi người đều trở nên nhanh hơn, nhưng bạn không thật sự cảm thấy mình đang thay đổi thế giới," ông chia sẻ.
Cuối cùng, Chen cảm thấy thất vọng với ngành tài chính, ngay khi một số bước tiến quan trọng trong lĩnh vực AI đang diễn ra. Năm 2016, AlphaGo của Google đã đánh bại kỳ thủ đẳng cấp Lee Sae-dol trong một trận cờ vây lịch sử, với một màn trình diễn ngang tầm con người, khiến ngay cả những chuyên gia AI cũng phải kinh ngạc.
Lấy cảm hứng từ AlphaGo, Chen đã cố gắng sao chép hệ thống này bằng cách triển khai một mạng Deep-Q, một hệ thống học máy dạy máy tính cách chơi nhiều trò chơi khác nhau. Chính điều này đã khiến ông "thực sự đắm chìm" trong lĩnh vực machine learning, và từ đó Chen đã "may mắn" gia nhập OpenAI thông qua chương trình cư trú của công ty, dù ông không có bằng tiến sĩ.

Mark Chen và nhà đồng sáng lập kiêm CEO Sam Altman của OpenAI
Hiện tại, Chen đang cùng OpenAI hướng tới AGI - được coi là "chén thánh" của AI. Công ty theo dõi tiến trình này thông qua một khung năm cấp độ, với cấp độ đầu tiên là các tác nhân hội thoại như . "Khi chúng tôi nói đến AGI, chúng tôi áp dụng một định nghĩa rộng - không chỉ là , mà còn là và những sản phẩm khác," Chen giải thích. Ông lấy các sản phẩm AI tác nhân của công ty làm ví dụ.
Chen cho biết phần lớn công việc của ông với tư cách là giám đốc nghiên cứu là phân bổ tài nguyên máy tính cho tất cả các dự án của OpenAI - tức là cân bằng giữa việc phát hành sản phẩm ngay lập tức và nghiên cứu dài hạn nhằm thúc đẩy thế hệ sản phẩm tiếp theo. Ông cũng chia sẻ rằng trong việc lựa chọn giữa ưu tiên nghiên cứu hay phát hành thương mại, "chúng tôi luôn duy trì cách tiếp cận cho rằng cả hai đều quan trọng - bạn không thể chỉ làm một mà thiếu cái kia, và chúng được phân bổ nguồn lực gần như đồng đều."
Trong công việc hàng ngày, Chen làm việc chặt chẽ với Sam Altman. Cả hai có một "tình bạn sâu sắc" nơi họ có thể thảo luận về AI và nhiều vấn đề khác, đồng thời có thể "rất dễ bị tổn thương", thẳng thắn và trung thực với nhau. "Anh ấy là người hiểu sâu về kỹ thuật - và bạn không thể nói điều đó về tất cả các nhà sáng lập," Chen nhấn mạnh. Trong khi Altman đưa ra "tầm nhìn đầy tham vọng", Chen coi mình là người giúp hiện thực hóa và thực thi tầm nhìn đó, đồng thời "đương nhiên, cũng phản biện khi tôi cảm thấy, 'Này, đây là cách tôi sẽ phát triển một số hướng nhất định'."

Mối quan hệ hợp tác này đã mang lại những thành quả đáng kinh ngạc. Một trong những bước tiến mới nhất là sự ra mắt của Operator vào tháng 1, một tác nhân AI có khả năng thực hiện các công việc như điền mẫu và đặt hàng tạp hóa một cách độc lập, theo các hướng dẫn tùy chỉnh. AI có tính tác nhân, nói chung là những tác nhân có thể hành động tự chủ, thực hiện các nhiệm vụ phức tạp và đưa ra quyết định - đây là bước thứ ba trong lộ trình của OpenAI.
Deep Research và Operator, hai sản phẩm AI có tính tác nhân mà OpenAI đã phát hành, vẫn chỉ đang ở giai đoạn đầu của tiềm năng đầy đủ. Chen tiết lộ rằng công ty sẽ tăng cường phát triển AI có tính tác nhân trong năm nay. Phiên bản hiện tại của Operator có thể thực hiện một loạt tác vụ lặp đi lặp lại có "độ phức tạp trung bình", nhưng vẫn còn nhiều cơ hội cải thiện. "Tốc độ có thể nhanh hơn," ông nói. "Quỹ đạo có thể dài hơn."
Đối với việc áp dụng rộng rãi hơn, Chen thừa nhận rằng mục tiêu là nhanh chóng mở rộng tiện ích và khả năng tiếp cận các sản phẩm của OpenAI đến toàn cầu, nhưng công ty đang "bị giới hạn bởi năng lực." "Chúng tôi phải đưa ra những quyết định khó khăn," ông nói thêm. Chen gợi ý rằng việc triển khai rộng rãi Operator sẽ diễn ra song song với việc mở rộng năng lực điện toán của công ty và khi các mô hình của họ có thể vận hành "hiệu quả hơn."

Sự xuất hiện của DeepSeek và các đối thủ khác không làm Chen lo ngại về mục tiêu của OpenAI
Chen cũng tiết lộ rằng mô hình lập luận của OpenAI được huấn luyện với "ít dữ liệu hơn rất nhiều" so với các mô hình trước đó, nhưng với nhiều sức mạnh điện toán được áp dụng trong quá trình kiểm tra. Điều này có nghĩa là thuật toán có "hiệu quả ở cốt lõi."
Dù đối mặt với sự cạnh tranh ngày càng gia tăng từ các mô hình như DeepSeek của Trung Quốc và Gemini 2.5 của Google, Chen vẫn tỏ ra điềm tĩnh. "Tôi thực sự nghĩ rằng mối nguy hiểm lớn nhất khi làm việc trong lĩnh vực AI là phản ứng thái quá," ông chia sẻ. Công ty có một lộ trình rõ ràng mà họ tin tưởng sẽ giúp họ duy trì định hướng và thực hiện mục tiêu, ngay cả trong bối cảnh ồn ào xung quanh.
Về vấn đề an toàn, Chen chỉ ra rằng khi các mô hình thực hiện công việc tự động trong thời gian dài hơn, nguy cơ các lỗi lập luận nhỏ có thể tích lũy qua từng bước sẽ ngày càng lớn. Các mô hình AI có thể đánh lừa người dùng - hoặc thậm chí là chính chúng - khi giải quyết những vấn đề vô cùng phức tạp. Người dùng cần phải tin tưởng rằng câu trả lời họ nhận được là chính xác, ông nhấn mạnh.
Một trong những giải pháp mà OpenAI đang áp dụng để giải quyết vấn đề này, theo ông, là thông qua chương trình nghiên cứu alignment. Công ty đang sử dụng các mô hình lập luận để kiểm tra xem các mô hình có trung thành với dữ liệu đầu vào hoặc quá trình lập luận của chúng khi tạo ra đầu ra, đồng thời đánh giá xem logic của chúng có nhất quán hay không.
Nguyễn Hải (Theo TechAsia)
