TikTok thu hút hàng triệu người dùng mỗi ngày, và yếu tố tạo nên sức hút này chính là thuật toán đề xuất nội dung siêu tinh vi, được cá nhân hóa đến mức khó ai có thể từ chối.
Thành công ngoạn mục của Douyin không thể thiếu sự đóng góp của thuật toán đề xuất nội dung, được xem là một trong những hệ thống hiện đại và tiên tiến nhất thế giới. Nó có khả năng phát tán các video ngắn cá nhân hóa, kéo dài gần như vô hạn, khiến người dùng không thể rời mắt khỏi màn hình.
"Công thức" đề xuất của TikTok
Trước áp lực từ các cơ quan quản lý Trung Quốc yêu cầu minh bạch hóa thuật toán vào cuối năm 2024 - đầu 2025, Douyin (phiên bản TikTok tại Trung Quốc) đã công khai việc áp dụng hai cấu trúc học máy chủ yếu.

Đầu tiên là mô hình Wide&Deep, một kiến trúc kết hợp khả năng "ghi nhớ" (memorization) các mối liên hệ trực tiếp từ lịch sử tương tác (ví dụ: người giống bạn thích video A thì bạn cũng có thể thích A) và khả năng "khái quát hóa" (generalization) để khám phá những mối liên hệ phức tạp hơn, giúp đưa ra những đề xuất video mới lạ nhưng vẫn rất phù hợp.
Thứ hai là mô hình Two-Tower Retrieval, chú trọng vào việc kết nối chính xác giữa người dùng và video bằng cách chuyển đổi các đặc điểm của cả hai thành các "dấu vân tay kỹ thuật số", từ đó tìm kiếm sự tương đồng giữa chúng.
Để xây dựng dấu vân tay người dùng (User Persona) chi tiết, thuật toán của Douyin xử lý một lượng dữ liệu cực kỳ lớn: từ các tương tác trực tiếp như lượt thích, bình luận, chia sẻ, theo dõi; các tín hiệu ngầm như thời gian xem, tỷ lệ xem hết video, lượt xem lại; thông tin video như chú thích, hashtag, âm thanh, nhãn nội dung (được phân loại trong một cấu trúc sở thích phức tạp); cùng với các cài đặt thiết bị như ngôn ngữ, vị trí, loại máy...
Quá trình phân phối nội dung được điều khiển thông qua các chiến lược như Mô hình Phễu (Funnel Model), trong đó video mới sẽ được thử nghiệm trên các nhóm người dùng nhỏ ("Data Buckets"), và chỉ những video đạt hiệu quả tương tác cao (lượt xem, lượt thích, bình luận, thời gian xem...) mới được đẩy lên các "phễu" lớn hơn để tiếp cận với nhiều người hơn.
Kỹ thuật Lọc Cộng tác (Collaborative Filtering) đóng vai trò quan trọng trong việc đề xuất nội dung, qua việc tìm kiếm sự tương đồng giữa những người dùng có cùng sở thích hoặc giữa các nội dung tương tự nhau, đồng thời khám phá các chủ đề mới tiềm năng cho người dùng.

TikTok áp dụng nhiều chiến lược thông minh để giữ chân người dùng. Ảnh: QuickFrame
TikTok và Douyin: Hai anh em song sinh nhưng khác biệt rõ rệt
Mặc dù cả hai nền tảng này có chung mã nguồn và giao diện tương tự, Douyin và TikTok lại vận hành như hai hệ sinh thái hoàn toàn độc lập, được điều chỉnh riêng biệt cho các thị trường và quy định khác nhau. Phân tích kỹ thuật chỉ ra rằng Douyin thu thập nhiều loại dữ liệu hơn TikTok (chẳng hạn như địa chỉ MAC của thiết bị) và sử dụng các dịch vụ bên thứ ba từ Trung Quốc.
Về triết lý thuật toán, Douyin đôi khi được coi như một "Nền tảng Truyền thông" (Media Platform), nơi thứ hạng có thể bị ảnh hưởng nhiều hơn bởi sự phổ biến hiện có của tài khoản, trong khi TikTok được mô tả như một "Cộng đồng", nơi các tài khoản nhỏ có thể dễ dàng lan truyền (viral) và ưu tiên nội dung theo khu vực địa lý.
Sự khác biệt này cũng thể hiện rõ qua các tính năng: Douyin tích hợp thương mại điện tử và livestream bán hàng sâu rộng hơn so với TikTok, đồng thời chịu sự kiểm soát nội dung chặt chẽ hơn theo các quy định của Trung Quốc.

Dù có sự khác biệt, nhưng về cơ bản, TikTok và Douyin là hai ứng dụng tương đồng nhau. Ảnh: The China Project
Mặt trái của thuật toán
Thuật toán TikTok có sức mạnh như con dao hai lưỡi. Cơ chế đề xuất dựa trên hành vi tương tác và sự tương đồng giúp nền tảng giữ người dùng lâu dài đến mức gây ra tình trạng “nghiện TikTok”. Tuy nhiên, chính cơ chế này cũng tiềm ẩn nguy cơ tạo ra “bong bóng lọc” (filter bubble), khi người dùng liên tục tiếp nhận các nội dung củng cố những định kiến hiện có, thay vì mở rộng tầm nhìn. Dù TikTok đã nhiều lần phủ nhận điều này, nhưng lo ngại về tính một chiều trong luồng thông tin vẫn ngày càng gia tăng.
Thậm chí, nghiên cứu chỉ ra rằng thuật toán có thể vô tình tạo ra "bất bình đẳng kỹ thuật số mới". Một thử nghiệm cho thấy những người dùng mô phỏng sử dụng điện thoại giá rẻ nhận ít đề xuất các video về sức khỏe uy tín hơn so với những người dùng mô phỏng sử dụng máy đắt tiền.
Điều này cho thấy thuật toán, khi sử dụng các yếu tố như loại thiết bị làm tín hiệu đầu vào, có thể đang phân phối thông tin quan trọng một cách không công bằng, dựa trên yếu tố kinh tế xã hội. Bên cạnh đó, việc tối ưu hóa cho tương tác cũng khiến nền tảng trở thành môi trường lý tưởng cho tin giả lan tràn, nếu những thông tin đó gây sốc và thu hút nhiều lượt xem, thích, chia sẻ hơn là các thông tin chính xác.

Thuật toán của TikTok khiến người dùng bị cuốn hút và dành nhiều thời gian hơn trên ứng dụng. Ảnh: UOC
Để đối phó với áp lực pháp lý, ByteDance đã thực hiện các bước nhằm nâng cao tính minh bạch, chẳng hạn như ra mắt trang "Trung tâm An toàn và Tin cậy" và công khai tên của các mô hình thuật toán chính. Tuy nhiên, nhiều chuyên gia cho rằng mức độ minh bạch này vẫn còn hạn chế, chỉ dừng lại ở việc mô tả cấu trúc tổng thể mà thiếu đi những chi tiết cốt lõi về cách các yếu tố được cân nhắc và dữ liệu nào được ưu tiên. Việc quản lý nội dung và ngăn chặn các hành vi thao túng thuật toán cũng là những thách thức lớn đối với một nền tảng có quy mô khổng lồ như TikTok.
Thuật toán của TikTok là một thành tựu công nghệ vượt trội, là yếu tố chính giúp nền tảng này thành công. Tuy nhiên, sức mạnh của nó cũng đi kèm với những trách nhiệm nặng nề và những hệ quả xã hội phức tạp cần phải được xem xét một cách nghiêm túc, yêu cầu sự giám sát chặt chẽ hơn và các giải pháp quản trị hiệu quả hơn trong tương lai.
Theo SCMP
