Ngay sau khi tạo nên làn sóng trong giới công nghệ, tool AI mang tên Milla Jovovich lập tức bị cộng đồng lập trình viên nghi ngờ về độ xác thực và tính minh bạch của dự án.
Cộng đồng công nghệ vừa xôn xao khi Milla Jovovich - nữ diễn viên nổi tiếng trong Resident Evil - công bố hệ thống bộ nhớ AI mang tên MemPalace, được cho là đạt 100% trên các benchmark chuẩn, vượt qua mọi đối thủ trả phí trên thị trường. Repo GitHub nhanh chóng chạm mốc gần 10.000 stars chỉ sau 12 giờ.
Ben Sigman, người bạn của Milla Jovovich, đã đăng tải trên mạng xã hội rằng: "Bạn tôi Milla Jovovich và tôi đã mất nhiều tháng để xây dựng một hệ thống bộ nhớ AI với Claude. Nó vừa đạt điểm hoàn hảo trên benchmark chuẩn - vượt qua mọi sản phẩm cùng lĩnh vực, dù miễn phí hay trả phí."
Anh cũng cho biết MemPalace đạt 100% trên LongMemEval (mốc hoàn hảo đầu tiên từng được ghi nhận), 92,9% trên ConvoMem (cao gấp đôi Mem0), và 100% trên LoCoMo. Tất cả đều miễn phí, chạy local, không cần API key, không phụ thuộc cloud, phát hành theo giấy phép MIT mã nguồn mở.

Kho mã nguồn MemPalace trên GitHub được gắn với tên diễn viên Milla Jovovich
Phần chìm của tảng băng
Câu chuyện ban đầu nghe rất hoàn hảo — một nữ diễn viên Hollywood đam mê công nghệ, dành hàng tháng trời lập trình cùng AI để tạo ra một sản phẩm vượt trội. Tuy nhiên, Aimar Haddadi, người có kinh nghiệm trong lĩnh vực AI, đã lập tức cảm thấy có điều gì đó bất thường.
Anh viết: "Tôi có thể nhận ra kẻ lừa đảo từ xa. Ben là một founder crypto trên nền tảng cho vay Bitcoin khá kỳ lạ nào đó, tôi khá chắc anh ta không hiểu nhiều về AI hay hệ thống bộ nhớ." Khi kiểm tra GitHub của Ben, anh phát hiện 80% repository liên quan đến Bitcoin, chỉ có một dự án AI duy nhất được fork vào năm 2024. "Website của anh ta nói anh ta thích xây dựng sản phẩm AI và huấn luyện mô hình local? Nghe cũng hợp lý đấy."
Điểm khiến nhiều người nghi ngờ nhất là repo MemPalace có tới 10.000 star và hơn 1.000 fork, nhưng lại chỉ có… 7 commit. Không có dấu vết phát triển rõ ràng, không có lịch sử git author, và cũng không có tài khoản nào thực sự gắn với người viết code.

Dự án này ngay lập tức trở thành tâm điểm nghi vấn của cộng đồng công nghệ
Tài khoản đăng tải repo gốc mang tên "aya-thekeeper/mempal" đã bị xóa ngay sau khi dự án được công khai. Trong file benchmark, Aimar phát hiện dòng ghi chú: "Written by Lu (DTL) --- March 24, 2026. For: Ben." Lu là người viết code và benchmark, nhưng lại không xuất hiện trong README hay lịch sử GitHub.
"Lịch sử git sau đó bị nén thành một commit duy nhất rồi đăng dưới tên Milla Jovovich? Thật sao? Một diễn viên?" Aimar tiếp tục đặt câu hỏi. "Họ nói cô ấy là bạn thân, cùng tham gia xây dựng dự án, làm việc ban đêm. Nhưng cô ấy chỉ có… 7 commit và chỉ hoạt động 2 ngày trong toàn bộ lịch sử GitHub?"
Với một dự án được mô tả phức tạp như vậy, việc chỉ có 7 commit rõ ràng là quá ít so với mức độ công việc mà nó được cho là đã thực hiện.
Các dấu hiệu nghiêm trọng
Nhưng đó chỉ là lớp vỏ ban đầu. Khi cộng đồng kỹ thuật bắt đầu rà soát các benchmark, họ phát hiện ra nhiều dấu hiệu gian lận đáng lo ngại. Issue #29 trên GitHub do dial481 mở đã lần lượt bóc tách từng lớp vấn đề:
Trước tiên, ở bài kiểm tra LoCoMo, một số lập trình viên cho rằng kết quả 100% không phản ánh đúng năng lực thực tế của hệ thống. Nguyên nhân là cách cấu hình khiến việc “tìm kiếm thông tin” trở nên quá đơn giản.

Khi đào sâu vào dự án, cộng đồng bắt đầu phát hiện hàng loạt điểm bất thường
Cụ thể, thay vì phải chọn lọc vài đoạn liên quan nhất trong hàng chục đoạn hội thoại, hệ thống lại nạp gần như toàn bộ dữ liệu để xử lý. Nói cách khác, thay vì “truy tìm đúng thông tin giữa một biển dữ liệu”, nó giống như “đưa toàn bộ dữ liệu cho AI đọc rồi tự rút ra câu trả lời”. Trong bối cảnh đó, việc đạt điểm tuyệt đối không còn quá khó hiểu.
Chưa dừng lại ở đó, bản thân bộ dữ liệu LoCoMo cũng bị cho là tồn tại một số câu hỏi chưa chuẩn xác hoặc dễ gây hiểu nhầm. Vì vậy, nhiều người nhận định rằng ngay cả trong điều kiện lý tưởng, việc đạt 100% cũng rất khó xảy ra. Khi một hệ thống đạt mức này, cộng đồng thường đặt câu hỏi về cách chấm điểm thay vì xem đó là đột phá.
Thực tế, nếu nhìn vào các con số khác được nêu trong tài liệu của dự án, hiệu năng ở những phương pháp đánh giá “nghiêm ngặt” hơn chỉ dao động khoảng 60% đến gần 90%. Điều này khiến một số ý kiến cho rằng việc nhấn mạnh con số 100% có thể gây hiểu lầm cho người đọc.
Với bài kiểm tra LongMemEval, vấn đề lại nằm ở cách hệ thống được tinh chỉnh. Trong tài liệu dự án có thừa nhận rằng một số thay đổi được thiết kế nhằm xử lý chính xác các câu hỏi mà hệ thống từng trả lời sai trước đó.
Nói cách khác, thay vì cải thiện toàn diện năng lực, hệ thống lại được “tối ưu riêng” để vượt qua một số câu hỏi cụ thể. Cách làm này có thể giúp điểm số tăng cao trong bài test, nhưng không đảm bảo hiệu quả trong các tình huống thực tế khác.

Bài đăng của Ben Sigman ca ngợi dự án này
Ngoài câu chuyện về kết quả, quá trình phát triển dự án cũng gây ra nhiều nghi vấn. Một số người dùng phát hiện toàn bộ hệ thống dường như được đẩy lên GitHub chỉ trong thời gian rất ngắn, khoảng hơn 20 phút, bao gồm kiến trúc, dữ liệu và cả bộ kiểm thử. Trong khi đó, các dự án AI tương tự thường cần hàng tuần hoặc hàng tháng và có lịch sử commit rất chi tiết.
Bên cạnh đó, Jennifer Pearl, tác giả của Sara Brain - một hệ thống bộ nhớ AI khác - đã mở Issue #104, cho rằng MemPalace có kiến trúc gần như trùng khớp với Sara Brain, một dự án được công bố trước đó.
Những điểm tương đồng bao gồm cách lưu trữ dữ liệu, cách tổ chức thông tin, và cách AI được dùng như một “công cụ hỗ trợ” thay vì đóng vai trò bộ não chính. Dù chưa thể khẳng định có sao chép, nhưng thời điểm xuất hiện của hai dự án khá sát nhau khiến cộng đồng tiếp tục đặt câu hỏi.
Ben Sigman sau đó phản hồi: "Rất tuyệt! Điều đó không phải cố ý và chúng tôi không quen thuộc với công việc của bạn... như raynet đã đề cập - tất cả các công cụ này đều rất phổ biến. Công việc lâu đời nhất của chúng tôi về “mempal” có từ tháng 11/2025... chúng tôi có repo riêng với lịch sử commit dài nhưng chúng chứa nhiều PII nên chúng tôi chọn repo mới sạch để phát hành." Sau đó anh ta đóng issue ngay.
