AI tạo video Sora của OpenAI sản xuất MV đầu tiên, và nó 'kỳ ảo' như mọi người tưởng
Giải thích và tổng hợp một chơi xổ số xuất hay có thể áp dụng được cho ChatGPT
Đừng nghĩ rằng hệ thống AI vô tri không biết gì, chúng có thể là lỗ hổng bảo mật đấy
“Cách tôi sử dụng trí tuệ nhân tạo để biến truyện ngắn của mình thành truyện tranh”Tiếp tục xuất hiện một công cụ dễ sử dụng hơn cho những nhà sáng tạo nội dung.
Lược dịch từ bài báo của biên tập viên kỳ cựu cho trang MIT Technology Review, anh Will Douglas Heaven.
Mười ba năm trước, khi làm bài tập về nhà môn báo chí, tôi viết một câu chuyện ngắn ngốc nghếch về một người đàn ông mê thức ăn cho mèo hạng sang. Hôm nay, tôi nhìn thấy nền tảng trí tuệ nhân tạo có tên Lore Machine đưa sự sống vào tác phẩm cũ của mình.
Tôi đưa câu chuyện của mình vào khung nhập văn bản, và nhận được thông điệp: “Chúng tôi đang xác định cảnh trí, địa điểm, nhân vật và cảm xúc. Quá trình này có thể mất tới 2 phút”. Lore Machine phân tích văn bản, trích xuất mô tả nhân vật và cảnh trí, sau đó đưa thông tin vào một mô hình trí tuệ nhân tạo sinh ảnh.
Một storyboard hiện lên trước mắt. Tôi đọc từng trang truyện tranh mô tả những nhân vật mà dường như đã quên từ lâu, tim tôi đập mạnh.
Người kể chuyện ngồi ăn sáng cùng mèo - Ảnh: Lore Machine/Will Douglas Heaven.
Sau hơn một năm phát triển, Lore Machine đã chính thức ra mắt công chúng. Với giá 10 USD mỗi tháng, bạn có thể sử dụng dịch vụ để xử lý 100.000 từ (tối đa 30.000/lần) và tạo ra 80 hình ảnh cho truyện ngắn, kịch bản, bản ghi chép nội dung podcast và nhiều hơn nữa.
Ngoài ra còn có các gói dịch vụ dành cho người dùng yêu cầu cao, với gói doanh nghiệp giá 160 USD/tháng, có thể xử lý tới 2,24 triệu từ và tạo ra được 1.792 hình ảnh. Hình minh họa có trong một loạt các phong cách được thiết lập sẵn, từ manga, màu nước cho đến chương trình truyền hình phong cách thập niên 80.
Zac Ryder, người sáng lập của công ty sáng tạo Modern Arts, đã là khách hàng trung thành của Lore Machine từ những ngày thử nghiệm đầu tiên. Ryder ấn tượng ngay từ lúc Thobey Campion, người sáng lập dự án, lần đầu tiên giới thiệu khả năng ưu việt của Lore Machine.
Ryder đã thử gửi vào hệ thống kịch bản cho một bộ phim ngắn, và chỉ sau một đêm, Lore Machine đã biến được nó thành một cuốn tiểu thuyết tranh dài 16 trang.
'Tôi nhớ Thobey đã cho mọi người xem màn hình của anh, và tất cả chúng tôi kinh ngạc tột độ', Ryder nói. 'Không chỉ về khía cạnh tạo hình ảnh của nó mà còn về khả năng dẫn truyện: từ mạch truyện đến cảm xúc nhân vật, mọi thứ đều chính xác ngay từ đầu”.
Modern Arts hiện đang sử dụng Lore Machine để phát triển một vũ trụ hư cấu cho truyện manga, một tác phẩm dựa trên kịch bản sáng tác của tác giả series Love, Death & Robots nổi tiếng trên Netflix.
Người dẫn truyện gặp ông bán hàng tạp hóa, người thích đùa về đồ ăn cho mèo - Ảnh: Lore Machine/Will Douglas Heaven.
Động cơ của Lore Machine dựa trên những thành phần quen thuộc: một mô hình ngôn ngữ lớn (LLM) quét văn bản, xác định nội dung mô tả nhân vật, địa điểm và cảm xúc của họ, điều này kết hợp với phiên bản Stable Diffusion có khả năng tạo ra hình ảnh. Nhưng điều làm Lore Machine nổi bật là sự dễ dàng trong việc sử dụng. Thao tác tải truyện lên và tải storyboard xuống chỉ mất vài cú click chuột.
Lore Machine là một minh chứng cho làn sóng công cụ mới, dễ sử dụng và ẩn chứa sức mạnh ấn tượng của các mô hình sinh hình ảnh, được kết hợp trong một giao diện web đơn giản.
'Việc cập nhật với các công cụ AI mới đòi hỏi rất nhiều công sức, và giao diện cũng như quy trình làm việc cho mỗi công cụ đều khác nhau', Ben Palmer, CEO của công ty sáng tạo nội dung New Computer Corporation, nói. 'Khả năng sử dụng một công cụ lớn với một giao diện UI nhất quán rất hấp dẫn. Tôi nghĩ đây là bến đỗ cho ngành công nghiệp [trí tuệ nhân tạo]'.
Không còn dấu vết của prompt
Lore Machine không phải là dự án đầu tiên của Campion. CEO trẻ trước đây đã có ý định xây dựng một phiên bản Wikipedia trên blockchain, nhưng sau đó anh đã chuyển hướng sang lĩnh vực AI tạo sinh khi thấy sự phấn khích của công chúng. Ban đầu, Campion đã thử sức với Midjourney để chuyển một bài thơ kinh điển trong văn học Anh thành truyện tranh.
Mặc dù kết quả cuối cùng đã thu hút sự chú ý của cộng đồng mạng, nhưng quá trình thực hiện không mấy suôn sẻ với Campion.
Bìa sách được tạo ra bởi Lore Machine - Ảnh: Lore Machine.
'Vợ tôi không thích dự án đó chút nào', Campion nói. 'Tôi thức đến tận bốn giờ sáng chỉ để cố gắng tạo ra những hình ảnh đẹp nhất có thể'. Với Midjourney, người dùng phải tạo từng ảnh một, dẫn đến việc nét vẽ không nhất quán giữa các phân cảnh khi sử dụng nhiều prompt khác nhau.
Trải nghiệm làm truyện tranh với Midjourney đã giúp Campion nhận ra rằng công nghệ cần phải thân thiện với người dùng hơn nữa. Campion không tiết lộ bí quyết giúp truyện tranh tạo ra bởi Lore Machine trở nên nhất quán hơn.
Mặc dù kết quả cuối cùng của tôi khá tốt, nhưng không hoàn hảo: có một phân cảnh nhân vật tóc ngắn tự nhiên lại mọc thêm tóc mái, và có một phân cảnh mà nhân vật xuất hiện hai lần.
Bản dựng do Lore Machine tạo ra. Mô hình AI sẽ chọn ra cảnh và nội dung từ câu chuyện, đưa ra prompt mô tả để AI vẽ - Ảnh: Lore Machine/Will Douglas Heaven.
Nét vẽ dần trở nên lờ mờ và không rõ ràng. Tôi cảm thấy thất vọng khi thấy một nhân vật được miêu tả là “có răng như đậu cúc”, một nhân vật có “tay trắng như bánh mì ngâm chất tẩy” không được thể hiện rõ ràng. Tuy nhiên, so với việc phải làm từng khung truyện một cách thủ công, Lore Machine thực sự là một bước tiến lớn.
“Khả năng nhất quán đáng kinh ngạc”, Zac Ryder nhận định. Công ty Modern Arts của Ryder đã sử dụng Lore Machine để bán hàng cho khách, và anh ấy thực sự ấn tượng khi thấy Lore Machine có khả năng tạo ra những hình ảnh nhất quán như vậy.
“Nếu chúng tôi phải tự chỉnh sửa để hình ảnh trở nên nhất quán, chắc chắn chúng tôi sẽ không thể hoàn thành dự án đúng hẹn cho khách hàng”, Ryder nói.
Giống như tất cả các mô hình AI tạo sinh khác, công nghệ đằng sau Lore Machine có thể tạo ra nội dung có hại nếu được yêu cầu. Tuy nhiên, Campion đã ngăn chặn việc tạo ra nội dung bạo lực hoặc thù địch. Anh ấy cũng không muốn hạn chế sự sáng tạo của người dùng, cho phép họ tạo ra hình ảnh minh họa giống với người nổi tiếng để sử dụng trong truyện tranh của mình.
Trong giai đoạn đầu, Lore Machine thu hút sự chú ý từ các công ty tiếp thị. Tuy nhiên, Campion hy vọng rằng việc công khai sử dụng sẽ thu hút được nhiều người dùng hơn so với việc thử nghiệm nó.
Sáu tháng trước, anh ấy nói, anh ấy đã nhận được một cuộc gọi từ hiệu trưởng của một trường học ở Manhattan dành cho trẻ em khó học. Hiệu trưởng muốn Lore Machine đọc sách giáo khoa và tạo ra hình ảnh để giúp các em nhỏ học tập dễ dàng hơn.
'Tôi thậm chí chưa bao giờ nghĩ đến điều đó. Tôi đã bị mắc kẹt quá nhiều trong tư duy Hollywood'