5 điều cần biết về xu hướng mới nổi trong lĩnh vực AI: các mô hình nền tảng

Buzz

Ngày cập nhật gần nhất: 15/6/2026

Nội dung bài viết

1. Foundation models là gì?

2. Làm thế nào chúng hoạt động?

3. Truy cập bị hạn chế - tạm thời

4. Những mô hình này sẽ ý nghĩa gì đối với các ngành nghệ 'sáng tạo'?

5. Điều này có nghĩa gì đối với bằng chứng pháp lý, tin tức và truyền thông

Đến lúc chuẩn bị

Xem thêm

Đọc tóm tắt

- Các mô hình nền tảng trong AI, như DALL-E và GPT, sử dụng hệ thống huấn luyện lớn để xử lý dữ liệu tổng quát và tạo ra công việc sáng tạo.
- Các mô hình này hoạt động dựa trên mạng nơ-ron sâu, có khả năng nhận diện và tạo ra các kiểu mẫu từ hàng triệu ví dụ.
- Quy mô và chi phí đào tạo các mô hình này rất lớn, chỉ các công ty công nghệ lớn mới có thể thực hiện và kiểm soát việc sử dụng.
- Mô hình nền tảng có thể ảnh hưởng đến ngành sáng tạo và chuyên nghiệp, cung cấp giải pháp giá rẻ và hiệu quả cho các công việc sáng tạo.
- Chúng cũng đặt ra thách thức cho luật lệ và thông tin sai lệch, cần được theo dõi và nghiên cứu kỹ lưỡng.

5 điều cần biết về xu hướng mới nổi trong lĩnh vực AI: các mô hình nền tảng

Nếu bạn đã nhìn thấy những bức ảnh về một ấm trà hình cà chua hoặc đọc một bài viết viết rất hay nhưng lạc lõng theo hướng hơi kỳ cục, có thể bạn đã tiếp xúc với một xu hướng mới trong trí tuệ nhân tạo (AI).

Các hệ thống máy học như DALL-E, GPT và PaLM đang làm nổi bật bằng khả năng tuyệt vời của họ trong việc tạo ra công việc sáng tạo.

Các hệ thống này được biết đến là “các mô hình nền tảng” và không chỉ là sự sốt sảy và các màn ảo thuật. Vậy cách tiếp cận mới này của AI hoạt động như thế nào? Và liệu nó có làm kết thúc sự sáng tạo của con người và mở đầu cho một cơn ác mộng về deep-fake không?

1. Foundation models là gì?

Các mô hình nền tảng hoạt động bằng cách huấn luyện một hệ thống lớn duy nhất trên lượng lớn dữ liệu tổng quát, sau đó điều chỉnh hệ thống đó cho các vấn đề mới. Các mô hình trước đó thì thường bắt đầu từ đầu cho mỗi vấn đề mới.

TNW Conference 2024 - Kêu gọi tất cả các Startups tham gia vào ngày 20-21 tháng 6

Trình diễn startup của bạn trước các nhà đầu tư, những người thay đổi và khách hàng tiềm năng với các gói Startup được chọn lọc của chúng tôi.

ĐĂNG KÝ NGAY BÂY GIỜ

Ví dụ, DALL-E 2 được đào tạo để phù hợp với các hình ảnh (như là một bức ảnh về chú mèo thú cưng) với phần mô tả ("Mr. Fuzzyboots, chú mèo tam thể, đang thư giãn dưới ánh nắng mặt trời") bằng cách quét hàng trăm triệu ví dụ. Một khi được đào tạo, mô hình này biết những thứ như mèo (và những thứ khác) trông như thế nào trong hình ảnh.

Nhưng mô hình cũng có thể được sử dụng cho nhiều nhiệm vụ trí tuệ nhân tạo khác thú vị, như tạo ra hình ảnh mới chỉ từ một phần mô tả ("Cho tôi xem một chú koala đang ghi bàn bóng rổ") hoặc chỉnh sửa hình ảnh dựa trên hướng dẫn bằng văn bản ("Làm cho nó trông giống như chú khỉ này đang nộp thuế").

2. Làm thế nào chúng hoạt động?

Các mô hình nền tảng chạy trên “mạng nơ-ron sâu”, được lấy cảm hứng từ cách não hoạt động. Chúng bao gồm toán học phức tạp và một lượng lớn sức mạnh tính toán, nhưng chúng có thể rút gọn thành một loại kiểu mẫu rất tinh vi.

Ví dụ, bằng cách nhìn vào hàng triệu hình ảnh mẫu, một mạng nơ-ron sâu có thể liên kết từng từ với các kiểu mẫu của pixel xuất hiện thường xuyên trong hình ảnh của đối tượng đó - như những hòn đậu mềm mại, mịn màng, lông lẻo. Càng nhiều ví dụ mô hình nhìn thấy (càng nhiều dữ liệu nó được hiển thị), và càng lớn mô hình (càng nhiều “lớp” hoặc “độ sâu” nó có), thì mẫu và sự tương quan này càng phức tạp.

Mô hình nền tảng, ở một khía cạnh, chỉ là một sự mở rộng của mô hình “học sâu” đã thống trị nghiên cứu trí tuệ nhân tạo trong thập kỷ qua. Tuy nhiên, chúng thể hiện những hành vi tự nhiên hoặc “phát sinh” có thể vừa làm ngạc nhiên vừa mới lạ.

Ví dụ, mô hình ngôn ngữ PaLM của Google dường như có thể tạo ra giải thích cho các tập tục phức tạp và trò đùa. Điều này vượt ra khỏi việc đơn giản bắt chước các loại dữ liệu mà nó được đào tạo ban đầu để xử lý.

The PaLM language model can answer complicated questions. Image: Google AI

3. Truy cập bị hạn chế - tạm thời

Quy mô khổng lồ của những hệ thống trí tuệ nhân tạo này là khó tưởng tượng. PaLM có 540 tỷ tham số, có nghĩa là ngay cả khi mọi người trên hành tinh này ghi nhớ 50 số, chúng ta vẫn không đủ không gian lưu trữ để tái tạo mô hình.

Những mô hình này quá to lớn nên việc đào tạo chúng đòi hỏi lượng lớn tài nguyên tính toán và các nguồn lực khác. Một ước lượng đặt chi phí đào tạo mô hình ngôn ngữ GPT-3 của OpenAI khoảng 5 triệu đô la Mỹ.

Do đó, chỉ có các công ty công nghệ lớn như OpenAI, Google và Baidu mới có khả năng xây dựng các mô hình nền tảng hiện tại. Những công ty này giới hạn ai có thể truy cập vào các hệ thống, điều này là hợp lý về mặt kinh tế.

Các hạn chế về việc sử dụng có thể mang lại sự an tâm cho chúng ta rằng những hệ thống này sẽ không sớm được sử dụng cho các mục đích đen tối (như tạo tin giả mạo hoặc nội dung bôi nhọ) trong thời gian ngắn. Nhưng điều này cũng có nghĩa là các nhà nghiên cứu độc lập không thể thẩm vấn những hệ thống này và chia sẻ kết quả một cách mở và có trách nhiệm. Vì vậy, chúng ta vẫn chưa biết đầy đủ tác động của việc sử dụng chúng.

4. Những mô hình này sẽ ý nghĩa gì đối với các ngành nghệ 'sáng tạo'?

Các mô hình nền tảng sẽ được sản xuất nhiều hơn trong những năm tới. Các mô hình nhỏ hơn đã được xuất bản dưới dạng nguồn mở, các công ty công nghệ đang bắt đầu thử nghiệm với việc cấp phép và thương mại hóa những công cụ này và các nhà nghiên cứu trí tuệ nhân tạo đang nỗ lực làm cho công nghệ trở nên hiệu quả và tiện lợi hơn.

Sự sáng tạo đáng kinh ngạc được thể hiện bởi các mô hình như PaLM và DALL-E 2 chứng minh rằng các công việc chuyên nghiệp sáng tạo có thể bị ảnh hưởng bởi công nghệ này sớm hơn so với dự kiến ban đầu.

Tri thức truyền thống luôn nói rằng robot sẽ đẩy lùi công việc 'màu xanh lá cây' trước. Công việc 'màu trắng' được cho là tương đối an toàn khỏi tự động hóa - đặc biệt là công việc chuyên nghiệp yêu cầu sự sáng tạo và đào tạo.

Mô hình trí tuệ nhân tạo học sâu đã thể hiện độ chính xác vượt trội hơn con người trong các nhiệm vụ như đánh giá tia X và phát hiện bệnh mạch vàng. Các mô hình nền tảng có thể sớm cung cấp sự sáng tạo giá rẻ, 'đủ tốt' trong lĩnh vực quảng cáo, viết quảng cáo, hình ảnh chứng khoán hoặc thiết kế đồ họa.

Tương lai của công việc chuyên nghiệp và sáng tạo có thể trông có chút khác biệt so với những gì chúng ta mong đợi.

5. Điều này có nghĩa gì đối với bằng chứng pháp lý, tin tức và truyền thông

Các mô hình nền tảng sẽ không thể tránh khỏi việc ảnh hưởng đến luật lệ trong các lĩnh vực như sở hữu trí tuệ và bằng chứng, vì chúng ta sẽ không thể giả định rằng nội dung sáng tạo là kết quả của hoạt động của con người.

Chúng ta cũng sẽ phải đối mặt với thách thức từ tin đồn và thông tin sai lệch được tạo ra bởi những hệ thống này. Chúng ta đã phải đối mặt với vấn đề lớn với tin đồn, như chúng ta thấy trong cuộc xâm lược của Nga vào Ukraine và vấn đề mới nảy sinh của ảnh và video deep fake, nhưng các mô hình nền tảng đang chuẩn bị nâng cấp mạnh mẽ các thách thức này.

Đến lúc chuẩn bị

Là những nhà nghiên cứu nghiên cứu về tác động của trí tuệ nhân tạo đối với xã hội, chúng tôi nghĩ rằng các mô hình nền tảng sẽ mang lại những biến đổi lớn. Chúng được kiểm soát chặt chẽ (tạm thời), vì vậy chúng ta có thời gian một chút để hiểu rõ về những ảnh hưởng của chúng trước khi chúng trở thành một vấn đề lớn.

Bài viết này được đăng lại từ The Conversation dưới giấy phép Creative Commons. Đọc bài viết gốc.

Các câu hỏi thường gặp

Mô hình nền tảng trong trí tuệ nhân tạo là gì?

Mô hình nền tảng là hệ thống máy học được huấn luyện trên lượng dữ liệu lớn và tổng quát, sau đó có thể điều chỉnh cho nhiều nhiệm vụ cụ thể khác nhau, giúp cải thiện hiệu suất và tính sáng tạo.

Các mô hình nền tảng hoạt động như thế nào trong thực tế?

Các mô hình nền tảng sử dụng mạng nơ-ron sâu để phân tích dữ liệu và rút ra mẫu. Chúng học từ hàng triệu ví dụ để liên kết từ với hình ảnh và nội dung, tạo ra kết quả tự nhiên và phong phú.

Tại sao việc truy cập vào các mô hình nền tảng bị hạn chế?

Việc truy cập vào các mô hình nền tảng bị hạn chế do chi phí đào tạo rất cao, đòi hỏi nhiều tài nguyên tính toán. Chỉ có các công ty công nghệ lớn mới đủ khả năng phát triển và duy trì các mô hình này.

Mô hình nền tảng có ảnh hưởng đến ngành công nghiệp sáng tạo hay không?

Có, mô hình nền tảng sẽ tác động lớn đến ngành sáng tạo, có khả năng cung cấp các sản phẩm và dịch vụ sáng tạo giá rẻ, ảnh hưởng đến công việc trong quảng cáo, thiết kế và viết lách.

Tác động của mô hình nền tảng đối với tin tức và thông tin sai lệch là gì?

Mô hình nền tảng có thể làm gia tăng thông tin sai lệch và thách thức sở hữu trí tuệ, vì chúng có khả năng tạo ra nội dung giống như con người, làm khó xác định nguồn gốc và tính xác thực của thông tin.

Nội dung từ Mytour nhằm chăm sóc khách hàng và khuyến khích du lịch, chúng tôi không chịu trách nhiệm và không áp dụng cho mục đích khác.

Nếu bài viết sai sót hoặc không phù hợp, vui lòng liên hệ qua Zalo: 0978812412 hoặc Email: [email protected]