100% các mô hình hiện tại đều chỉ có thể hoạt động được nhờ được pre train từ LAION5B
Khái niệm::
LAION5B là một big data khai thác trái phép từ internet. Tất cả những mô hình gọi là “tự train”, các data center mới lập của các tập đoàn hay nhà nước đều chỉ được coi là fine tuning dựa trên đó, vì AI tạo sinh hoàn toàn ko thể hoạt động được nếu ko có big data tính đến hàng tỉ đầu data point, và Ở thời điểm hiện tại không có bất cứ ai có thể đủ tiềm lực và khối lượng dữ liệu vừa có bản quyền vừa đủ khổng lồ để tự huấn luyện
Nguồn:: createdontscrape