LAION5B là một big data khai thác trái phép
Khái niệm::
100% các mô hình hiện tại đều chỉ có thể hoạt động được nhờ được pre train từ LAION5B - là một big data khai thác trái phép từ internet. Tất cả những mô hình gọi là “tự train”, các data center mới lập của các tập đoàn hay nhà nước đều chỉ được coi là fine tuning dựa trên đó, vì AI tạo sinh hoàn toàn ko thể hoạt động được nếu ko có big data tính đến hàng tỉ đầu data point, và ở thời điểm hiện tại thì ko có bất cứ cá nhân hay tổ chức nào có thể gọi là đủ tiềm lực và khối lượng data vừa có bản quyền vừa đủ khổng lồ như vậy cả.
Nguồn:: createdontscrape