Корпорація Meta опинилася в епіцентрі гучного скандалу: судові документи свідчать про масове використання піратського контенту для тренування AI. Замість легальних баз даних компанія, начебто, обрала шлях цифрового піратства, завантажуючи десятки тисяч книг із "тіньових" бібліотек. Але найцікавіше – внутрішнє листування співробітників, де вони відверто обговорюють сумнівні методи.
За даними судових матеріалів, Meta викачала 81.7 ТБ даних із таких джерел:
Це еквівалент 25 мільйонам книг у PDF-форматі. Для порівняння: найбільша у світі Бібліотека Конгресу США містить "лише" 17 мільйонів одиниць зберігання.
Ще у жовтні 2022 року старший дослідник AI у Meta писав колегам: "Використання піратських матеріалів має бути за межами нашого етичного порога". Але вже через 3 місяці Марк Цукерберг особисто схвалив продовження робіт, заявивши на нараді: "Нам потрібно знайти спосіб розблокувати це".
Цікавий факт: співробітники використовували корпоративні ноутбуки для торентінгу, жартуючи в листуванні: "Завантажувати піратський контент з офісного комп’ютера – це як їсти попкорн у кінотеатрі через гучномовці".