Sztuczna inteligencja wymaga ogromnych zasobów obliczeniowych oraz dostępu do dużych zbiorów danych treningowych. Niestety, nie zawsze dane te są pozyskiwane w sposób etyczny i zgodny z prawem. Firma Meta, właściciel Facebooka, Instagramu i WhatsAppa, znalazła się w centrum kontrowersji po ujawnieniu informacji o wykorzystaniu nielegalnie pobranych książek do szkolenia swoich modeli AI. Sprawa nabrała rozgłosu, ponieważ amerykańskie sądy zajęły się już oficjalnie tymi zarzutami.
Gigabajty nielegalnych danych
Z dokumentów ujawnionych w toku postępowania sądowego wynika, że w latach 2022-2024 pracownicy Meta pobrali za pośrednictwem sieci torrent aż 81,7 TB danych. Wśród nich znalazły się między innymi cyfrowe wersje książek udostępniane na stronach takich jak Anna’s Archive, Z-Library oraz LibGen. Źródła te od lat są znane jako repozytoria treści naruszających prawa autorskie.
Według dostępnych informacji, w firmie panowały podzielone opinie na temat legalności tego procederu. Niektórzy pracownicy zgłaszali wewnętrzne zastrzeżenia co do moralności takich działań i sugerowali, że przekraczają one obowiązujące standardy etyczne. Wskazywali również, że wykorzystanie treści objętych prawem autorskim może narazić Meta na poważne konsekwencje prawne. Pomimo tego, proceder trwał, a firma rozważała sposoby jego dalszego kontynuowania.
Rola kierownictwa i zabezpieczenia
Opublikowane dokumenty wskazują, że w styczniu 2023 roku Mark Zuckerberg osobiście brał udział w spotkaniu dotyczącym przyszłych kierunków rozwoju sztucznej inteligencji w firmie. Podczas tego spotkania miał wyrazić chęć przyspieszenia procesu treningu modeli AI, co mogło obejmować również kwestię pozyskiwania dodatkowych zasobów danych. W kwietniu 2023 roku pojawiły się natomiast wewnętrzne rozmowy na temat stosowania VPN do ukrycia adresów IP firmy w trakcie pobierania danych, co mogło wskazywać na próbę zatajenia działań przed organami ścigania i opinią publiczną.
Co więcej, pracownicy Meta mieli dyskutować o możliwości zaangażowania zespołu prawnego, który miałby opracować strategię minimalizującą ryzyko prawne w razie ujawnienia procederu. Rozważano różne scenariusze prawne oraz możliwe reakcje na ewentualne oskarżenia.
Konsekwencje i przyszłość sprawy
Meta nie po raz pierwszy spotyka się z zarzutami dotyczącymi nieetycznego treningu AI. Sprawa naruszenia praw autorskich przez modele sztucznej inteligencji budzi coraz większe kontrowersje, a organy regulacyjne na całym świecie przyglądają się temu zagadnieniu. Na chwilę obecną trudno przewidzieć, jakie konsekwencje spotkają firmę Meta. Należy jednak oczekiwać, że sprawa może potrwać wiele miesięcy, a potencjalne odwołania stron mogą dodatkowo wydłużyć cały proces.
Wiele zależy od tego, jak sąd podejdzie do kwestii odpowiedzialności prawnej za wykorzystanie danych z nielegalnych źródeł oraz jakie regulacje zostaną wdrożone w przyszłości, aby zapobiec podobnym sytuacjom. Pewne jest jedno – temat etycznego trenowania sztucznej inteligencji będzie jeszcze długo obecny w debacie publicznej.