OpenAI okrada słowniki?

Niespełna dwa miesiące temu podniosłam temat zbiorowego pozwu przeciwko OpenAI, który był opatrzony hasłem „kradzież to nie innowacja”. Wtedy cierpliwość stracili artyści, których praca była podbierana przez AI, następnie pilnie studiowana i odtwarzana, żeby na sam koniec nazwać to wszystko zgrabnie „postępem”. Tym razem dość mają… słowniki?

Nie pierwsze rodeo?

No właśnie, to nawet nie są pierwsze sądowe potyczki dokładnie tych samych graczy. Poprzednie zarzuty są jednak nadal świeże – we wrześniu 2025 roku Encyclopedia Britannica i Merriam-Webster pozwały Perplexity, zarzucając mu kopiowanie definicji, przejmowanie ruchu na ich stronach i przypisywanie ich marek do odpowiedzi, które bywały niepełne, mylące albo po prostu błędne. Wisienką na torcie tej całej sprawy jest jeden z przykładów padających w pozwie – mianowicie, Perplexity splagiatowało definicję plagiatu. Czy da się bardziej symbolicznie?

Co nowego więc?

Nowość polega tu przede wszystkim na skali i adresacie pozwu. W poprzedniej sprawie chodziło o Perplexity i mocno wybrzmiewał wątek definicji i stricte słownikowych haseł. Tym razem na celowniku jest większy zawodnik, gigant w branży – OpenAI. Zarzuty natomiast odnoszą się już szerszych zasobów treści – chodzi przede wszystkim o artykuły i hasła Encyclopaedia Britannica, które według pozwu miały zostać wykorzystane do trenowania modeli GPT.

Britannica twierdzi, że OpenAI bezprawnie skopiowało blisko 100 000 jej tekstów i używało ich nie tylko do samego treningu, ale też dość bezpośrednio – w odpowiedziach, które łudząco przypominały części artykułów, czasami nawet słowo w słowo. Kolejną z kwestii poruszanych w pozwie jest przejmowanie ruchu na stronie internetowej – bo przecież kiedy AI przywłaszcza sobie odpowiedź słownika nie odnosząc się do ich strony, nikt już nie sprawdzi u źródła (a szkoda).

Tutaj nie chodzi tylko o te artykuły i hasła, ale też wiarygodność marki Britannica, której autorytet był budowany aż od roku 1768 (!!!), a teraz może zostać poddany wątpliwości przez to, co Chat GPT potrafi robić wybitnie – przekręcanie i wymyślanie danych. Według pozwu OpenAI nie tylko miało korzystać z jej treści bez zgody, ale też sprawiać wrażenie, że ma prawo je reprodukować, a przy okazji podpinać Britannica pod to, co nazywają otwarcie halucynacjami.

Co dalej?

Oba procesy dopiero się zaczęły, więc na rozwój sytuacji trzeba będzie poczekać. Część tego spektaklu można jednak przewidzieć, bo nie jest to nowa sytuacja – dyskusje, jak i pozwy względem firm branży AI jest jak grzybów po deszczu – prawie każdy czuje się przez AI ograbiony z czegoś. Twórcy modeli natomiast z uporem maniaka odnoszą się do zasad fair-use.

Cóż, w tym wszystkim jest pewna ironia. Merriam-Webster mianowało słowem roku 2025 „slop”, czyli niskiej jakości cyfrową treść, często łączoną z AI. Jeśli więc firmy AI faktycznie przejmują ruch od takich źródeł, to i tak najwyraźniej nie na tyle skutecznie, by ludzie przestali sprawdzać u źródła, jak nazwać ten bałagan który widzą dookoła.

Źródła:
– https://www.reuters.com/legal/litigation/encyclopedia-britannica-sues-openai-over-ai-training-2026-03-16/
– https://techcrunch.com/2026/03/16/merriam-webster-openai-encyclopedia-brittanica-lawsuit/
– https://www.theverge.com/ai-artificial-intelligence/895372/encyclopedia-britannica-openai-lawsuit
https://fingfx.thomsonreuters.com/gfx/legaldocs/klpylzoekvg/BRITTANICA%20OPENAI%20LAWSUIT%20complaint.pdf
– https://www.theverge.com/news/777344/perplexity-lawsuit-encyclopedia-britannica-merriam-webster