O gigante de Inteligência Artificial OpenAI está sendo processado novamente, desta vez por supostamente roubar artigos protegidos por direitos autorais para treinar o chatbot ChatGPT. O caso se soma ao processo movido pelo The New York Times em dezembro do ano passado e agora inclui as publicações digitais The Intercept, Raw Story e AlterNet.
Seguindo a linha de argumentação do The New York Times, os novos processos, sendo um conjunto para Raw Story e AlterNet (que compartilham o mesmo proprietário), alegam que o OpenAI usou material protegido por direitos autorais para treinar o ChatGPT.
As publicações acusam o chatbot de gerar “em alguns casos” obras jornalísticas idênticas ou quase idênticas, sem fornecer informações como autor, título, copyright ou termos de uso contidas nos trabalhos originais.
Leia também: Processo do New York Times contra OpenAI toma rumo inesperado
Raw Story e AlterNet argumentam que o OpenAI e a Microsoft sabiam que o ChatGPT seria menos popular e lucrativo se as pessoas acreditassem que suas respostas violavam direitos autorais de terceiros.
Os processos apontam que os réus tinham conhecimento potencial de suas violações, pois o OpenAI oferece um sistema de opt-out para que proprietários de sites bloqueiem o rastreamento de seu conteúdo pelos crawlers da empresa. Os advogados das publicações acreditam que os conjuntos de dados WebText, WebText2 e Common Crawl usados para treinar o ChatGPT incluem conteúdo dos autores.
Vale ressaltar que, diferentemente do The Intercept, o processo conjunto de Raw Story e AlterNet não inclui a Microsoft como ré. De acordo com o CEO John Byrne, a decisão se baseia em uma parceria entre as publicações e o MSN, que auxilia no financiamento de reportagens investigativas. O escritório de advocacia Loevy & Loevy representa todos os três meios de comunicação nos processos.
“O Raw Story acredita que as organizações de notícias precisam se posicionar contra o OpenAI, que está violando a Lei de Direitos Autorais do Milênio Digital e lucrando com o trabalho árduo de jornalistas cujos empregos estão sob ameaça”, afirmou Byrne em uma declaração conjunta. “É crucial para a democracia que a diversidade de sites de notícias continue a prosperar. As violações do OpenAI, se não controladas, irão dizimar ainda mais a indústria jornalística, e com ela, os repórteres de notícias fundamentais que promovem mudanças positivas.”
“Ao preencherem seus conjuntos de treinamento com obras jornalísticas, os réus tiveram uma escolha: poderiam treinar o ChatGPT usando obras de jornalismo com as informações de gerenciamento de direitos autorais protegidas pela DMCA intactas, ou poderiam removê-las”, declaram os documentos do processo Raw Story/AltNet. “Os réus escolheram a última opção.”
As empresas buscam indenizações no valor de pelo menos US$ 2.500 por violação, além da remoção de todos os artigos protegidos por direitos autorais dos conjuntos de treinamento de dados do OpenAI.
É importante lembrar que o OpenAI recentemente acusou o The New York Times de pagar alguém para “hackear” o ChatGPT de forma a gerar evidências enganosas que apoiassem sua alegação.