Editoras de quase 400 jornais e sites em 33 estados americanos abriram processo contra a OpenAI, criadora do ChatGPT, e sua parceira Microsoft pelo uso, sem autorização, de conteúdo protegido por direito autoral no desenvolvimento de seus modelos de inteligência artificial (IA). Na ação, as editoras afirmam que o empreendimento altamente lucrativo da IA cometeu “violação desenfreada” de direitos autorais. “A Microsoft e a OpenAI criaram e distribuíram reproduções das obras” ao usar tais conteúdos “para treinar seus grandes modelos de linguagem” e ao implantar produtos novos. O processo pede uma compensação financeira proporcional ao tamanho do roubo e solicita que a decisão seja tomada por um júri.
O New York Times foi a primeira grande empresa de comunicação americana a processar OpenAI e Microsoft. Em dezembro de 2023, abriu ação contra a violação de direitos autorais no uso de artigos jornalísticos para treinar modelos de IA, incluindo o ChatGPT. Desde a primeira iniciativa há quase três anos, mais de 40 ações semelhantes foram protocoladas por empresas de comunicação e escritores nos Estados Unidos. Há também iniciativas regulatórias relativas ao uso de IA na União Europeia e noutros países, inclusive o Brasil. Enquanto elas não avançam, a esperança de reparação contra o roubo sistemático de direitos autorais está na Justiça.
O processo desta semana foi aberto por jornais locais, cuja audiência tem sido drenada por robôs de IA, sem que os veículos sejam devidamente compensados. Na ação, eles lembram que a própria OpenAI é ré confessa. Em comunicado entregue a uma comissão de investigação da Câmara dos Lordes na Inglaterra em 2023, a empresa declarou que, como os direitos autorais “hoje abrangem praticamente todo tipo de expressão humana — incluindo posts de blogs, fotografias, postagens em fóruns, trechos de código de software e documentos governamentais —, seria impossível treinar os principais modelos de IA atuais sem usar materiais protegidos por direitos autorais”. No mesmo documento, descreveu seus críticos como retrógrados: “Limitar os dados de treinamento a livros e desenhos em domínio público criados há mais de um século poderia gerar um experimento interessante, mas não resultaria em sistemas de IA que atendessem às necessidades dos cidadãos de hoje”.
Tal argumento não para de pé. Pelo motivo mais óbvio: é perfeitamente possível treinar os modelos mais potentes de IA com todo o material disponível, desde que se pague pelos direitos autorais para usá-lo. Em setembro, a Anthropic, outra empresa americana na vanguarda da tecnologia, aceitou pagar US$ 1,5 bilhão a um grupo de editoras e escritores após decisão judicial.
A OpenAI planeja abrir seu capital na Bolsa e cogita atingir US$ 1 trilhão em valor de mercado. Ora, se tal valor resulta de roubo indiscriminado, a própria empresa acabará punida em suas ambições. Todos os modelos de IA precisam operar dentro da legalidade. Do contrário, a tecnologia que promete revolucionar a economia se tornará uma ameaça à produção de todo tipo de conteúdo — do trabalho de artistas e profissionais criativos à cobertura jornalística, vital para o bom funcionamento da democracia.

