Diversos sites de grandes empresas, como Amazon, Reuters e The New York Times, bloquearam o GPTBot, robô da OpenAI, lançado no dia 8, que tem função de rastrear textos na internet para alimentar e treinar o ChatGPT. Até o dia 22 de agosto, ao menos 69 sites bloquearam o dispositivo, segundo análise da Originality.ai, empresa de verificação de conteúdos gerados por inteligência artificial (IA) e plágio.
Pelo menos 15% dos mil sites mais populares barraram o GPTBot nas últimas duas semanas. “O GPTBot foi lançado há 14 dias e a porcentagem dos mil principais sites que o bloqueiam aumenta constantemente”, afirma a pesquisa.
A obstrução impede o uso do conteúdo protegido por direitos autorais para alimentar e treinar o chatbot de IA. “Propriedade intelectual é a força vital dos nossos negócios, e precisamos proteger os direitos autorais do nosso conteúdo”, disse um porta-voz da agência de notícias Reuters ao jornal The Guardian.
A análise foi feita entre os dias 8 e 22 de agosto. Durante o estudo, foram analisados todos os arquivos robots.txt dos endereços selecionados para verificar se o GPTBot estava bloqueado ou não.
A discussão sobre os direitos autorais dos conteúdos usados por IAs generativas não é de hoje. Em janeiro, por exemplo, o banco de imagens Getty Images processou os criadores da IA Stable Diffusion por treinar o sistema usando imagens protegidas por direitos autorais.
O ChatGPT foi lançado em novembro do ano passado e deu início a uma onda de inteligências artificiais generativas capazes de gerar textos, imagens e até vídeos. Influenciadas pela nova tecnologia, grandes empresas, como Microsoft e Google, também passaram a investir mais nessa área.
As informações são do jornal O Estado de S. Paulo.