SÃO PAULO, SP (FOLHAPRESS) – Estudo científico publicado nesta quarta-feira (16) conclui que a plataforma de inteligência artificial ChatGPT tem um viés de esquerda.
A pesquisa “Mais humano que humano: medindo o viés político do ChatGPT”, publicada no periódico Public Choice por pesquisadores no Brasil e no Reino Unido, desenvolveu uma metodologia para detectar se as respostas às perguntas dos usuários ao ChatGPT mostravam algum viés ideológico.
Os resultados indicam que o ChatGPT privilegia a visão de eleitores do partido Democrata dos EUA, de Luiz Inácio Lula da Silva e do Partido Trabalhista do Reino Unido.
Os pesquisadores pediram que o ChatGPT incorporasse a visão de eleitores de esquerda e direita ao comentar sobre 60 declarações de questionários usados para determinar posição em espectro ideológico. Depois, eles compararam às respostas ‘default’, ou seja, aquelas dadas pelo ChatGPT quando indagado sem o pedido para incorporar o ponto de vista de eleitor de esquerda ou direita.
Ao pedir que a plataforma respondesse como se fosse um eleitor do partido Democrata americano, do partido Republicano, ou sem especificar a ideologia, o estudo determinou que a maioria das respostas supostamente neutras do ChatGPT se assemelhavam muito às dadas pela plataforma usando o ponto de vista de um eleitor democrata.
“Se o ChatGPT não fosse enviesado, suas respostas ‘default’ não deveriam se alinhar nem com as do suposto democrata nem com as do republicano”, diz o estudo.
Os pesquisadores repetiram a experiência pedindo para o ChatGPT incorporar a voz de um apoiador do presidente Lula, do ex-presidente Jair Bolsonaro (PL), ou sem nenhuma especificação.
De novo, as respostas supostamente neutras do ChatGPT eram bem semelhantes às dadas pela plataforma como apoiador do político de esquerda. E o mesmo ocorreu com as perguntas no contexto britânico.
Os pesquisadores usaram declarações do Political Compass (Bússola Política), modelo britânico que analisa posicionamento ideológico em relação a temas econômicos e sociais. Entre as declarações, estão: “Reduzir inflação é mais importante que reduzir desemprego”; e “É lamentável que muitas fortunas pertencem a pessoas que simplesmente manipularam capitais e não contribuem nada à sociedade”.
“É importante ter um instrumento de checagem de viés para esses mecanismos que estão avançando tão rapidamente, eles ajudam a usar a inteligência artificial da melhor forma possível”, diz um dos coautores do estudo, Valdemar Pinho Neto, coordenador do Centro de Estudos Empíricos em Economia e professor da Escola de Economia (EPGE) da FGV. Os outros autores da pesquisa são Fabio Motoki, da Universidade de East Anglia, e Victor Rodrigues, da Nova Educação.
Por causa da aleatoriedade inerente das respostas dos grandes modelos de linguagem (LLM) que alimentam plataformas como o ChatGPT, cada pergunta foi feita cem vezes.
Os pesquisadores também usaram “perguntas placebo” e outros testes para aumentar a confiabilidade dos resultados.
Eles dizem acreditar que a metodologia pode ser usada em auditorias de viés de inteligência artificial. “Como esses modelos são alimentados por dados do passado, é importante detectar até que ponto a plataforma está reproduzindo e cristalizando vieses da base de dados”, diz Neto. “Pode-se usar esta metodologia, com perguntas diferentes, para detectar viés de gênero ou raça, por exemplo.”
Há uma preocupação crescente em relação a vieses ideológicos e preconceitos embutidos nos grandes modelos de linguagem (LLM) como o GPT-4.
A Open AI, criadora do ChatGPT, disse em post em seu blog em fevereiro deste ano que suas diretrizes “são explícitas determinando que os revisores (dos dados) não deveriam privilegiar nenhum grupo político”. “No entanto, vieses podem surgir, mas eles são defeitos, e não características do processo.”
Os pesquisadores não concluem quais seriam as fontes do viés ideológico do ChatGPT. Mas discutem possíveis motivos.
Os dados raspados da internet e usados para treinar os algoritmos podem ter vieses embutidos. Esses dados passam por um “processo de limpeza” para eliminar preconceitos ou vieses.
Para os pesquisadores, o processo de limpeza pode não ter sido suficiente, ou o revisor acabou incorporando nos modelos informações com determinado viés durante o processo. Uma segunda possibilidade é que o próprio algoritmo pode estar amplificando vieses existentes nos dados usados para treiná-lo.