Pular para o conteúdo

Afinal, o ChatGPT consegue entender nossas gírias e regionalismos?

Das 100 expressões testadas pela Preply, apenas três não foram reconhecidas pelo chatbot, que titubeou diante do significado popular de 19% dos termos

Entende, mas nem tanto assim. Após um teste conduzido no ChatGPT, a plataforma de e-learning Preply concluiu que o bot que virou sucesso mundial consegue reconhecer muitas das principais gírias e expressões populares brasileiras, mas ainda superestima sua própria capacidade de entendê-las. Isso porque, ao ser apresentada a um conjunto de 100 jargões típicos de todas as regiões do Brasil, a ferramenta deu um significado alternativo — não necessariamente incorreto, mas diferente de seu sentido mais comum — a 19% dos regionalismos testados.

Entre os termos mal “explicados” estão “queixar”, que, ao contrário do que parece, quer dizer flertar ou chamar para sair no vocabulário popular baiano. A tecnologia criada pelo estadunidense Sam Altman, no entanto, se rendeu inicialmente ao significado padrão usado para quando alguém expõe aborrecimento.

Algo similar também aconteceu com o significado de “peidado”, termo bastante utilizado em Alagoas, quando a ferramenta afirmou se tratar de uma pessoa muito bêbada. O sentido proposto, tal como o anterior, foi de encontro ao seu uso mais conhecido na região: na verdade, a expressão é comumente evocada pelos alagoanos para descrever alguém que está indignado ou furioso.

De forma curiosa, quando realmente foi indagado sobre uma gíria usada para nomear quem passou do ponto na bebida – a expressão baiana “cheio de pau” – o chat disse que esta se referia a uma pessoa que inventa desculpas ou que está à flor da pele.  

Para a maioria das palavras, contudo, bastou ser questionado “qual o significado da gíria x?” que o bot retornou uma resposta satisfatória. Em outros casos, foi necessário fornecer um pouco mais de contexto, como de que estado a palavra deriva ou em qual é mais utilizada. Em situações como essas, duas ou três perguntas complementares foram suficientes.

Como o ChatGPT chegou nos significados das gírias?

A resposta para esta pergunta foi consultada na própria ferramenta, que compartilhou ter sido treinada com uma grande quantidade de textos e dados de linguagem natural para captar múltiplos diálogos e contextos. 

Na verdade, sabemos que os dados que constroem o chat vêm de livros, artigos de notícias, páginas da web, mídias sociais e fontes afins, algo que o permite entender e reconhecer muitas palavras comuns em diferentes contextos, incluindo gírias e expressões informais.

Logo, quando alguém pergunta sobre o significado de uma gíria, ele rapidamente recorre ao conhecimento adquirido por meio do seu “treinamento” para responder. Em último caso, há uma espécie de nova varredura em fontes confiáveis ​​como dicionários, enciclopédias e outras referências online.

Vale lembrar que a tecnologia criada pelo laboratório de pesquisa estadunidense OpenAI é semelhante à de assistentes virtuais como a Alexa, da Amazon, e o Google Assistant. Segundo o site da organização, seu desenvolvimento é pautado em redes neurais e machine learning com foco em diálogos virtuais.

Entretanto, é importante ressaltar que, por ser uma inteligência artificial, o chat está passível de cometer erros, como demonstrou a pesquisa da Preply. “Embora eu possa entender muitas gírias e expressões informais, minha capacidade de processar linguagem natural é limitada em relação à de um ser humano. Isso significa que posso não entender totalmente certas nuances culturais importantes para interpretar adequadamente a gíria”, respondeu o chat após ser questionado sobre sua assertividade. 

As palavras desconhecidas

Durante o experimento, curiosamente, a ferramenta afirmou “não saber” com menos frequência do que forneceu respostas tidas como “alternativas” a seus usuários. Apenas três palavras entre as 100 não foram reconhecidas por ela ao longo da ocasião: “olada”, “moage” e “despombalecido”. 

A primeira é originária do Rio Grande do Sul e, de modo geral, significa ocasião oportuna. Quando alguém está com muita sorte em jogos, por exemplo, diz-se que está “de olada”. Já “moage” não tem uma origem específica, mas é popularmente conhecida para chamar pessoas que estão de enrolação ou criando complicações. “Deixa de moage e vamos trabalhar”, é possível dizer para quem está fazendo corpo mole. Por fim, a gíria paraense “despombalecido” serve para se referir ao sujeito que está triste, com preguiça ou doente.

“Nosso estudo sugere que dois tipos de regionalismos parecem suscitar imprecisões no ChatGPT: os que exigem um pouco mais de contexto e aqueles derivados de palavras formais da língua, ressignificadas depois em alguns locais”, avalia Yolanda Del Peso, especialista em Outreach da Preply. “Isso nos ajuda a pensar até onde a tecnologia é capaz de ir, bem como certas nuances da linguagem que ela ainda não alcança… e nem tão cedo será capaz de alcançar”.

Sobre a Preply

A Preply é uma plataforma online de aprendizagem que conecta milhões de professores nativos a alunos de todo o mundo. A empresa fundada em Kiev, na Ucrânia, e que conta com escritórios em Barcelona, Espanha, já alcançou mais de 140 mil professores que ensinam 50 idiomas em 203 países ao redor do planeta. A solução proporciona uma relevante e eficiente experiência de aprendizado a preços justos. Mensalmente, a Preply realiza pesquisas nas áreas de educação, mercado, estilo de vida e outros temas relevantes para o mundo globalizado.