Análise de artigos científicos da última década revela que pesquisadores descobriram o uso indevido de certos termos de "estilo" por modelos de inteligência artificial, termos esses que eram raramente usados há alguns anos.

Em um novo estudo ainda não revisado por pares, os pesquisadores empregaram um método inovador, semelhante à epidemiologia, analisando o "uso excessivo de palavras" em artigos biomédicos para identificar o uso indevido de certos termos por grandes modelos de linguagem. Os resultados fornecem insights interessantes sobre o impacto da IA no meio acadêmico, sugerindo que pelo menos 10% dos resumos foram processados por meio de grandes modelos de linguagem em 2024.

Nota da imagem: Imagem gerada por IA, fornecida pela Midjourney.

Este estudo é baseado em uma ampla análise de 14 milhões de resumos biomédicos publicados no PubMed entre 2010 e 2024. Os pesquisadores usaram artigos publicados antes de 2023 como referência, comparando-os com artigos publicados após a ampla comercialização de grandes modelos de linguagem como o ChatGPT. Eles descobriram que alguns termos antes considerados "incomuns", como "profundo", agora são usados 25 vezes mais frequentemente do que no passado, enquanto outros termos, como "demonstrar" e "enfatizar", apresentaram aumentos semelhantes. No entanto, alguns termos "comuns" também aumentaram: termos como "potencial", "descoberta" e "chave" aumentaram em até 4%.

Os pesquisadores observam que esse aumento significativo é praticamente sem precedentes, sem uma explicação ligada a eventos globais urgentes. Eles descobriram que, no período de 2013 a 2023, o excesso de termos incluía substantivos relacionados a eventos reais, como "Ebola", "coronavírus" e "bloqueio". No entanto, em 2024, quase todos os termos excessivos eram termos de "estilo". Em termos de quantidade, dois terços dos 280 termos de "estilo" excessivos em 2024 eram verbos, e cerca de um quinto eram adjetivos.

Com base nesses termos de estilo excessivos como "marcadores" de uso do ChatGPT, os pesquisadores estimam que cerca de 15% dos artigos publicados em países não anglo-saxônicos, como China, Coréia do Sul e Taiwan, são agora processados por inteligência artificial, enquanto em países de língua inglesa, como o Reino Unido, essa proporção é de 3%. Portanto, os grandes modelos de linguagem podem ser uma ferramenta eficaz para que falantes não nativos alcancem o sucesso em um campo dominado pela língua inglesa.

Destaques:

🔍  Através da análise de artigos biomédicos, os pesquisadores descobriram que modelos de inteligência artificial usam indevidamente alguns termos de "estilo", termos esses que eram raramente usados alguns anos atrás.

🔍  A ampla comercialização de grandes modelos de linguagem levou a um aumento significativo na frequência de uso de certos termos, sugerindo que o impacto da inteligência artificial no meio acadêmico pode ser sem precedentes.

🔍  Em artigos publicados em países não anglo-saxônicos, a proporção de artigos processados por inteligência artificial chega a cerca de 15%, mostrando que os grandes modelos de linguagem podem ser uma ferramenta eficaz para que falantes não nativos alcancem o sucesso em um campo dominado pela língua inglesa.