Pesquisadores encontram forma barata de detectar alucinações de tradução

Pesquisadores desenvolveram um método de baixo custo para detectar quando modelos de tradução automática neural alucinam comparando padrões de atenção entre modelos de tradução direta e reversa. A técnica aproveita configurações de tradução bidirecional existentes—onde a maioria das organizações já executa modelos idioma1→idioma2 e idioma2→idioma1—para identificar incerteza a nível de token sem exigir retreinamento caro ou gerar múltiplas saídas.

Isso resolve um problema real: Google Translate e sistemas similares mostram apenas a tradução final, escondendo níveis de confiança que poderiam ajudar a alocar recursos computacionais mais eficientemente. Soluções atuais como Semantic Entropy exigem gerar 5-10 saídas por entrada (computacionalmente caro), enquanto modelos de estimativa de qualidade de ponta como xCOMET precisam ajustar finamente 3,5 bilhões de parâmetros em dados anotados custosos. A nova abordagem contorna ambos os problemas usando teacher forcing para extrair mapas de atenção cruzada transpostos de pares de modelos existentes.

A pesquisa surge enquanto tradutores profissionais expressam crescente cautela sobre ferramentas de tradução IA, segundo entrevistas com 19 tradutores através de 11 idiomas publicadas em trabalhos relacionados. Esses tradutores se preocupam com terceirização do trabalho para sistemas automatizados, destacando a importância de transparência em IA de tradução—exatamente o que métodos de desalinhamento de atenção poderiam fornecer. O contraste é marcante: enquanto pesquisadores focam em detecção técnica de incerteza, praticantes querem entender quando e por que confiar em traduções IA.

Para desenvolvedores construindo sistemas de tradução, este método oferece uma vantagem prática. Em vez de pontuações de probabilidade de caixa preta que não explicam por que um modelo é incerto, desalinhamento de atenção revela se a incerteza vem de exemplos de treinamento não vistos ou alucinações reais. A maioria das configurações de tradução em produção já tem os modelos bidirecionais necessários, tornando a implementação direta sem custos adicionais de infraestrutura.

Pesquisadores encontram forma barata de detectar alucinações de tradução

Mais notícias