Robôs vs. Humanos: quem traduz melhor?

Sabemos que os avanços da inteligência artificial permitiram que computadores produzissem diagnósticos com acurácia superior a médicos e vencesse o campeão mundial de Go com uma larga margem. Entretanto, seriam eles capazes de baterem a inteligência humana no campo linguístico também?

Uma reportagem publicada no MIT Technology Review apresenta o estudo de alguns pesquisadores da Universidade de Zurich sobre a qualidade na tradução de textos pelos nossos amigos robôs. Eles produziram um bom resultado, mas os humanos continuam na liderança… por enquanto.

Processamento de Linguagem Natural é uma ramificação da inteligência artificial que estuda a automatização e compreensão de línguas humanas por computadores. Existem diversas aplicações dessa área, como sumarização automática de textos, reconhecimento de fala, perguntas e respostas, etc. Tradução de textos é considerada uma das tarefas mais difíceis pois envolve diversos conceitos como gramática e semântica. Ele é considerado um problema AI-Complete.

Os pesquisadores utilizaram textos traduzidos com técnicas de redes neurais para comparar a performance desse embate. Os algoritmos tiveram melhorias significativas nos últimos anos e eles buscaram comparar de uma maneira justa o resultado sob duas métricas: adequação e fluência.

Adequação utiliza um profissional humano para analisar quão bem a tradução traduziu o significado da fonte original. Fluência utiliza leitores que sabem apenas uma língua para verificar quão bem aquele texto foi traduzido para o inglês. Eles utilizaram uma base de dados com mais de 100 artigos, traduzidos do chinês para o inglês.

Os juízes analisaram tanto no nível específico de cada sentença do texto como o documento como um todo. No primeiro quesito, adequação, os robôs são superiores ao analisarem sentenças, mas perdem para humanos ao analisarem o documento total. Em fluência, os robôs também produzem um resultado melhor nas sentenças, mas empatam com humanos no geral. No gráfico abaixo você pode verificar com mais clareza o resultado. Uma possível explicação para essa derrota no geral seriam traduções errôneas pela máquina de termos ambíguos ou erros correlacionados com coesão e coerência entre sentenças.

machine_humans_translation

Entender essas diferenças para posterior aperfeiçoamento desses algoritmos são passos importantes para a evolução no campo linguístico da computação. A Let’s Code está constantemente reformulando e ampliando seus cursos para sempre trazer novos conteúdos e garantir um aprendizado na prática. Aprenda Machine Learning.