Qualidade na tradução automática e na pós-edição : anotação de erros de concordância e ordem de palabras

Considerando-se as características da tradução automática, como o baixo custo e a rapidez, esse tipo de tradução tem sido cada vez mais utilizado no mercado de tradução. Todavia, a qualidade dos resultados obtidos pelos sistemas utilizados pode não ser ideal, sendo necessário fazer a tradução passar...

ver descrição completa

Detalhes bibliográficos
Autor principal: Lopes, Rhandra Taysk da Silva (author)
Formato: masterThesis
Idioma:por
Publicado em: 2020
Assuntos:
Texto completo:http://hdl.handle.net/10451/41784
País:Portugal
Oai:oai:repositorio.ul.pt:10451/41784
Descrição
Resumo:Considerando-se as características da tradução automática, como o baixo custo e a rapidez, esse tipo de tradução tem sido cada vez mais utilizado no mercado de tradução. Todavia, a qualidade dos resultados obtidos pelos sistemas utilizados pode não ser ideal, sendo necessário fazer a tradução passar por um processo de pós-edição, feita por humanos, para atingir níveis de qualidade satisfatórios. O presente trabalho procura descrever o processo de tradução automática, pós-edição e anotação oferecido pela plataforma Unbabel, que faz uso de uma crowd para a edição online dos erros encontrados nos textos traduzidos pelo sistema Neural Machine Translation (NMT). O objetivo principal da presente pesquisa é aprimorar a qualidade dos textos traduzidos por essa empresa, através de propostas de aperfeiçoamento das orientações fornecidas pela empresa aos seus editores e anotadores e através de sugestões para a avaliação e treinamento desses elementos humanos. Para atingir esse objetivo, foram coletados e analisados dados contendo trechos de textos traduzidos pelo sistema automático, pós-editados por humanos e anotados também por humanos sob as etiquetas de Agreement e Word Order, tendo o inglês como língua de partida e o português brasileiro como língua de chegada. A partir da observação dos resultados dessas análises, foi possível definir Golden Texts e testes de múltipla escolha com mensagens de feedback para auxiliar na avaliação e treinamento dos anotadores e pós-editores.