Summary: | A presente dissertação teve como base a análise de dados obtidos a partir de um estágio realizado na start-up Unbabel e trata da tradução de combinatórias lexicais de inglês para português do Brasil na área de tradução automática e subsequente pós-edição. As combinatórias lexicais são expressões complexas que, por suas propriedades, causam problemas de tradução especiais, sobretudo para a tradução automática que, como toda área tecnológica, está em constante desenvolvimento. Presentes em todos tipos de comunicação e em todas línguas, tanto na língua comum quanto na linguagem especializada, estas expressões são realmente relevantes e o seu estudo indispensável. A pesquisa analisou um corpus proveniente do processo de anotação da empresa. Observamos as combinatórias lexicais tanto em relação à anotação dos erros, quanto à identificação das origens dos mesmos. Os resultados mais significantes demonstraram a necessidade de incluir um tipo de erros para as combinatórias lexicais na taxonomia da empresa, bem como critérios de anotação para tais. A análise também apontou para a falha na deteção de variedades linguísticas em relação às combinatórias lexicais. Desta forma, também criamos um glossário de combinatórias lexicais que, além de conter as soluções encontradas para o português do Brasil, inclui os diferentes equivalentes para português europeu, contribuindo também para a distinção entre as duas variedades linguísticas em relação a estas expressões, uma vez que os estudos comparativos entre ambas tendem a tratar fundamentalmente das diferenças gramaticais.
|