Detecção de Paráfrases na Lı́ngua Portuguesa usando Sentence Embeddings

A detecção (ou identificação) de paráfrases é a tarefa de determinar se duas ou mais sentenças de comprimento arbitrário possuem o mesmo significado. Os métodos para resolver esta tarefa com potenciais aplicações em sistemas de Processamento de Linguagem Natural. Este trabalho investiga a combinação...

ver descrição completa

Detalhes bibliográficos
Autor principal: Souza, Marlo (author)
Outros Autores: Sanches, Leandro Manuel Pereira (author)
Formato: article
Idioma:por
Publicado em: 2019
Assuntos:
Texto completo:https://doi.org/10.21814/lm.10.2.286
País:Portugal
Oai:oai:linguamatica.com:article/286
Descrição
Resumo:A detecção (ou identificação) de paráfrases é a tarefa de determinar se duas ou mais sentenças de comprimento arbitrário possuem o mesmo significado. Os métodos para resolver esta tarefa com potenciais aplicações em sistemas de Processamento de Linguagem Natural. Este trabalho investiga a combinação de diferentes métodos de representação de sentenças em modelos de linguagem por espaços vetoriais e classificadores lineares para o problema de detecção de paráfrases para a língua portuguesa. Os resultados obtidos nesse trabalho estão aquém daqueles obtidos para a tarefa relacionada de detecção de implicação textual na avaliação ASSIN para a língua portuguesa, porém nesse trabalho investigamos a aplicação das representações vetoriais de sentenças para a detecção de paráfrases, outras características usualmente exploradas em sistemas desse tipo podem trivialmente ser incorporadas ao nosso método para melhorar a performance.