Avaliação de recursos computacionais para o português

 Têm sido desenvolvidas várias ferramentas para o processamento da língua portuguesa. No entanto, devido a escolhas variadas na base dos comportamentos destas ferramentas (diferentes opções de pré-processamento, diferentes conjuntos de etiquetas morfossintáticas e de dependências, etc.), to...

Full description

Bibliographic Details
Main Author:	Gonçalves, Matilde (author)
Other Authors:	Coheur, Luisa (author), Baptista, Jorge (author), Mineiro, Ana (author)
Format:	article
Language:	por
Published:	2020
Subjects:	natural language processing evaluation of resources portuguese language part-of-speech tagging named entity recognition dependency parsing processamento da linguagem natural avaliação de recursos língua portuguesa análise morfosintática reconhecimento de entidades mencionadas análise de dependências
Online Access:	https://doi.org/10.21814/lm.12.2.331
Country:	Portugal
Oai:	oai:linguamatica.com:article/331

Description
Summary:	Têm sido desenvolvidas várias ferramentas para o processamento da língua portuguesa. No entanto, devido a escolhas variadas na base dos comportamentos destas ferramentas (diferentes opções de pré-processamento, diferentes conjuntos de etiquetas morfossintáticas e de dependências, etc.), torna-se difícil ter uma ideia do desempenho comparativo de cada uma. Neste trabalho, avaliamos um conjunto de ferramentas gratuitas e publicamente disponíveis, que realizam as tarefas de Etiquetação Morfossintática e de Reconhecimento de Entidades Mencionadas, para a língua portuguesa. São tidos em conta doze modelos diferentes para a primeira tarefa e oito para a segunda. Todos os recursos usados nesta avaliação (tabelas de mapeamento de etiquetas, corpora de referência, etc.) são disponibilizados, permitindo replicar/afinar os resultados. Apresentamos ainda um estudo qualitativo de dois analisadores de dependências. Não temos conhecimento de nenhum trabalho similar recente, isto é, que tenha em conta as ferramentas atuais disponíveis, realizado para a língua portuguesa.

Avaliação de recursos computacionais para o português

Similar Items

Need Help?