Marcação das partes do discurso usando computação evolucionária

A marcação das partes do discurso constitui uma tarefa de considerável importância na área de processamento de língua natural. O seu objectivo consiste em marcar automaticamente as palavras de um texto com etiquetas que designam as partes do discurso adequadas. A abordagem proposta nesta tese divide...

Full description

Bibliographic Details
Main Author: Silva, Ana Paula Neves Ferreira da (author)
Format: doctoralThesis
Language:por
Published: 2015
Online Access:http://hdl.handle.net/10174/16317
Country:Portugal
Oai:oai:dspace.uevora.pt:10174/16317
Description
Summary:A marcação das partes do discurso constitui uma tarefa de considerável importância na área de processamento de língua natural. O seu objectivo consiste em marcar automaticamente as palavras de um texto com etiquetas que designam as partes do discurso adequadas. A abordagem proposta nesta tese divide o problema em duas tarefas: uma de aprendizagem e outra de optimização. Foram adoptados algoritmos da área da computação evolucionária em cada uma das fases. Destacamos a utilização de inteligência de enxame, não só pelos bons resultados alcançados, mas também por se revelar uma das primeiras aplicações deste tipo de algoritmos a este problema. A abordagem foi pensada com o objectivo de poder ser alargada a outras tarefas de processamento de língua natural, com características comuns à da marcação das partes do discurso. Os resultados obtidos em corpora em língua Inglesa e Portuguesa encontram-se entre os melhores publicados; ABSTRACT: Part-of-speech tagging is a task of considerable importance in the field of natural language processing. Its purpose is to automatically tag the words of a text with labels that designate the appropriate parts-of-speech. The approach proposed in this thesis divides the problem into two tasks: a learning task and an optimization task. Algorithms from the field of evolutionary computing were adopted to tackle each of those tasks. We emphasize the use of swarm intelligence, not only for the good results achieved, but also because it is one of the first applications of such algorithms to this problem. This approach was designed with the aim of being easily extended to other natural language processing tasks that share characteristics with the part-of-speech tagging problem. The results obtained in English and Portuguese language corpora are among the best published.