Summary: | Neste artigo apresentamos a metodologia seguida para a construc ̧a ̃o de um sistema de pergunta- resposta sobre uma base de documentos em Portuguˆes. Descrevemos o sistema que tem dois mo ́dulos distintos: ana ́lise pr ́evia dos documentos (extracc ̧a ̃o de informac ̧a ̃o) e processamento das perguntas (recuperac ̧a ̃o de informac ̧a ̃o). O nosso sistema procura fazer um processamento, do corpus e da perguntas, suportado em teorias da lingu ́ıstica computacional: ana ́lise sinta ́ctica (grama ́tica de restric ̧o ̃es), seguida da ana ́lise semaˆntica usando a teoria da representac ̧a ̃o do discurso e finalmente a interpretac ̧a ̃o semaˆntica/pragma ́tica usando ontologia e inferˆencia lo ́gica. Apresentamos resultados da avaliac ̧a ̃o do seu desempenho que foi feita sobre dois conjuntos de documentos: textos de dois anos de jornais dia ́rios, o Pu ́blico e a Folha de Sa ̃o Paulo (1994-1995); e um conjunto de documentos jur ́ıdicos: deciso ̃es do supremo Tribunal, tribunal da Relac ̧a ̃o e pareceres da Procuradoria Geral da Repu ́blica (cerca de 100.000 documentos).
|