Summary: | Um importante desafio se coloca ao controlo bibliográfico perante as oportunidades da Web Semântica, enquanto potencial fonte de informação para conjuntos de dados ligados: como produzir linked open datasets que sejam semanticamente expressivos e ricos de ligações? Este desafio associa-se, do ponto de vista operacional, a um outro: como realizar esse potencial a partir dos atuais e tradicionais produtos do controlo bibliográfico, sem alterar o fundamental das suas práticas e saber fazer mas, ao mesmo tempo, sendo capaz de integrar e interagir com desenvolvimentos que lhe são exteriores? Em resposta a estas duas questões, este trabalho apresenta um modelo leve de expressão de dados bibliográficos MARC como linked open data e um exemplo da sua aplicação em dados reais em formato UNIMARC. A construção do modelo apoia-se nas tecnologias XML para a esquematização, expressão e transformação de dados, ainda que permitindo o recurso a outras tecnologias, quando a capacidade de transformação XSL não é suficiente. No coração deste modelo está colocado um esquema que define o conjunto de elementos da norma bibliográfica. Baseando-se neste esquema, identificam-se, para cada um dos elementos que constitui o formato, os processadores que lhe estão associados e que têm funcionalidade variável: de identificação; de extração; de validação; de resolução; e de ligação. Tipicamente, estes processadores são constituídos por folhas de transformação mas que integram – em particular os processadores de ligação – o recurso a serviços Web para enriquecimento das conexões do conjunto de dados final. Esta abordagem permite definir uma cadeia automatizada de processamento que parte da esquematização da norma bibliográfica para construir um controlador dos processadores que são aplicados a uma coleção de registos bibliográficos e que geram, no final, um repositório de linked data. Permite, igualmente, alargar as capacidades de expressão e ligação destes dados, através da adição de novos elementos e processadores à instância do esquema.
|