Gerador de Dados Sintéticos para Testes de Qualidade de Dados

Na era dos data lakes, ter grandes quantidades de dados apresenta um enorme valor a médio e longo prazo tanto para novas oportunidades de negócio como para captar investimento. A web semântica com os seus altos e baixos desde o início do século ganha novo fôlego com qualidade desses dados para a org...

ver descrição completa

Detalhes bibliográficos
Autor principal: Brito, Fábio (author)
Outros Autores: Matos, Sandra (author), Santos, Duarte (author)
Formato: bachelorThesis
Idioma:por
Publicado em: 2019
Assuntos:
Texto completo:http://hdl.handle.net/11144/4343
País:Portugal
Oai:oai:repositorio.ual.pt:11144/4343
Descrição
Resumo:Na era dos data lakes, ter grandes quantidades de dados apresenta um enorme valor a médio e longo prazo tanto para novas oportunidades de negócio como para captar investimento. A web semântica com os seus altos e baixos desde o início do século ganha novo fôlego com qualidade desses dados para a organização de dados estruturados (Linked Data) na criação de vocabulários de dados ligados para utilização em algoritmos de inteligência artificial. A qualidade dos dados, quando não auferida irá resultar com certeza, em interpretações errôneas e distantes da realidade e por consequência, decisões erradas que podem pôr em causa objetivos traçados. Assim, apresentamos uma ferramenta robusta, capaz de gerar dados de forma controlada para que nos seja possível aferir a qualidade dos mesmos: O Generatron.