Introdução à integração semântica de dados

Introdução à integração semântica de dados

A integração de dados cria uma visão unificada da heterogeneidade dos diversos conjuntos de dados existentes. Já a integração semântica de dados possui um mediador que mantém o significado dos dados.

Publicado: 2021-9-29 por Rafael Rocha

A integração de dados visa criar uma visão unificada da heterogeneidade dos diversos conjuntos de dados existentes (XUet al., 2003; IZZA, 2009). Uma vez que as instituições cada vez mais automatizadas geram diariamente dados. Os sistemas de informações que utilizam tecnologias diversas, também armazenam os dados em locais diferentes com estrutura respectiva. Antes de tudo, cada técnica de unificação possui um agente de integração (empacotador ou extrator) que obtém os dados das suas devidas fontes de modo a concentrá-los em um armazém de dados ou em um esquema mediador.

A integração de dados tradicional preza pela interoperabilidade da forma, ou seja, todas as tecnologias no processo comunicam-se utilizando um esquema. Ao passo que na integração semântica de dados, além de possuir um esquema, também possui um mediador que mantém o significado dos dados. Izza, Vincent e Burlat (2008) ratificam, a interoperabilidade semântica provê conformidade de significado entre aplicações, ao passo que a interoperabilidade sintática provê uma interface para comunicação. Para realizar a integração semântica de dados tabulares é necessária a representação semântica do esquema.

A representação semântica precisa ser mapeada em uma ferramenta para extrair ou empacotar os dados tabulares. Como definido por Bizer, Heath e Berners-Lee (2011), o sucesso do Linked Data (LD) está atrelado a facilidade dos usuários em ligar os dados e navegar por eles. Na medida em que as páginas na web se tornaram mais intuitivas e mais amigáveis, mais adeptos foram angariados para sua utilização. Neste contexto, podemos afirmar que o sucesso da web atual é pelo fato dos usuários finais conseguirem publicar conteúdo. O compreendimento da informação disponível na web é de fácil consumo, gerando mais publicação de hipertextos nesta retroalimentação. Segundo Stone et al.(2005), uma boa interface utiliza a experiência dos usuários para ergonomia do software. Uma boa ergonomia resulta em uma usabilidade que contribui para a entrega dos resultados almejados. Davies et al.(2010) demonstram que a contribuição de usuários finais não técnicos pode aumentar a publicação de mais LD quando as ferramentas oferecem interface adequada. Uma estratégia é encapsular as linguagens complexas de mapeamento e processamento, com uma interface amigável (HEYVAERTet al., 2016).


A integração de dados tradicional utiliza banco de dados relacional para persistência. As tuplas das tabelas estão limitadas ao par atributo/valor (LUDÄSCHERet al., 2006). Para expansão de conhecimento é preciso escalar em metadados e em redundância de dados. Ao passo que uma tripla possui um esquema livre, pois utiliza uma estrutura em forma de grafo que contém sujeito, predicado e objeto. Diante disso, um triplestore se faz necessário como repositório para atender a escalabilidade do grafo. As triplas são recuperadas por meio da linguagem de consulta SPARQL Protocol and RDF Query Language(SPARQL).

referências

BIZER, C.; HEATH, T.; BERNERS-LEE, T. Linked data: The story so far.In:Semanticservices, interoperability and web applications: emerging concepts. [s.l.]: IGI Global, 2011.p. 205–227.

DAVIES, S.et al.User interface design considerations for linked data authoring environments.In: BIZER, C.et al.(Ed.).Proceedings of the WWW2010 Workshop on Linked Data on theWeb, LDOW 2010, Raleigh, USA, April 27, 2010. CEUR-WS.org, 2010. (CEUR WorkshopProceedings, v. 628).

HEYVAERT, P.et al.RMLEditor: a graph-based mapping editor for Linked Data mappings.In: SACK, H.et al.(Ed.).The Semantic Web: Latest Advances and New Domains (ESWC2016). Springer, 2016. (Lecture Notes in Computer Science, v. 9678), p. 709–723. ISBN978-3-319-34129-3.

IZZA, S. Integration of industrial information systems: from syntactic to semantic integration approaches. Enterprise Information Systems, Taylor & Francis, v. 3, n. 1, p. 1–57, 2009.

IZZA, S.; VINCENT, L.; BURLAT, P. Exploiting semantic web services in achieving flexible application integration in the microelectronics field.Computers in Industry, v. 59, n. 7, p. 722– 740, 2008. ISSN 0166-3615. Enterprise Integration and Interoperability in ManufacturingSystems.

LUDÄSCHER, B.et al.Managing scientific data: From data integration to scientific workflows.Geoinformatics: Data to knowledge, Geological Society of America, v. 397, p. 109, 2006.

STONE, D.et al.User Interface Design and Evaluation. Elsevier Science, 2005. (InteractiveTechnologies). ISBN 9780080520322.

XU, Y.et al.Component-based mediation services for the integration of medical applications.Artif. Intell. Med., Elsevier Science Publishers Ltd., GBR, v. 27, n. 3, p. 283–304, mar. 2003.ISSN 0933-3657.

 

1__rafael-rocha.jpg

Rafael Rocha

Mestre em Gestão & Organização do Conhecimento pela UFMG

Crio soluções de TI com foco em dados. Analista e Dev na UFMG. Mais de 15 anos de experiência profissional. Mestre em Gestão & Organização do Conhecimento pela UFMG