Los triplestores o almacenando la semántica del conocimiento (I)

Icono semántico del HTML5

Como no podía ser de otra manera, la página para triplestores de la wikipedia nos indica que son un sistema de almacenamiento y búsqueda de triples, siendo un triple, una entidad de datos compuesta por un sujeto, un predicado y un objeto.

Esta estructura, si bien muy conocida para todos los iniciados en la materia, puede despertar alguna duda para los que, como a mí me ocurrió en su momento, se enfrentan a algo teóricamente conocido pero en un ambiente novedoso.

En dicho caso podemos decir, como norma general, que es una frase simple, en la que, con predicado, nos referimos al verbo y sus complementos inmediatos, y con objeto, al resto de los complementos circunstanciales.

De esta manera, hemos explicado los triplestores, como BBDD (bases de datos para almacenar y buscar) de frases simples, extendiendo el concepto base de almacenamiento de información, con la posibilidad de relacionar dicha información en la propia estructura, adjuntando un verbo que la dote de un sentido.

De esta manera, por ejemplo, podremos manejar información de personas, no tratando sus datos personales de forma aislada e intentando inventar formas de relacionarlas, sino directamente, almacenando de estructuras del tipo:

  • Sujeto                                   | Predicado                  | Objeto
  • Wolfgang Amadeus Mozart | nació en                     | Salzburgo
  • Karl Thomas Mozart            | es hijo de                   | Wolfgang Amadeus Mozart
  • Ludwig van Beethoven        | está relacionado con | Wolfgang Amadeus Mozart

Las cuales son mucho más cercanas a nuestro lenguaje natural y en la que atomizamos enormemente las formas de información a los que accedemos.

Estos triplestores tienen  mucho que ver con idea de Web Semántica perteneciente a la Web 3.0, con el lenguaje RDF  y su sintaxis RDF/XML, con los requisitos funcionales del almacenamiento de registros bibliográficos de la IFLA o FRBR o con los lenguajes de búsqueda semántica como el SPARQL o el iTQL de Mulgara.

Resource Description Framework

De esta manera podemos ver que, simplemente arañando la superficie de este tipo de herramientas, nos surgen infinidad de conceptos, tanto genéricos como específicos, que están en auge en la actualidad y que se entrelazan en múltiples puntos.

A lo largo de las próximas semanas iremos desgranando poco a poco cada uno de ellos para intentar responder a cuestiones como: las ventajas e inconvenientes de los triplestores y las bases de datos relacionales, los tipos de triplestores nativos y extendidos, la relación entre los triplestores y el lenguaje RDF, así como otras que se nos planteen en su momento.

Compartir este artículo