Data&Musée

Explorer les données de l'héritage culturel français

Remarques sur la dimension temporelle dans les graphes de connaissances

Je parle ici de bases de connaissances basées sur la représentation RDF. Une question qui revient souvent est l'expression d'une qualification temporelle qui s'applique à un fait (exprimé par un triplet RDF).

Par exemple, le fait suivant, exprimé de façon non rigoureuse:

(Pablo Picasso, marié à, Olga Khokhlova)

Ce fait n'est évidemment vrai qu'à partir d'une certaine date. Picasso n'était pas marié dès sa naissance. On doit donc introduire un 'fait' au sujet du fait précédent:

((Pablo Picasso, marié à, Olga Khokhlova), à partir de, 1918)

Cela peut s'exprimer avec la technique de réification (explications). On peut l'exprimer grâce aux extension introduites par RDF* (RDF star) et exploitables avec SPARL*.

On trouve aussi d'autres façons d'introduire une dimension temporelle dans des triplets.

Par exemple, la classe 'country' de Wikidata a une sous-classe 'historical country'. Cela permet d'introduire une précision sans utiliser la réification. Par exemple, au lieu d'utiliser

(USSR, est une instance de, country)

qu'on peut considérer comme actuellement faux ou au moins imprécis, on introduira

(USSR, est une instance de, historical country)

Lors de la production de l'article "Rule Mining for Semantifiying Wikilinks" avec Luis Galaragga, nous avons généré des triplets par une méthode de recherche de règles s'appliquant sur un ensemble de triplets. Le taux de triplets produits vrais était bon. Mais une observation des triplets erronés a montré des séries récurrentes d'erreurs basées sur un même modèle. Par exemple:

(joueur de foot xxx, est membre de, equipe yyy)

qui était faux au moment où il était produit, alors que l'ensemble des triplets sur ce modèle pouvaient être remplacés par des triplets exploitant une propriété introduisant une dimension temporelle qui élargit la portée de la propriété initiale:

(joueur de foot xxx, est ou a été membre de, equipe yyy)

Les triplets qui étaient vrais avec la propriété initiale le restent, tandis que de nombreux triplets qui étaient faux avec la propriété initiale deviennent vrais.

Commentaires Clos.