Découverte de cardinalités maximales significatives dans des bases de connaissances
Revue Ouverte d'Intelligence Artificielle, Post-actes de la Conférence Nationale en Intelligence Artificielle (CNIA 2018-2020), Volume 3 (2022) no. 3-4, pp. 223-251.

Les bases de connaissances du web sémantique sont générées à partir de plateformes collaboratives ou d’intégration de sources diverses. Cela entraîne évidemment des manques d’information et des erreurs ou incohérences. De plus, dans les programmes d’extraction de connaissances à partir de ces sources il est erroné de considérer que l’absence d’une information dans la base de connaissances équivaut à son inexistence, il faut donc munir la source interrogée d’informations complémentaires permettant de déterminer quand une relation interrogée peut être considérée comme complète. Le volume important de certaines bases nous permet d’utiliser l’inégalité de Hoeffding pour en extraire des règles de cardinalité significatives. Les expérimentations menées sur DBpedia et sur une base de connaissances numismatiques démontrent la faisabilité de l’approche et la pertinence des contraintes extraites.

Big semantic web knowledge bases (KB) are generated from collaborative platforms or by integration of various sources. This naturally induces lack of information, and inconsistencies. Moreover, missing data must not be considered as non existing data. Applications that query these KB’s content need complementary information to decide whether the queried data is complete. Based on KB’s volume, it is possible to discover such kind of information. We present an algorithm for extracting significant maximum cardinality rules from a knowledge base. We use Hoeffding’s inequality to define the likelihood for a constraint to be significant. Experiments conducted on DBpedia and on a numismatic knowledge base resulting from an integration process demonstrate the feasibility of the approach and the relevance of the discovered contextual constraints.

DOI : 10.5802/roia.30
Mots-clés : Découverte de cardinalité, contraintes contextuelles, bases de connaissances.
Keywords: Cardinality Mining, Contextual Constraints, Knowledge Base.

Arnaud Giacometti 1 ; Béatrice Markhoff 1 ; Arnaud Soulet 1

1 Université de Tours - LIFAT, Blois, France
Licence : CC-BY 4.0
Droits d'auteur : Les auteurs conservent leurs droits
