Aller au contenu principal

Glossaire

Annotation Web​

Annotation en ligne d’une ressource Web qui indique une connexion entre différentes ressources.

Art & Architecture Thesaurus (AAT)​

L’un des cinq vocabulaires Getty contenant des identifiants de ressources uniformes (URI) pour les termes génériques liés à l’art, à l’architecture et au patrimoine culturel visuel.

Base de données graphique​

Une base de données qui structure les informations sous forme de graphique ou de réseau, où un ensemble de ressources, ou nœuds, sont reliés entre eux par des arêtes qui décrivent les relations entre chaque ressource.

Base de données NoSQL​

Base de données modélisée d’une manière différente des relations tabulaires utilisées dans une base de données relationnelle, telle qu’une base de données de documents, un magasin clé-valeur, un magasin à colonnes étendues ou une base de données de graphes.

Base de données relationnelle​

Une base de données qui stocke les données sous forme de tableau (colonnes et lignes), où les colonnes contiennent des attributs de données (tels que les types de données), les lignes contiennent des « enregistrements » et les relations sont définies entre les tables à l’aide de règles.

Bord​

Une ligne qui relie un nœud à un autre dans une base de données de graphes, représentant une relation entre les nœuds.

Cadre de description des ressources (RDF)​

Une norme pour les données liées (LD) qui représente des informations dans une série d’«instructions» en trois parties appelées un triplet, qui comprend un sujet, un prédicat et un objet sous la forme sujet-prédicat-objet.

Cadre international d’interopérabilité des images (IIIF)​

Ensemble d’outils et de normes qui rendent les images numériques interopérables, fournissant une méthode normalisée de description et de diffusion d’images en ligne.

Carte des connaissances (ResearchSpace)​

Un outil de visualisation dans l’environnement ResearchSpace qui affiche les différentes entités de données dans le triplestore et comment elles sont connectées à d’autres entités de données.

Cartographie​

Processus conceptuel consistant à associer des valeurs ou des champs de métadonnées équivalents d’un schéma à un autre.

CIDOC CRM​

Une suite d’ontologies centrées sur les événements pour décrire les données dans le domaine du patrimoine culturel, développées pour relier des ensembles hétérogènes de données gérés par des musées, des galeries et d’autres institutions patrimoniales.

Classement​

Pour déclarer une entité comme étant une instance d’une classe en utilisant rdf:type dans l’ontologie choisie pour l’ensemble de données.

Consortium World Wide Web (W3C)​

Une communauté internationale qui travaille à développer des standards Web.

Conversion​

Le processus de modification des données d’un format à un autre.

Creative Commons (CC)​

Une organisation à but non lucratif qui fournit des licences gratuites afin que les gens puissent accorder une autorisation de droit d’auteur à leur travail de manière standardisée.

Cultural Objects Name Authority (CONA)​

L’un des cinq vocabulaires Getty contenant des identifiants de ressources uniformes (URI) pour les titres, les attributions des créateurs, les caractéristiques physiques et les sujets représentés concernant les œuvres d’art, l’architecture et le patrimoine culturel visuel.

Cypher​

Un langage de requête pour les bases de données de graphes qui reflète la nature sémantique des triplets mais le fait avec sa propre syntaxe et sa propre mise en forme.

Dactylographie​

Utiliser un chemin standardisé pour relier toute entité à un vocabulaire, thésaurus ou ontologie externe au sein de CIDOC CRM.

Date du TEI​

Données qui suivent les directives de la Text Encoding Initiative (TEI).

DBPedia​

Un projet qui crée des données structurées accessibles au public pour le cloud Données ouvertes et liés.

Déréférencable​

Adjectif utilisé en relation avec les URI (Uniform Resource Identifiers) qui peuvent passer d’une référence abstraite à quelque chose de plus concret, à savoir une ressource Web.

Désambiguïsation d’entité nommée (NED)​

Attribuer une identité unique à une entité dans un texte pour la différencier d’une autre entité qui partage le même nom.

Dewey Decimal Classification System (DDC)​

Un système de classification des bibliothèques couramment utilisé par les bibliothèques publiques et les petites bibliothèques universitaires pour organiser les collections imprimées.

Dispute​

Une série de raisons, d’énoncés ou de faits dans un schéma de métadonnées destinés à soutenir ou à établir un point de vue, plutôt qu’un énoncé neutre, qui décrit une personne, un événement ou un objet.

Domaine​

L’une des deux entités d’un triplet, représentant le sujet dans une relation sujet-prédicat-objet.

Données en langage naturel​

Données au format texte libre.

Données liées (LD)​

Données structurées qui sont liées à d’autres données via le Web et s’appuient sur des technologies Web standard pour partager des données lisibles par machine entre ordinateurs.

Données ouvertes​

Des données qui peuvent être consultées, utilisées et réutilisées par n’importe qui, sur la base de l’idée que les données doivent être librement accessibles à tous pour être vues et utilisées, sans restrictions de droit d’auteur.

Données ouvertes liées (LOD)​

Données liées et utilisant des sources ouvertes.

Données semi-structurées​

Données présentant une certaine structure, mais pas d’une manière permettant d’extraire facilement des entités et des relations sans travail manuel.

Données structurées​

Données sous forme de feuilles de calcul, de bases de données relationnelles, de fichiers JSON, de fichiers RDF et de fichiers XML.

Entité​

Une chose discrète, souvent décrite comme le sujet et l’objet (ou le domaine et la gamme) d’un triplet (sujet-prédicat-objet).

Espace de noms​

Un répertoire de concepts qui sont utilisés pour identifier et faire référence à des entités au sein d’un ensemble de données.

Expression régulière (Regex)​

Syntaxe pouvant être utilisée dans les langages de programmation pour rechercher, manipuler ou remplacer des modèles dans des textes.

Expressions de forme (ShEx)​

Un langage pour valider et décrire les structures de graphes RDF (Resource Description Framework).

Extraction de relations (RE)​

La tâche de détecter, classer et extraire les relations sémantiques d’un texte.

Fichier d’autorité​

Un fichier d’autorité est une liste qui contient la manière faisant autorité de référencer des personnes, des lieux, des choses ou des concepts, généralement sous la forme d’un en-tête ou d’un identifiant numérique.

Fichier d’autorité international virtuel (VIAF)​

Un service qui regroupe les catalogues de nombreuses bibliothèques nationales et divers fichiers d’autorité.

Fondation canadienne pour l’innovation (FCI)​

Une société sans but lucratif qui investit dans l’infrastructure de recherche des universités, des collèges, des hôpitaux de recherche et des établissements de recherche sans but lucratif du Canada.

Fondation Wikimédia​

L’organisation faîtière qui gère Wikipedia, Wikibase, Media Wiki, Wiktionary et d’autres projets et chapitres Wiki.

Frappe d’identificateur de ressource uniforme (URI)​

Processus de création d’un nouvel identificateur de ressource uniforme (URI) pour représenter une entité.

Gestion des données de recherche (RDM)​

Processus et activités exécutés par les chercheurs tout au long du cycle de vie d’un projet de recherche pour guider la collecte, l’organisation, la documentation, le stockage, l’accessibilité, la réutilisabilité et la préservation des données.

Graphique de propriété​

Un graphe où les relations (propriétés) entre les entités sont nommées et portent certaines propriétés définies qui leur sont propres, étendant la base de données de graphes de base des triplets liés pour montrer des connexions complexes qui décrivent comment différents types de métadonnées sont liés.

Graphique des connaissances​

Représentation d’un ensemble de triplets liés qui illustre les relations entre eux.

Graphique nommé​

Une extension du modèle de données RDF (Resource Description Framework) dans lequel un graphe RDF est identifié à l’aide d’un URI (Uniform Resource Identifier), permettant ainsi la publication et la présentation de métadonnées sur ce graphe dans son ensemble.

Humanités numériques (DH)​

Domaine scientifique dans lequel les outils et technologies numériques sont utilisés pour explorer les questions de recherche en sciences humaines.

HyperText Markup Language (HTML)​

Le langage de balisage standard pour les pages Web.

Iconography Authority (IA)​

L’un des cinq vocabulaires Getty contenant des identifiants de ressources uniformes (URI) pour les noms propres, les relations, les thèmes et les dates liés aux récits iconographiques, aux personnages légendaires ou fictifs, aux événements historiques, aux œuvres littéraires et aux arts du spectacle.

Identifiant de ressource internationalisé (IRI)​

Identifiant qui s’appuie sur le protocole URI (Universal Resource Identifier) ​​en élargissant le jeu de caractères autorisés pour inclure la majeure partie du jeu de caractères universel.

Identifiant de ressource uniforme (URI)​

Un moyen fiable et utilisable d’identifier une entité unique afin que plusieurs ensembles de données provenant de diverses sources puissent indiquer qu’ils font tous référence à la même chose.

Identificateur d’objet numérique (DOI)​

Type d’URI (Uniform Resource Identifier) ​​utilisé pour identifier de manière unique divers objets d’information universitaires, professionnels et gouvernementaux, tels que des articles de revues, des rapports de recherche, des ensembles de données, des publications officielles et des vidéos.

Inférence​

La découverte automatisée de nouveaux faits générés à partir de triplets existants.

Ingestion​

Processus par lequel les données sont déplacées d’une ou plusieurs sources vers une nouvelle destination où elles peuvent être stockées et analysées plus en détail.

Initiative de codage de texte (TEI)​

Un langage d’encodage qui prend en charge l’encodage détaillé de documents complexes et est largement utilisé par un certain nombre de différents projets d’humanités numériques (DH).

Institut d’été des humanités numériques (DHSI)​

Un institut annuel de formation en bourses numériques organisé à l’Université de Victoria.

Interface de programmation d’applications (API)​

Une bibliothèque de codes qui permet à des applications tierces de communiquer avec une plateforme de services Web.

Intervalle​

L’une des deux entités d’un triplet, représentant l’objet dans une relation sujet-prédicat-objet.

JSON​

Un format d’échange de données lisible par l’homme et la machine.

Laboratoire THINC​

Un espace à l’Université de Guelph qui soutient la recherche collaborative, interdisciplinaire et numérique en sciences humaines.

Langage d’ontologie Web (OWL)​

Un langage de représentation des connaissances pour les ontologies qui représente explicitement la signification des termes dans les vocabulaires et les relations entre ces termes, ainsi qu’entre les groupes de termes.

Langage de contraintes de formes (SHACL)​

Une norme pour décrire les graphes RDF (Resource Description Framework) et les valider par rapport à un ensemble de conditions.

Langage de requête structuré (SQL)​

Un langage de requête pour les bases de données relationnelles qui permet aux utilisateurs de spécifier quelles données renvoyer, quelles tables rechercher, quelles relations suivre et comment ordonner les données qui répondent à ces conditions définies.

Library of Congress Classification System (LCC)​

Un système de classification des bibliothèques couramment utilisé par les grandes bibliothèques de recherche et universitaires pour organiser les collections imprimées.

Littéral​

Un objet dans un triplet qui ne fait pas référence à une ressource avec un identificateur de ressource uniforme (URI), mais transmet à la place une valeur, telle que du texte, un nombre ou une date.

Localisateur de ressources uniforme (URL)​

Une déclaration qui décrit l’emplacement de quelque chose sur le Web spécifiquement pour localiser des actifs en ligne.

Metadata​

Informations structurées qui décrivent ou expliquent un objet d’information afin qu’il puisse être recherché, récupéré, contextualisé, validé, conservé ou géré.

Modèle de connaissances (ResearchSpace)​

Chemins de graphe prédéfinis qui résument les activités du monde réel à l’aide de classes et de propriétés dans l’environnement ResearchSpace.

Nœud​

Représentation d’une entité ou d’une instance à suivre dans une base de données de graphes ou un triplestore, telle qu’une personne, un objet ou une organisation.

Nœud vide​

Un sujet ou un objet dans un graphe RDF (Resource Description Framework) pour lequel un URI (Uniform Resource Identifier) ​​ou un littéral n’est pas donné.

Notice d’autorité​

Un identificateur de ressource uniforme (URI) stable et persistant pour un concept dans l’écosystème des données liées (LD).

Ontologie​

Modèle abstrait et lisible par machine d’un phénomène qui capture et structure la connaissance des entités, des propriétés et des relations dans un domaine afin qu’une conceptualisation puisse être partagée et réutilisée par d’autres.

Ontologie orientée événement​

Une ontologie qui utilise des événements pour relier les choses, les concepts, les personnes, le temps et le lieu.

Ontologie orientée objet​

Une ontologie qui utilise des objets pour relier des choses, des concepts, des personnes, du temps et des lieux.

Open Researcher and Contributor ID (ORCID)​

A not-for-profit organization that provides free Uniform Resource Identifiers (URIs) to researchers so they can be connected to their scholarship and bibliographic output.

Passage pour piétons​

Le processus conceptuel de cartographie des données entre les modèles de données.

Persistent Identifier (PID)​

Une référence durable à un document, un fichier, une page Web ou un autre objet numérique.

Point de terminaison SPARQL​

Emplacement sur Internet identifié par une URL (Uniform Resource Locator) et capable de recevoir et de traiter des requêtes SPARQL, permettant aux utilisateurs d’accéder à une collection de triplets.

Principes de CARE pour la gouvernance des données autochtones​

Un ensemble de principes (bénéfice collectif, autorité de contrôle, responsabilité et éthique) pour faire progresser les droits collectifs et individuels en matière de données dans le mouvement des données ouvertes.

Principes FAIR​

Un ensemble de principes (trouvable, accessibilité, interopérabilité et réutilisabilité) pour la gestion et la gestion des données et des métadonnées.

Profil d’application​

Un schéma composé d’éléments de métadonnées tirés d’un ou plusieurs espaces de noms, ainsi que des politiques et des directives liées à leur utilisation, préparé pour une application particulière.

Propriété​

Une relation spécifiée entre deux classes ou entités, comme le prédicat dans un triplet (sujet-prédicat-objet).

Protocole SPARQL et langage de requête RDF (SPARQL)​

Un langage de requête pour les triplestores qui traduit les données graphiques en données tabulaires normalisées avec des lignes et des colonnes.

Provenance​

L’historique de la propriété, de la garde ou de l’emplacement d’un objet décrit ou les données décrivant cet objet.

QName​

Chaîne abrégée utilisée pour remplacer une référence d’identificateur de ressource uniforme.

Quadruple​

Une extension d’un triplet pour inclure une quatrième section qui fournit un contexte pour le triplet, comme l’URI (Uniform Resource Identifier) ​​du graphe dans son ensemble (sujet-prédicat-objet-contexte).

Recherche SPARQL fédérée​

Un point d’entrée unique pour accéder aux terminaux SPARQL distants afin qu’un service de requête puisse récupérer des informations à partir de plusieurs sources de données.

Récit sémantique (ResearchSpace)​

Un document interactif dans l’environnement ResearchSpace qui combine une narration textuelle et des données liées (LD) pour communiquer des idées sur les personnes, les lieux et les événements.

Réconciliation​

Processus consistant à s’assurer qu’une entité dans un ensemble de données fait référence à un identificateur de ressource uniforme (URI) stable, idéalement à partir d’un espace de noms stable, pour rendre les données plus accessibles, interopérables et efficaces lors de la recherche, du stockage et de la récupération.

Reconnaissance d’entité nommée (NER)​

Processus d’identification et de catégorisation d’entités (un mot ou un ensemble de mots faisant référence à la même chose) dans un texte.

Reconnaissance optique de caractères (OCR)​

La conversion automatique d’images de mots en un fichier texte que les utilisateurs peuvent ensuite rechercher et modifier.

Réification​

Le processus de concrétisation d’un concept abstrait, comme prendre la notion d’une relation et la considérer comme une entité ou exprimer quelque chose à l’aide d’un langage de programmation, afin qu’il puisse être manipulé par programmation.

Schéma du cadre de description des ressources (RDFS)​

Une extension du vocabulaire RDF (Resource Description Framework) de base qui peut être utilisé pour définir le vocabulaire (termes) à utiliser dans un graphe RDF.

Sérialisation du cadre de description des ressources (RDF)​

Une syntaxe qui peut être utilisée pour écrire des triplets, y compris Turtle (TTL), XML (XML-RDF) et JSON.

Système d’organisation simple des connaissances (SKOS)​

Une norme qui fournit un moyen de représenter des thésaurus, des taxonomies et des vocabulaires contrôlés conformément au cadre de description des ressources (RDF).

Taxonomie​

Un système qui identifie les relations hiérarchiques entre les concepts au sein d’un domaine.

Thésaurus​

Un vocabulaire structuré qui montre les relations hiérarchiques, associatives et d’équivalence entre les concepts, afin que les utilisateurs trouvent non seulement des termes plus larges et plus étroits que d’autres, mais aussi des termes synonymes, antonymes ou autrement liés (associés) d’une manière définie.

Thesaurus of Geographic Names (TGN)​

L’un des cinq vocabulaires Getty contenant des identifiants de ressources uniformes (URI) pour les noms, les relations, les types de lieux, les dates et les coordonnées.

Traitement automatique des langues naturelles (TALN)​

Une branche de l’intelligence artificielle qui implique le traitement automatique et/ou la manipulation de la parole, du texte et d’autres formes de données non structurées qui représentent la façon dont les humains communiquent entre eux.

Tripler​

Une déclaration sous la forme sujet-prédicat-objet qui suit le cadre de description des ressources (RDF).

Triplestore​

Une base de données NoSQL qui stocke les triplets.

Turtle​

Un langage de balisage lisible par l’homme et la machine qui permet aux utilisateurs de sérialiser des triples.

Union List of Artist Names (ULAN)​

L’un des cinq vocabulaires Getty contenant des identifiants de ressources uniformes (URI) pour les noms, les relations et les informations biographiques concernant les personnes et les personnes morales liées à l’art, à l’architecture et à d’autres cultures matérielles.

Variable de requête​

Un proxy pour l’objet que vous recherchez lors de la construction d’une requête SPARQL.

Virtual Research Environment (VRE)​

Un espace de travail en ligne qui permet aux chercheurs de collaborer.

Vocabulaire​

Ensemble de termes pouvant être concrètement décrits dans une ontologie, une taxonomie ou un thésaurus.

Vocabulaire contrôlé​

Un arrangement standardisé et organisé de mots et de phrases, qui fournit une manière cohérente de décrire les données.

Web Annotation Data Model (WADM)​

Une norme pour le formatage et la structuration des annotations Web.

Web sémantique​

L’idée d’étendre le World Wide Web en incluant des descripteurs de données supplémentaires au contenu publié sur le Web afin que les ordinateurs puissent faire des interprétations significatives des données publiées.

WEMI​

Acronyme signifiant Œuvre, Expression, Manifestation et Élément—termes dérivant des Exigences fonctionnelles pour les notices bibliographiques (FRBR), qui est le principal moyen de décrire les notices bibliographiques.

Wikibase​

Une suite de logiciels de base de connaissances gratuits et open source pour stocker, gérer et accéder aux données ouvertes liées (LOD), écrites et utilisées par le projet Wikidata.

Wikidata​

La plus grande instance de Wikibase, qui agit comme un référentiel de stockage central pour les données structurées utilisées par Wikipédia, par ses projets frères et par quiconque souhaite utiliser une grande quantité de données ouvertes à usage général.

Wikimédia Commons​

Un référentiel de fichiers multimédias (images, sons et clips vidéo) qui met à disposition du domaine public et du contenu multimédia sous licence libre, et qui agit en tant que gestionnaire de ressources numériques pour tous les projets de la Wikimedia Foundation.

XML​

Un langage de balisage lisible par l’homme et la machine qui permet aux utilisateurs de créer leurs propres balises pour décrire les documents.