Data&Musée

Explorer les données de l'héritage culturel français

Données du CMN

[toc]

Le projet Data&Musée collecte un ensemble de données qui concernent notamment le Centre des Monuments Nationaux.

Cette page donne une description générale de ces données avec éventuellement des liens vers un accès aux données et un lien vers une page de description plus précise des données.

Les données ne sont pas toutes disponibles publiquement.

Liste des membres du CMN et données associées

FCMN1: Fichier excel listant les membres du CMN et les URL de sites web associés

https://ws49-cl4-nextcloud.tl.teralab-datascience.fr/index.php/s/gXoLffdLQG2dRso


Liste des jeux de données CMN enregistrés sur data.gouv.fr

FCMN2: liste des jeux de données CMN enregistrés sur data.gouv.fr au 3/10/2018, fichier CSV

https://ws49-cl4-nextcloud.tl.teralab-datascience.fr/index.php/s/3dnbcW3Bk8Bb5Wm

Il y a 8 jeux de données enregistrés dont les titres sont

  • Tarifs des prises de vues cinématographiques dans les monuments nationaux
  • Tarifs des prises de vues photographiques dans les monuments nationaux
  • Classement des monuments nationaux par catégorie: fichier Word difficile à exploiter automatiquement
  • Fréquentation des monuments nationaux (dernière mise à jour 2016)
  • Liste des publications des Editions du patrimoine
  • Activités d'accueil des tournages et filmographies dans les monuments nationaux
  • Liste des coordonnées GPS des monuments nationaux
  • Informations pratiques des monuments nationaux

Ces données ont des fréquences de mises à jour qui peuvent en limiter la portée. Par exemple, la dernière mise à jour des données de fréquentation date de 2016.


GPS des monuments nationaux

FCMN3: GPS des monuments nationaux

Ce fichier a été récupéré à partir de data.gouv.fr. Il s’agit d’un fichier ODS (OpenDocument) que nous avons traduit en CSV et en JSON. Ces données viendront compléter les données concernant les entités du CMN dans le graphe de connaissances en cours de constitution.

La version JSON du fichier:

https://ws49-cl4-nextcloud.tl.teralab-datascience.fr/index.php/s/naRCbxooGmwHPij


Monuments par catégories

FCMN4: monuments par catégories, fichier RDF/Turtle, prêt à insérer dans le graphe

A partir du fichier word Classement des monuments nationaux par catégorie référencé sur data.gouv.fr, divers traitements ont permis de produire un fichier TTL. Chaque monument y est représenté sur le modèle suivant:

dm:Arc_de_Triomphe dbpedia-owl:country dbpedia-fr:France ;

foaf:name "Arc de Triomphe"@fr ;

dm:categoryName "Monuments de catégorie A"@fr ;

dm:departmentName "Paris"@fr ;

dm:regionName "Paris / Ile-de-France"@fr .


Données pratiques (horaires, ...)

A partir du fichier FCMN1 ci-dessus, l’URL de base de chaque site web associé à un musée ou monument a été utilisée pour récupérer des informations pratiques (tarifs, heures et jours d’ouvertures…). On a composé une URL

<url de base du site>/generate_json

pour récupérer un fichier JSON contenant les informations.

Cela nous a permis de récupérer 91 fichiers contenant des informations pratiques. La traduction en graphe RDF est en cours, en s’appuyant sur les choix de représentation de Data Tourisme, afin d’avoir une cohérence avec ce projet.

Dossier contenant les 91 fichiers:

https://ws49-cl4-nextcloud.tl.teralab-datascience.fr/index.php/s/MKks3Cns85pcoTS

A noter:

  • quatre requêtes ont échouées (http://abbaye-charroux.fr/generate_json, http://fort-bregancon.fr/generate_json, http://hotel-de-sully.fr/generate_json, http://mapierrealedifice.fr/generate_json)
  • les informations sont très inégalement renseignées d’un lieu à l’autre
  • nous n’avons pas identifié de méthode permettant de savoir que les données ont changées pour un site; ce qui pourrait nécessiter de lire à nouveau ces informations assez fréquemment pour s’assurer d’être à jour; il pourrait y avoir une information de date comme 'dernière mise à jour' qui permettrait d'évaluer rapidement si quelque chose a changé

Données de Google Analytics

Un accès est ouvert sur les données de Google Analytics concernant les divers sites web du CMN.

L'exploitation de ces données n'a pas été approfondie au 3/3/2019. Plusieurs questions se posent:

  • de quel niveau d'historique dispose-t-on?
  • quelles informations sont accessibles par programme (API)?
  • parmi ces informations, lesquelles paraissent utiles pour Data&Musée?

Données de billetterie

Des données de billetterie ont commencé à être fournies sous forme de fichiers Excel.

Ces fichiers ont été traduits en json afin de faciliter leur intégration dans les processus de traitements ultérieurs.

Le graphe d'identifiant http://givingsense.eu/datamusee/onto/billetterie/cmn a été construit avec ces données, accessible sur le point d'accès SPARQL

https://ws49-cl4-jena.tl.teralab-datascience.fr/datamusee/sparql

L'accès en lecture à ce point d'accès est restreint, limité aux partenaires du projet.

Informations sur les données de billetterie du CMN au 16/4/2019

Période23/10/2013 au 13/9/2018
Transactions307247
Utilisateurs ayant fait plusieurs achats à des dates différentes14663
Utilisateurs ayant fait plusieurs achats191246

Les données de la ‘base monument’ listent des transactions sur le modèle suivant:

   {

       "Code-barres salé et hashé": "c1e2f93d057ec250421859ec015da5200ea4306d5da577d730f650a77ecc1f17",

       "Code salle": "127",

       "Salle": "Salses (contrôle accès)",

       "ValiditeDroitDateDebut": "2017-06-21 00:00:00",

       "ValiditeDroitDateFin": "2018-06-21 00:00:00",

       "DateHeurePassage": "2017-08-08 16:12:00"

   }

Les fichiers JSON sont dans le dossier:

https://ws49-cl4-nextcloud.tl.teralab-datascience.fr/index.php/s/EmDXySQnXEPAWMP

(lien privé)

Le champ  "Code-barres salé et hashé" renvoie au fichier suivant.

Les données de la base e-billet donnent plus d’informations. Chaque transaction est sur le modèle suivant:

'Code contact salé et hashé': '8536b1d1ddca09ab1379caa34b0ec2ef20c7068badce989845a5d9633ba0aa5e',

'Courriel bas de casse salé et hashé': 'c3d134f0ed020e43154c4b61501b1586ed75a9ebc31e23eab0547d5a8ef32806',

'Civilite': 'MME',

'Code postal': '68500',

'Ville (en capitale)': 'ORSCHWIHR',

'Code pays': 'FR',

'Pays': 'FRANCE',

'Acceptation être contacté(e)': 'O',

'Année de naissance': '1963',

'Code transaction salé et hashé': '4b3d381eeb79c55a27c51ca1d88ea01047500bb1dbc89464dee5a4a4444b49ab',

'Code vente salé et hashé': 'e95ac6e1afe75d83ed86acf97841fda3e8709b4f9a197f0aa4ed96de499dd104',

'Date et heure de vente': '2013-10-23 14:06:00',

'Identifiant national du monument': '127504',

'Nom du monument': 'CONCIERGERIE',

'Code-barres salé et hashé': '77533cadf7d8bb44e6071f8a9fd0c9ad7e3e2e3902fb8fda59a03bba2670196f',

'Code produit': '@01122',

'Libelle court produit': 'WEB IND Conciergerie PT',

'Prix unitaire': 9.5

La transformation en RDF facilitera les croisements avec d’autres données (livres d’or…) via l’id tiré du courriel, l'âge, les informations de localisation.

Les premiers traitements sur un jeu de données limitées montrent que

  • 29 personnes ont fait des contributions dans des livres d’or de Paris Musées et aussi fait des achats de e-billets au CMN (84 transactions, 25 français, 2 espagnols, 2 brésiliens)
  • 14663 personnes ont fait des achats sur le CMN à plusieurs dates différentes
  • 191246 personnes ont fait plusieurs achats sur le CMN (sur un total de 307247 transactions)

Liens avec le Web des Données (LOD)

Voir Données du LOD


Flux RSS

Des flux RSS ont été mis en place. Ils donnent accès à des informations sur l'actualité des lieux concernés: expositions, événements, activités...

Les urls de ces flux ne sont pas actuellement disponibles publiquement.

·        Arc de Triomphe

·        Conciergerie

·        Sainte-Chapelle

·        Panthéon

·        Château de Vincennes

·        Chapelle expiatoire

·        Hotel de la Marine

·        Palais Royal

·        Hotel de Sully

·        Bastille

·        Tour de Notre-Dame

·        Maison des Jardies

·        Domaine de St-Cloud


Données de Livres d'Or

Des données de livre d'or électronique sont accessibles à partir de 2018 (par les partenaires du projet). Les données de 2019 n'ont pas encore été observées.

Pour 2018, nous avons les éléments suivants:

Nombre de contributions10754 (total)9250 (fr)1007 (en)395 (es)
Contributions multiples78

Exemple de présentation: contributions par semaine

Commentaires Clos.