Data&Musée

Explorer les données de l'héritage culturel français

Guestviews data

Initially, about 30,000 comments from guestbooks were obtained for the years 2016, 2017, 2018. They come from entities of Paris Museums. In addition to comments, we sometimes have a pseudonymized username, age, country of origin, language, department if it comes from France.

A loading of new data is done whenever necessary. This operation has been automated.

See the document Data Layout Guestviews (Private) for more details.

Opinion analysis tests were started (as of 3/10/2018) to estimate whether the comment appears positive, negative or neutral (or not determined).

The data collected with the API is stored on Teralab/NextCloud in the Sources shared folder, subfolder SourceGuestviews/ParisMusees. Pseudonymized data is in json files per year (2016, 2017, 2018).

A TTL subfolder contains an RDF translation of these same data so that it can be incorporated into knowledge graphs.

https://ws49-cl4-nextcloud.tl.teralab-datascience.fr/index.php/apps/files/?dir=/Sources/SourceGuestviews&fileid=129

Author: Moissinac

Maitre de conférence à Télécom Paris, Département Image, Données, Signal - Groupe Multimédia Jean-Claude Moissinac a mené des recherches sur les techniques avancées pour la production, le transport, la représentation et l’utilisation des documents multimédia. Ces travaux d'abord ont évolué vers la représentation sémantique de données liées au multimédia (process de traitement de médias, description d'adaptations de média, description formelle d'interactions utilisateurs). Aujourd'hui, les travaux portent sur la constitution de graphes de connaissances. Principaux axes de recherche actuel : représentations sémantiques de connaissances, constitution de graphes de connaissances, techniques d'apprentissage automatique sur ces graphes

Comments are closed.