Le rapport d’activité 2018

Hupao « Dreaming of the Tiger », Spring in Hangzhou, China. Crédits : Sh1019 [Wikimedia Commons, CC BY-SA 3.0].

Chaque année le Centre du réseau Sudoc-PS Paca/Nice rédige un rapport d’activité dans le cadre de la convention sur objectifs Sudoc-PS signée avec l’ABES. Vous pouvez consulter ici le rapport d’activité 2018.

Les points forts présentés dans ce rapport sont :

  • La 6e Journée annuelle du Réseau : organisée à la Bibliothèque Louis Nucéra (BMVR) à Nice le 6 novembre 2018, elle a réuni 54 participants venus de 28 bibliothèques du réseau.
  • L’équipe du Centre Régional a profité de cette journée de rencontre pour présenter une première version de l’outil d’analyse des collections (partie sur les unica), répondant aux objectifs annoncés dans la convention 2018-2020 avec l’ABES. Une table ronde autour de 3 projets régionaux de numérisation de collections était également organisée.
  • Grâce à l’utilisation de Colodus par les bibliothèques du réseau, le chiffre des nouveaux titres de périodiques localisés par notre réseau dans le Sudoc est en hausse de 15 %. Le signalement des unica a augmenté de 3 %.
  • L’outil Cidemis va prendre une importance toute particulière prochainement dans le cadre de notre projet de valorisation des collections du réseau. En effet nous allons enrichir les notices bibliographiques du catalogue national Sudoc avec les données produites par le réseau, et notamment attribuer un numéro ISSN à chaque notice de périodique qui entre dans notre cadre de travail.

Le rapport présente également les objectifs pour l’année 2 de la convention 2018-2020 signée entre le CR et l’Abes, et notamment les prochaines étapes du projet de valorisation et visualisation des données du CR.

Merci à toutes et à tous pour votre participation active au réseau Sudoc-PS PACA/Nice !

 

Le Centre Régional de Documentation Occitane

L’équipe Sudoc-PS a visité le Centre Régional de Documentation Occitane (CRDO) à la Médiathèque de Mouans-Sartoux en février. Nous avons été accueillis par Michel Gourdon, principal initiateur de la création du fonds occitan et son responsable actuel.

Le CRDO a été créé en 1981. Il est géré par le Centre d’Activités culturelles occitanes, association créée à Mouans-Sartoux en 1977, dont la vocation est la reconnaissance et la mise en valeur de l’identité culturelle occitane. Si vous l’ignoriez, l’occitan est une langue romane qui regroupe six grands dialectes : l’auvergnat, le gascon, le languedocien, le limousin, le provençal et le vivaro-alpin. Il est parlé dans le tiers sud de la France, les Vallées occitanes et Guardia Piemontaise en Italie, le Val d’Aran en Espagne.

Parçans e regions d’Occitània. Pèir Eravathnauta [CC BY-SA 4.0]

Le CRDO regroupe la documentation sur le domaine occitan de Bordeaux à Nice et également les vallées occitanes d’Italie. Les fonds sont actuellement hébergés dans les locaux de la Médiathèque de Mouans-Sartoux : les ouvrages édités après 1960 sont en accès direct dans la salle (classement Dewey) ; les ouvrages anciens, les périodiques et les photos sont conservés dans les réserves et consultables sur rendez-vous en contactant Michel Gourdon. La totalité du fonds est en consultation sur place et les collections sont décrites via le logiciel Filemaker et consultables en ligne via ce lien.

Le fonds du CRDO est composé de :

  • Plus de 7000 ouvrages, publiés entre XVIIème siècle et aujourd’hui, aux thématiques variées (littérature, histoire, géographie, sociologie, ethnologie, art, pastoralisme, généalogie, etc.)
  • 746 titres de périodiques, en occitan, catalan, piémontais ou français. La plupart des titres ont été dépouillés et font l’objet d’une fiche bibliographique dans le fichier général du CRDO.
  • 3500 photos anciennes (1890-1960) sur l’ensemble du département des Alpes-Maritimes, le Var et les Alpes de Haute Provence.
  • Un fichier de plus de 30 000 toponymes du département des Alpes-Maritimes. Les noms de lieux ont été recueillis dans les documents d’archives (XII – XIXème siècle) ou dans les enquêtes orales. Le fichier est régulièrement enrichi de nouveaux toponymes relevés au fil des recherches.
  • Un fichier d’auteurs occitans (près de 420 auteurs) avec, pour chaque auteur, une fiche avec la photo, une courte biographie et la liste de ses principaux ouvrages et articles publiés dans les revues.

Ce fonds très riche a pu être créé grâce à l’aide de la commune, de la région, du CNL (Centre national du livre) et, bien sûr, aux dons de particuliers (Claude Barsotti, Gérard Gouiran, Paul Castela, Sylvain Joseph, Michel Gourdon et autres).

Un grand merci à Michel Gourdon qui nous a chaleureusement accueilli et a partagé avec nous sa passion pour l’histoire locale, si importante dans un monde toujours plus tourné vers l’avenir et la modernité.

Centre Régional de Documentation Occitane. Photo E. Rauzy.

 

Le Centre de documentation de l’Institut européen de Nice

Centre de documentation de l’Institut européen. Photo E. Rauzy

Dans le cadre de nos visites aux établissements du réseau Sudoc-PS, notre équipe a visité fin janvier le Centre de documentation de l’Institut européen, 81 rue de France à Nice.

Le Centre de documentation comprend un fonds spécialisé dans les relations internationales, l’intégration européenne, et le fédéralisme. Les étudiants ont à leur disposition plus de 6 000 ouvrages, de nombreux périodiques d’actualité, des périodiques en ligne, des mémoires d’étudiants, ainsi que des dossiers thématiques en ligne.

L’IE·EI, Institut européen·European Institute, est un département du CIFE (Centre international de formation européenne), établissement d’enseignement supérieur privé enregistré auprès de l’Académie de Nice.

Cet établissement s’attache à :

  • L’excellence académique
  • La professionnalisation
  • L’interdisciplinarité
  • Le multiculturalisme
  • La tolérance
  • Étudier et vivre en Europe : le cursus des étudiants est partagé entre Nice, Canterbury, Berlin, Rome, Istanbul ou Tunis (selon la filière choisie).

La 1ère promotion date de 1964, à Nice. Depuis, environ 2000 étudiants venus d’une centaine de pays ont obtenu leur diplôme. Ils sont désormais au service d’institutions européennes, d’organisations internationales, d’organisations non gouvernementales, d’universités, d’administrations publiques et d’entreprises.

Le Diplôme des Hautes Études Européennes et Internationales (DHEEI) s’adresse à des étudiants ayant terminé un 1er cycle d’études (Bac+3) et son objectif est de donner une vision des problèmes politiques, sociaux, économiques et culturels du monde d’aujourd’hui. Il est accessible sur dossier. Pour chaque filière, le programme d’études dure 1 an (avec production d’un mémoire) et se déroule dans plusieurs villes européennes. Les étudiants sont souvent inscrits dans la bibliothèque des campus qu’ils sont amenés à fréquenter durant leur cursus.

 

La Bibliothèque spécialisée du Musée d’Anthropologie préhistorique de Monaco

L’équipe du Sudoc-PS a visité la Bibliothèque spécialisée du Musée d’Anthropologie préhistorique (M.A.P.) de Monaco en décembre 2018. Cette bibliothèque fait partie du réseau depuis les origines, dans les années ’80. Nous avons été accueillis par François Burle[1] et Elena Rossoni-Notter[2] qui ont eu l’amabilité de rédiger un texte de présentation de leur établissement, retraçant son histoire de 1902 à 2018.

Mapmc [CC BY-SA 4.0], from Wikimedia Commons

La Bibliothèque du Musée d’Anthropologie préhistorique voit le jour à Monaco en même temps que le premier Musée d’Anthropologie préhistorique, fondé officiellement en 1902 sous l’impulsion du Prince Albert Ier. Spécialisée, sa fonction principale consiste à conserver et mettre à disposition des demandeurs (e.g. chercheurs internationaux, scientifiques et étudiants) toutes les publications en lien avec les recherches en Préhistoire-Archéologie.

Depuis sa création, de nombreux ouvrages sont venus enrichir le fonds existant. La bibliothèque inventorie à ce jour un fonds précieux, des monographies internationales, des actes de colloques et de congrès, des publications scientifiques, des périodiques, des revues et des magazines sur la recherche scientifique (français et étrangers), la géologie, la spéléologie, l’archéologie et la préhistoire, ainsi que des périodiques et des magazines sur l’actualité culturelle de Monaco.

Le M.A.P. est par ailleurs éditeur depuis 1954 ; il publie chaque année un bulletin scientifique constitué d’articles multilingues de référence, soumis à un comité de lecture international (reviewer).

Un système d’échange d’ouvrages a été mis en place avec des bibliothèques, des universités, des laboratoires et des associations afin de diffuser ces revues (n°58 en 2018) et Hors-séries (n=7). La Bibliothèque du Musée comptabilise à ce jour 134 institutions abonnées (i.e. 31 françaises et 103 internationales) en plus de ses ventes auprès de libraires et de particuliers.

En parallèle des travaux récents d’inventaire, de classification de conservation et de (re)conditionnement, un intérêt particulier a été apporté à la numérisation des ouvrages précieux/ anciens et autres documents-archives, à des fins de sauvegarde et de consultation. Une grande partie des bulletins du M.A.P. (premiers numéros) ont en ce sens également fait l’objet de numérisation.

Bulletin MAP No 58

Le M.A.P. accueille tous étudiants et stagiaires intéressés par la recherche, la communication/médiation et les archives.

[1] Commis-Archiviste, Musée d’Anthropologie préhistorique de Monaco, 56 bis bd du Jardin exotique, 98 000 Monaco, fburle@gouv.mc

[2] Directeur, Chercheur-Archéologue, Musée d’Anthropologie préhistorique de Monaco, 56 bis bd du Jardin exotique, 98 000 Monaco, erossoni-notter@gouv.mc

Presse numérisée : quelles sont vos attentes ?

Les journaux collectent des informations sur les événements culturels, politiques et sociaux d’une manière très détaillée. Ils ont toujours été un moyen important pour la diffusion des opinions, des œuvres littéraires, des essais et de l’art. Cette richesse thématique les met au centre des préoccupations de quiconque s’intéresse au patrimoine culturel.

Alors que la demande d’accès aux journaux historiques est de plus en plus importante, tant par le grand public que par les nombreux chercheurs qui utilisent ce type de ressources, des millions de pages de journaux conservés dans des bibliothèques européennes ont été numérisés et sont disponibles en ligne, tandis que les bibliothèques nationales intensifient leurs efforts en matière de numérisation.

Dans le cadre du projet NewsEye, a Digital Investigator for Historical Newspapers, la Bibliothèque nationale de France, la Bibliothèque nationale d’Autriche, et la Bibliothèque nationale de Finlande s’associent pour lancer une grande enquête européenne qui vise à déterminer comment les usagers consultent les collections de presse numérisées, ainsi que leurs souhaits quant aux fonctionnalités de recherche.

L’objectif de ce projet est d’offrir aux chercheurs comme au grand public un meilleur accès à la presse historique (1850-1950) sous forme numérique et dans toutes les langues.

Vous pouvez aider en répondant à l’enquête en ligne et/ou en la signalant à vos usagers. Ce questionnaire s’adresse aux utilisateurs réguliers de la presse numérisée : il cherche à cerner les habitudes d’usage, de recherche, mais aussi les améliorations qui pourraient être utiles. N’hésitez pas à faire passer l’information, c’est le moment d’exprimer vos souhaits !

Photo Milner Moshe, GPO. http://www.flickr.com/people/69061470@N05 [CC BY-SA 3.0, via Wikimedia Commons]

Le projet NewsEye est financé par le programme cadre de recherche et innovation Horizon 2020 de l’Union européenne. Son but est d’améliorer l’accès aux contenus numérisés, mais aussi les possibilités de recherche à l’intérieur des bibliothèques numériques.

 

Retour sur la 6e Journée annuelle du Sudoc-PS Paca/Nice (novembre 2018)

Portrait. Thomas Leth-Olsen (Flickr, CC BY 2.0).

La 6e Journée annuelle du Centre du Réseau Sudoc-PS PACA/Nice s’est déroulée le mardi 6 novembre dernier. Nous étions reçus par la Bibliothèque Louis Nucéra (Bibliothèque Municipale à Vocation Régionale de Nice), où de nombreux collègues se sont mobilisés pour nous offrir le meilleur accueil. Merci à eux/elles !

La journée a rassemblé 54 participants venus de 28 établissements des Alpes-Maritimes, du Var, et de Monaco.

Après une présentation des actualités du Réseau, nous avons fait un point d’étape sur le projet de développement de notre interface de visualisation des données du réseau, pour une amélioration du signalement et une valorisation des collections de presse locales rares (unicas) et anciennes. Nous avions exposé les contours de ce projet lors de la Journée annuelle 2017, et depuis 3 billets ont été publiés sur ce blog pour vous tenir au courant de son évolution. Vous pouvez vous reporter au tout dernier billet (3/5) pour la synthèse de ce qui a été dit le 6 novembre.

Ensuite, les participants ont pu assister à une table ronde « retours d’expériences » autour de 3 projets régionaux de numérisation de collections :

Chaque intervenant a pu aborder les questions de choix et de préparation des collections, de procédure en lien avec le prestataire, de mise à disposition du public via une interface en ligne, etc.

L’après-midi, les participants ont pu visiter les locaux de la Bibliothèque Nucéra (Tête carrée, salles de lecture, bibliobus, magasins et collections…), mais aussi la Bibliothèque d’étude et du patrimoine Romain Gary (bd Dubouchage), tout récemment rénovée.

Toute l’équipe du Centre du Réseau Sudoc-PS Paca/Nice espère vous retrouver nombreux lors de notre prochaine édition en 2019 !

Pour ceux/celles qui ne l’ont pas encore complété, notre enquête de satisfaction est toujours accessible. Vous pouvez aussi exprimer vos souhaits de thématiques à aborder pour la prochaine Journée Sudoc-PS. Merci d’avance !

 

3/5 : Enrichir et faire parler les données du CR : la première brique est posée !

… et a été présentée à l’ensemble des bibliothèques du réseau à l’occasion de la journée annuelle du Centre du Réseau Sudoc-PS PACA/Nice le 6 novembre dernier. Cette journée fera l’objet d’un compte-rendu détaillé très prochainement sur ce blog, mais d’ici là arrêtons-nous un peu plus en détail sur l’application telle qu’elle commence à se dessiner.

Parce qu’il faut bien commencer quelque part, nous avons choisi de nous concentrer tout d’abord sur la mise à disposition du réseau d’une application « professionnelle » qui, par le biais notamment de la visualisation, se positionne comme un outil d’aide à la gestion des collections à destination des bibliothèques du réseau, et d’aide à la décision relative à cette gestion, notamment en apportant une vision consolidée de données relatives aux périodiques.

En cohérence avec l’axe « Valorisation des collections » de la convention 2018-2020 qui guide l’activité de notre Centre du Réseau Sudoc-PS PACA/Nice, l’application propose des points d’entrée ciblés dans la masse des 13 300 titres de périodiques du périmètre du CR, c’est-à-dire des accès via des sous-corpus pré-déterminés que sont les unicas et la presse locale ancienne (pour commencer, d’autres viendront peut-être plus tard). Pour rappel, l’objectif final est de valoriser ces sous-ensembles, et parallèlement de travailler très précisément sur la qualité de leur signalement.

Du point de vue des bibliothèques du réseau, les vues proposées dans l’interface sont censées leur permettre de répondre à 2 types de questionnement :

  • identification : quels sont mes unicas (ou mes titres de presse locale ancienne) et comment puis-je les récupérer facilement ? En l’état, cette étape d’identification du périmètre et de collecte des données peut se révéler quasi impossible pour les bibliothèques (en tout cas sous forme automatisée). En tant qu’intermédiaire entre l’ABES (et la BnF pour la presse locale) qui exposent les données sous des formes variées (interfaces publiques, données en rdf, web services, SRU…) et les bibliothèques du réseau qui possèdent et gèrent les collections, le CR collecte les données en amont (voir ce billet pour la récupération des données des unicas) et les redistribue dans l’application.
  • analyse : comment appréhender la nature de ces corpus (nombre de titres, répartition territoriale, etc) ? Comment disposer de manière consolidée un maximum de données relatives à mes titres de périodiques ?

Cette page de l’application présentant la liste des 1147 unicas du CR avec un filtre par bibliothèque et un moteur de recherche est une première réponse.

A noter : au moment de l’export des données au mois d’avril dernier via le service en ligne SelfSudoc de l’ABES, le nombre d’unicas était de 1147. Aujourd’hui il est de 1176, ce qui soulève la question de la fréquence de mise à jour des données quand l’interface sera en production.

 

Mais il nous a aussi paru essentiel d’expérimenter une visualisation consolidée, fluide et dynamique de ce qui fait la spécificité de la description des périodiques, à savoir l’ensemble des filiations liées à chacun des titres et les localisations afférentes (ainsi que les états de collection via Périscope). Là encore l’idée est de fournir une visualisation qui permette de répondre rapidement à la question : si je possède une revue, quelle est sa continuité (territoriale notamment) de conservation sur toute son histoire et ses variantes ?

La réponse est une visualisation en graphe de la grappe des notices en lien avec chaque titre (par les zones 4XX de la notice, enfin plus précisément les propriétés équivalentes de la modélisation en rdf), à l’image de ce que renvoie le web service métarevues, mais avec une touche d’interaction : au survol de chaque nœud représentant une notice liée à la notice de départ par une relation de type « Suite de », « Devient », etc, les localisations correspondantes s’affichent, et surtout chaque clic sur chaque nœud déploie à son tour le graphe des notices liées, permettant ainsi de naviguer dans l’ensemble de la filiation qui caractérise l’histoire de la revue (comme montré dans la captation ci-dessous).

L’application est en développement mais une version bêta est néanmoins déployée sur la plateforme Cloud Heroku, et consultable ici : https://sudocpsproapp.herokuapp.com

Des améliorations restent à apporter au niveau graphique mais le principe est là, et il nous a semblé qu’il pouvait être intéressant de le proposer au-delà du contexte du CR PACA/Nice. C’est pourquoi nous l’avons également développé sous la forme d’une extension pour le navigateur Firefox téléchargeable sur le Marketplace des Add-ons Firefox ici https://addons.mozilla.org/fr/firefox/addon/sudocfiliation/.

Une fois installée, l’extension interagit uniquement dans l’interface publique du Sudoc lorsqu’on affiche une notice de périodique. Un onglet « Afficher/masquer le graphe » s’ajoute au menu de navigation, qui permet de proposer dans l’interface publique du Sudoc le même type de graphe dynamique.

Concernant l’application, les prochaines étapes sont les suivantes :

  • proposer un volet de visualisation lié à la qualité des données de signalement, en jointant l’accès par corpus à la visualisation sur la qualité de ces groupes de notices (sur ce modèle mais en plus abouti)
  • proposer des fonctionnalités d’export de lots de notices (donc probablement ajouter un module d’authentification)
  • développer la partie liée au corpus presse locale ancienne, et représenter les jointures entre les 2 corpus

Le point technique

  • réalisée avec le framework Angular
  • Environnement Node.js
  • créée avec le générateur d’application Yeoman
  • utilise Grunt en task runner
  • graphe réalisé avec la librairie vis.js

Une fois finalisé, le code source de l’appli sera évidemment disponible sur Github.

Le code source de l’extension pour Firefox est ici.

6e Journée du réseau SUDOC-PS Paca/Nice, le mardi 6 novembre 2018

Portrait. Thomas Leth-Olsen (Flickr, CC BY 2.0).

A vos agendas ! La 6e Journée des bibliothèques du réseau SUDOC-PS du Centre régional PACA/Nice aura lieu le mardi 6 novembre 2018, de 9h à 16h30. Vous êtes cordialement invité·e·s à participer à cette journée d’information et d’échanges sur les actualités du Centre Régional et nos pratiques professionnelles.

Cette année c’est la Bibliothèque Municipale à Vocation Régionale (BMVR) qui nous accueille. La journée se déroulera à la Bibliothèque Louis Nucéra, 2 place Yves Klein à Nice.

La matinée sera consacrée aux informations professionnelles. L’après-midi, 2 visites guidées sont prévues : la bibliothèque Louis Nucéra et la Bibliothèque patrimoniale Romain Gary (21 boulevard Dubouchage), actuellement en cours de rénovation.

Déroulement de la journée :

9h00 : Accueil des participants à la Bibliothèque Nucéra autour d’un café et de viennoiseries.
9h30 : Début des interventions. Introduction de la Journée. Actualités du Centre Régional et du réseau.
10h10 : Avancement du projet de visualisation des données du réseau Paca/Nice.
Pause
11h10 – 12h30 : Table ronde autour de 3 projets régionaux de numérisation de collections :
* projet de la Société d’études scientifiques et archéologiques de Draguignan et du Var, avec la BNF et Gallica
* projet du Service Commun de la Documentation de Nice
* bibliothèque numérique d’Aix-Marseille : Odyssée – focus sur les corpus de périodiques
12h30 – 14h : Pause déjeuner (buffet offert).
14h : Deux visites guidées en alternance, par groupes : Louis Nucéra (magasins de périodiques, fonds locaux, Tête carrée) et Romain Gary (bd Dubouchage).
16h30 : Fin de la Journée.

Précision importante pour l’accès le matin : la Bibliothèque L. Nucéra ouvre ses portes à 10h les mardis. A 9h l’entrée des participants se fera du côté de l’auditorium, boulevard Risso (en face du n°60 et de l’hôtel Campanile).
Accès en transports publics : tramway ligne 1, arrêt Garibaldi. Lignes de bus : 4, 7, 9, 10, 17, 22, 30.
Parking payant le plus proche : Parking Promenade des Arts.

Pour faciliter l’organisation de cette rencontre, merci de bien vouloir confirmer votre participation auprès de sudocps-scd@unice.fr avant le 6 octobre.

N’hésitez pas à nous contacter pour toute demande de renseignements complémentaires.

 

Le Centre de recherche et de ressources du sport, au Musée du Sport de Nice

Musée National du Sport (photo E. Rauzy)

Le Musée national du Sport a été créé en 1963. A l’origine basé à Paris, il est maintenant installé à Nice depuis 2014, sous le stade Allianz Riviera (6 boulevard des Jardiniers). Ce musée comprend également un Centre de recherche et de ressources du sport, à disposition du public.

Ce centre de documentation est ouvert sur rendez-vous aux chercheurs et au grand public. Il dispose d’une grande salle de travail pour la consultation des documents (sur place uniquement). Les demandes de recherches envoyées par mail sont également traitées.

Le Centre a pour missions principales :

  • la collecte et la conservation de la documentation et des archives du sport,
  • la valorisation de ce patrimoine sportif (expositions, publications),
  • la promotion et la diffusion de la recherche sur le fait sportif (publications et colloques).

Les collections développent tout particulièrement les thématiques de l’histoire du sport français du XIXème siècle à nos jours, et la sociologie du sport.

Quelques chiffres :

  • 18 000 ouvrages
  • 1100 périodiques (équivalent à 150 000 fascicules), dont quelques abonnements en cours
  • 100 000 photographies
  • 1000 films anciens

Un important travail de rétroconversion et d’inventaire des fonds a été mené à bien avant le déménagement à Nice, pendant plusieurs mois. Plusieurs bases de données internes décrivent les collections d’ouvrages, de périodiques, de photos. Un magasin entier est consacré à la conservation des documents, dans de très bonnes conditions physiques et matérielles (boîtes de conservation).

Musée National du Sport – Magasins (photo E. Rauzy)

Une politique d’acquisition est menée tous les 3 ans. De nombreux dons sont présents dans les collections, notamment provenant de collectionneurs et de fonds d’archives privés (exemple : bibliothèque personnelle de Renaud de Laborderie, journaliste français spécialisé dans la Formule 1).

En projet :

  • La réalisation et mise en ligne d’un portail documentaire pour mieux faire connaître les collections auprès du public et les mettre en valeur.
  • Des projets de numérisations ont été menées à bien en collaboration avec la BNF, et d’autres sont en cours.
  • Un travail de désherbage est à l’étude.

Merci à toute l’équipe du Centre, entreprenante et dynamique, pour cette belle découverte. Ce service de documentation participera très bientôt à notre réseau de bibliothèques Sudoc-PS (signature de convention en cours). Nous lui souhaitons la bienvenue et espérons que cette nouvelle collaboration sera fructueuse.

Musée National du Sport – Salle de consultation (photo E. Rauzy)

 

Enrichir et faire parler les données du CR (2/5) : focus sur les unicas

Les unicas sont des titres (de périodiques dans le contexte du Sudoc-PS) qui ne sont détenus que par une seule bibliothèque du réseau Sudoc. Bien évidemment le signalement et la conservation de cette frange de notre patrimoine éditorial revêt une importance toute particulière.

Au-delà du signalement, la visualisation apporte également des possibilités de valorisation, et c’est tout l’objet de ce billet un peu technique que de proposer une solution d’extraction de données et de visualisation, tout en restant dans un environnement largement connu et utilisé : Excel.

Première étape : les sources de données

Via les services en ligne et en libre service Self Sudoc mis en place par l’Abes, chaque Centre Régional Sudoc-PS peut récupérer la liste des ppn (= l’identifiant unique d’une notice bibliographique dans le catalogue Sudoc.fr) des unicas de ressources continues détenus par les bibliothèques de son périmètre. Le fichier de ppn extraits est un fichier brut du type :

039113582
037935526
040303241
040160297
039004864…

Des ppn, c’est peu en terme d’information, et cependant c’est beaucoup puisqu’on peut ensuite choisir dans l’ensemble des web services développés autour de l’environnement Sudoc au sens large pour enrichir ces ppn avec des informations supplémentaires. Ce qui nous intéresse ici c’est par exemple d’extraire des données de localisation (quelle bibliothèque possède tel titre ?) et bibliographiques (de quelle ressource s’agit-il ?).

Deuxième étape : l’extraction de données

Pour obtenir la localisation des unicas dans notre réseau nous utilisons le web service multiwhere. Celui-ci renvoie le nom de l’établissement (RCR) localisé sous la notice interrogée via son ppn, ainsi que quelques éléments de la notice RCR : le nom court de l’établissement et ses données de géolocalisation (latitude-longitude). La requête se construit ainsi : url racine « http://www.sudoc.fr/services/multiwhere/ » + ppn (par exemple https://www.sudoc.fr/services/multiwhere/040269302) et renvoie par défaut dans le navigateur un résultat sérialisé en xml :

La petite complication tient à la connaissance nécessaire du langage xpath pour pouvoir naviguer dans ce flux xml et en extraire les portions souhaitées, à savoir le nom de la bibliothèque dans la balise <shortname> et ses coordonnées géographiques dans les balises <latitude> et <longitude>. Par exemple pour le nom court, en xpath et à partir de la balise racine <sudoc>, le chemin de localisation s’écrira */query/result/library/shortname.

En ce qui concerne les données bibliographiques, nous nous appuyons sur l’accessibilité des données du Sudoc sur le Web de données, notamment grâce à la fourniture d’url pérennes construites sur les ppn et la modélisation des données en RDF, atteignables sur le web en ajoutant l’extension .rdf à l’url pérenne. Toujours formalisée en xml, voici par exemple la notice en RDF du titre The Quarterly report of the Inter-America Tuna Commission obtenue avec l’url http://www.sudoc.fr/040269302.rdf

(On notera au passage que l’exposition et la ré-utilisation des données selon les standards du Linked Open Data (données ouvertes et liées) s’arrête aux droits de propriétés d’ISSN sur les notices de périodiques.)

De la même manière, on atteint l’information de titre dans la balise <dc:title> avec le chemin complet rdf:RDF/bibo:Periodical/dc:title (l’impasse est volontairement faite sur les considérations de préfixes et de namespaces qui sont à prendre en compte avec des langages tels que le xslt ou php mais qui « magiquement » disparaissent avec l’interrogation d’API sous Excel).

A noter à propos d’Excel : depuis Office 2013 Excel intègre un nouveau type de formules, dites « formules Web », qui permettent précisément de consommer des API (formule SERVICEWEB) et d’extraire du contenu du flux de résultat (formule FILTRE.XML). Ainsi :

  • =SERVICEWEB(« http://www.sudoc.fr/services/multiwhere/093354320 ») injecte dans une cellule le contenu en xml de l’url http://www.sudoc.fr/services/multiwhere/093354320, ou =SERVICEWEB(« http://www.sudoc.fr/services/multiwhere/ »&A2) si le ppn est dans la cellule A2
  • =FILTRE.XML(SERVICEWEB(« http://www.sudoc.fr/services/multiwhere/ »&A2); »//query/result/library/shortname ») ouvre l’url http://www.sudoc.fr/services/multiwhere/093354320 et « navigue » jusqu’à la balise <shortname>
  • =TEXTE(FILTRE.XML(SERVICEWEB(« http://www.sudoc.fr/services/multiwhere/ »&A2); »//query/result/library/shortname »); »000000000″) complète tout ça en assignant un format texte à 9 caractères au ppn (pour éviter les très irritants problèmes de 0 en début de chaine).

Notons également qu’une des limites à l’utilisation d’Excel dans ce cas de figure réside dans la non-gestion des boucles (par exemple avoir à récupérer tous les RCR localisés sous un ppn en une seule boucle), problème qui par définition ne se pose pas dans le contexte des unicas.

Similairement la formule =FILTRE.XML(SERVICEWEB(« http://www.sudoc.fr/ »&A2& ».rdf »); »//bibo:Periodical/dc:title ») permettra de récupérer l’élément titre de la notice en rdf.

Pour finir on peut donc relativement facilement se construire une feuille Excel qui automatise l’extraction des données sur la base d’une liste de ppn, et vous trouverez ici en téléchargement un modèle de fichier prêt à l’emploi avec les formules pré-rentrées :

Troisième étape : la visualisation avec Power Map

Power Map est un complément d’Excel qui se télécharge puis s’active manuellement, pour permettre de cartographier des données en 3D.

Il existe quelques tutoriels sur internet relatifs à l’installation et la prise en main. En voici un parmi d’autres, en français : https://www.excel-exercice.com/powermap/

Sans s’étendre sur cet outil, il est en tout cas assez pratique pour réaliser facilement des petites animations autour de données géolocalisées. En voici un exemple grâce aux données sur les unicas du Centre Régional PACA/Nice obtenues comme expliqué précédemment (cliquez sur l’image) :

Quatrième étape : le petit plus

Mais sortons des logiciels propriétaires : il est intéressant aussi de tenter d’exploiter le fichier Excel obtenu dans une visualisation interactive plus orientée web, en recourant à quelques unes des multiples librairies libres et open source existantes. En voici un exemple réalisé avec le framework Angular pour le binding de données et l’APi Google map pour la carte.

Pour ré-utiliser cette page web avec vos données (et/ou voir le code source pour les curieux), aucun problème : vous trouverez toute la documentation et les fichiers sur Github ici.

 

Haut de page