Ressources en test – Episode 2 : 6 ressources à découvrir

0

Notre campagne de tests se poursuit. Durant le mois d’avril, vous pourrez accéder à plusieurs nouvelles ressources  :

  • CAIRN : revues et livres électroniques en sciences humaines et sociales. Le test porte sur 109 revues complémentaires à l’abonnement que nous avons actuellement (merci de nous donner votre avis).
  • Numérique Premium : livres électroniques en histoire et sciences humaines (merci de nous donner votre avis).board-361516_640
  • Acland’s Anatomy : vidéos d’anatomie destinées aux étudiants en médecine (accès en local uniquement depuis les postes de l’université, merci de nous donner votre avis).
  • Visible body : exploration 3D du corps humain et de ses différents systèmes, quizz d’auto-apprentissage et séquences animées (merci de nous donner votre avis).
  • EM Premium Paramédical : revues sur les métiers du paramédical proposées par la plateforme EM Premium (merci de nous donner votre avis) (prolongation jusqu’au 31 mai)
  • E-library infirmier : livres électroniques en soins infirmiers des éditions Masson (merci de nous donner votre avis) (prolongation jusqu’au 31 mai)

 

Et enfin, la collection de revues des Classiques Garnier est toujours en test jusqu’au 10 avril. Vous pouvez encore consulter cette ressource et bien évidemment nous donner votre avis !

 

Ressources en test – Épisode 1 : la collection de revues des Classiques Garnier

0

Comme chaque année, vos BU vous proposent des ressources électroniques en test. Ces tests vous permettent de découvrir et d’évaluer des ressources susceptibles de vous intéresser et répondre à vos besoins.

Nous comboard-361516_640mençons cette série de test par la collection de revues des Classiques Garnier. Cet éditeur publie des éditions de référence d’œuvres littéraires du monde entier ainsi que des études et essais en littérature et sciences humaines.

28 revues sont consultables du 1er mars au 10 avril. Parmi elles, on retrouve notamment la Revue des Lettres modernes, Romanesques, les Cahiers de littérature française ou encore Les Cahiers de recherches médiévales et humanistes.

Comme vous pouvez le constater, le test à déjà commencé. Dépêchez-vous donc de consulter ces revues avant qu’il ne soit trop tard et faites nous part de votre avis en répondant à ce court questionnaire.

D’autres tests pour d’autres ressources vous seront bientôt proposés. Rendez-vous au prochain épisode.

 

2016, du nouveau dans les ressources en ligne

3

Qui dit nouvelle année, dit nouveautés et changements dans les ressources électroniques !

Au rayon « nouveautés » vous trouverez donc désormais :

  • E-ecn : site d’entraînement et de révisions à l’Ecn en médecine
  • E-Books médicaux de la collection « Les collèges » d’E-library 
  • La Bibliographie de littérature française : plus de 150 000 notices détaillées d’études et articles parus depuis 1998 sur la littérature française et francophone du XVIe siècle à nos jours avec une mise à jour quotidienne
  • Les ressources disponibles via les licences nationales sont de plus en plus nombreuses. Depuis fin 2015, vous avez désormais accès aux revues de l’éditeur Emerald, spécialisé en économie, gestion et commerce. Cette offre porte sur 362 revues, de leur première publication (la plus ancienne remontant à 1898) jusqu’en 2010 inclus

Le périmètre d’abonnement aux Techniques de l’ingénieur a été modifié afin de correspondre plus finement à vos besoins.

D’autre part, afin de maintenir une offre qui réponde à vos besoins malgré une augmentation constante du coût de la documentation électronique, les bibliothèques ont dû désabonner certaines ressources moins consultées :

Photo credit : Got Credit

Photo credit : Got Credit

  • JAMA
  • des titres de la plateforme Erudit

Pour avoir plus d’informations sur nos ressources en ligne (typologie, accès…), vous pouvez consulter le portail des BU.

Nous restons également disponibles si vous souhaitez des informations complémentaires et pour répondre à vos questions.

Enfin les bibliothèques sont à votre disposition pour vous procurer les documents qui ne font pas partie de nos collections par le service du Prêt entre bibliothèques.

Nous vous souhaitons une très bonne année, de belles découvertes documentaires et la réussite dans vos études.

Westlaw International devient Westlaw Next

1

Westlaw International, base de données juridique spécialisée en droit international, droit du monde anglo-saxon (dont celui du Commonwealth) et de l’Union européenne, fait peau neuve. A partir du 18 décembre, la plateforme actuelle migrera vers Westlaw Next. Vous pouvez déjà découvrir cette nouvelle interface en vous rendant sur la plateforme Westlaw UK dans le menu Services / International materials :

 

2015-12-01 15_18_56-Westlaw UK

 

Westlaw International donne entre autres accès à :

  • la législation, jurisprudence, doctrine en droit international, anglo-saxon et européen
  • des revues juridiques américaines et anglaises
  • de nombreux titres de la presse internationale dont le Monde
  • CELEX : base de données officielles de l’UE et aux publications ELLIS…

 

Pour vous aider à vous familiariser avec cette nouvelle interface, vous trouverez sur le site de Westlaw International un comparatif entre les 2 plateformes et des supports de formation.

N’hésitez pas à nous faire part de vos remarques sur cette nouvelle plateforme.

Pour toutes informations complémentaires, vous pouvez écrire à docelec@unice.fr

Enquête sur l’utilisation des outils de communication scientifique

4

ORCID, DOAJ, HAL, ArXiv, Zenodo, Zotero, Mendeley, Academia, Google Scholar, GitHub, Dryad, Figshare

101 outils et sites innovants répartis dans 6 étapes du workflow de la recherche
Kramer, Bianca; Bosman, Jeroen (2015): 101 Innovations in Scholarly Communication - the Changing Research Workflow. Figshare.

Certains de ces noms vous sont peut-être familiers, mais probablement pas tous. Ils ne sont qu’un échantillon des 575 outils recensés par la bibliothèque de l’université d’Utrecht (Pays-Bas) dans le cadre d’une étude sur les nouveaux outils et workflows utilisés par le chercheurs pour se documenter, rédiger leurs publications, analyser, publier et diffuser leurs résultats.
Cet inventaire a servi de base à une enquête internationale, en cours jusqu’en février, que son ampleur et sa méthodologie rendent particulièrement intéressante, et dont les premiers résultats sont déjà disponibles.

La Bibliothèque universitaire invite les chercheurs et doctorants de l’UNS à participer à cet effort collectif en prenant quelques minutes pour remplir le questionnaire établi par nos collègues hollandais.
Une URL spécifique est réservée aux membres de l’UNS. Après la clôture de l’enquête, nous recevrons des données (anonymisées) correspondant aux questionnaires saisis par les membres de l’UNS, ce qui nous permettra de mieux connaître vos pratiques et vos besoins.

Répondre au questionnaire (lien réservé aux membres de l’UNS)

Si vous ne faites pas partie de l’UNS mais que vous êtes intéressés par cette enquête, vous pouvez remplir la version générique.

Pour en savoir plus sur l’enquête vous pouvez consulter cette page d’introduction en français : https://101innovations.wordpress.com/francais/
Pour en savoir plus sur le projet de recherche dans son ensemble : https://101innovations.wordpress.com/tag/updates-insights/

Deux équipes de la Bibliothèque sont à votre écoute pour toute question relative aux thématiques abordées dans cette enquête. N’hésitez pas à les contacter:
le service « Publication » publication-scd@unice.fr : droits d’auteurs, modèles éditoriaux, open access, création de revues et de colloques
l’équipe « Données de la recherche » donnees-scd@unice.fr, créée cet automne : expérimentation de services centrés sur la gestion, la diffusion et le traitement des données de la recherche

Libérés, délivrés. . . articles, livres, colloques et thèses libres en ligne

1

Depuis 3 ans, vos BU organisent chaque année les journées eDocs pour vous aider à mieux connaître les ressources numériques indispensables à votre parcours universitaire ou à vos recherches. La 3ème édition s’inscrit pour 2015 dans le cadre de la semaine internationale du libre accès qui se déroule du 19 au 25 octobre.

Venez découvrir ou approfondir vos connaissances sur quelques ressources libres en sciences humaines et sociales (mais pas que), à travers des ateliers de présentation, le jeudi 22 octobre de 14h à 16h30 dans la salle de conférence de la BU Lettres, Arts et Sciences Humaines- Henri Bosco sur le campus Carlone.

14h-14h30 – Revel, revues électroniques de Nice en SHS

revel

14h30-15h – OpenEdition, plateforme nationale de  revues, livres, blogs en ligne en SHS

revuesorg

15h-15h30 – HAL et HAL-Unice, archive ouverte pluridisciplinaire

hal

15h30-16h – theses.fr, site de référencement et de diffusion des thèses françaises

thesesfr

16h-16h30 – Persée, portail de revues scientifiques en sciences humaines et sociales

persee

Si vous êtes intéressé-e pour déposer un article dans HAL-Unice, nous vous proposons encore cette année le Quart d’heure Open Access et nous serons disponibles pour vous accompagner toute l’après-midi. Il vous suffit de venir avec un (ou plusieurs) de vos articles, déjà publié(s) ou non, en format PDF.

Nous espérons vous retrouver nombreux pour ces journées et si vous souhaitez plus d’informations concernant ces évènements, n’hésitez pas nous contacter à docelec@unice.fr

ISTEX lance un appel à proposition d’exploration de corpus

0

ISTEX (dont il a déjà été question ici) est un projet, un dispositif, un ensemble de ressources et de services. C’est également une plate-forme.

istex - copie d'écran

segments BSN

ISTEX ? Un petit rappel (si besoin)

La Bibliothèque scientifique numérique est un dispositif visant à faire collaborer les grands acteurs du monde académique autour des enjeux forts de la documentation scientifique aujourd’hui. 9, puis 10 « segments » (groupes de travail) œuvrent à apporter des réponses nationales à des problématiques communes.

 

ISTEX est le produit d’un de ces segments : cette plate-forme vise à donner accès de manière pérenne aux ressources (articles) acquises dans le cadre de licences nationales.

Par voie de conséquence, ISTEX engrange donc une masse de documentation scientifique qu’il peut être intéressant de considérer comme un corpus de textes.

Accéder aux ressources, mais aussi exploiter les données

Dans cette perspective, un appel à propositions est lancé par ISTEX pour initier des chantiers  thématiques d’exploitation du plein texte des corpus, considérés comme données source pour la fouille de texte.

8 à 10 projets dans des thématiques différentes devraient être soutenus financièrement, avec une enveloppe globale de 400 k€ pour l’ensemble des projets.

La date limite de soumission est le 15 octobre minuit, pour un début de mise en place en janvier 2016, et un rendu des résultats au second trimestre 2017.

Ces  projets  devront être accompagnés en termes d’expertise et de conseil par des spécialistes de l’IST. L’appel à proposition précise qu’une interaction avec l’équipe de développement de la plateforme  Istex et/ou les  projets  de  services  généraux  à  valeur  ajoutée  en  cours  de  définition serait un plus (voir les pages présentant « les services de base » et « les services avancés« ).

Un projet en collaboration avec le service Données de la recherche des bibliothèques universitaires

Le Service commun de documentation se met à la disposition des laboratoires et des chercheurs pour les accompagner dans la définition  et la réalisation de ces projets  (informations sur les corpus concernés, informations sur la plateforme et les projets de services généraux d’Istex, fourniture de prestations de manipulation et de visualisation de données).

Si cet appel à proposition vous intéresse, vous pouvez contacter donnees-scd@unice.fr à partir du 1er septembre.

titres-LN

Le rapport « Ambition numérique » : pour une lecture de plage citoyenne

0

Logo CNNumSur commande du gouvernement visant à produire une stratégie globale concernant le numérique et internet, le Conseil National du Numérique (@CNNum, et non pas CNN), organisme indépendant, a lancé dans les derniers mois une large consultation, auprès d’acteurs du numérique, mais également sous forme d’ateliers divers, visant à recenser, arbitrer et synthétiser des propositions pour une politique démocratique du numérique.

Le rapport Ambition numérique de 399 pages (plus court qu’un gros polar, donc), est téléchargeable en PDF, en ODT (format LibreOffice), et permet d’avoir une approche politique et stratégique (et non technique), de questions sociétales, économiques, concernant l’avenir d’internet tel qu’il se dessine (ou pas).

Ambition numérique - logo

L’été vient à point pour s’y intéresser, et comprendre les enjeux qui vont bien au-delà des conditions de consultation de notre mail ou de notre compte Facebook mais de pans entiers de nos vies comme la santé ou la recherche d’emploi.

Votre été est déjà bien chargé ? Vous savez que vous n’aurez pas le temps de lire les 70 propositions ?

D’abord, vous pouvez n’en lire que quelques-unes, prendre le temps de vous rappeler pourquoi la neutralité du net, c’est important, ou ce que sont les communs.

Ensuite, vous pouvez en faire un survol en 5 minutes (vidéo).

Il n’est pas impossible que ces 5 minutes vous incitent, finalement, à trouver le temps pour lire le rapport complet. Les enjeux qu’il contient le mérite.


Le numérique nous concerne tous par cnnumeriquefr

 

Si la lecture complète du rapport vous semble encore un peu trop ambitieuse, attardez-vous sur les vidéos présentant chacune des quatre parties :

Concernant plus spécifiquement le monde de l’enseignement supérieur et de la recherche : le volet 2 aborde la question de l’ouverture des données ; le volet 3 une politique de l’innovation et un rapprochement entre monde académique et entreprises ; le volet 4 enfin (qui traite de pédagogie et de formation) aborde la question de l’exception des usages pédagogiques pour les ressources numériques, ainsi que des conditions de certification. Dans ce dernier volet, la proposition 53 s’intitule : « Faire de la publication ouverte une obligation légale pour la recherche bénéficiant de fonds publics ». Une occasion aussi de se replonger dans les enjeux de l’open access.

Test Oxford University Press Social Science

0

Découvrez jusqu’à la fin mai, la collection Social Science Journals d’Oxford University Press.

bouton test

Oxford Journals Social Science

 

 

 

 

 

 

 

 

 

61 titres en économie et science politique sont en test pour l’Université Nice Sophia Antipolis (voir le détail des titres).

Cette collection vous intéresse ? Faites nous le savoir en remplissant ce court questionnaire

bouton enquête

50 ans d’activité scientifique, 50 ans d’open access, 50 ans de collaborations

0

J’ai décrit dans un précédent billet le contenu de HAL-Unice, en terme de volumétrie.

Rappelons que les constatations sont faites pour le corpus constaté, c’est-à-dire les archives déposées dans HAL, et les articles signalés par les chercheurs dans HAL. Ce corpus ne prend donc en compte

  • ni l’ensemble de la publication scientifique de l’Université
  • ni même l’ensemble de la politique d’open access des structures de recherche de l’Université, car il existe d’autres dépôts d’archives en France et dans le monde
    Si les archives déposées dans ArXiv par des chercheurs français se retrouvent automatiquement dans HAL, ce n’est pas le cas par exemple de CiteSeerx, dans lequel on trouvera de nombreux articles déposés par des chercheurs affiliés à l’Université de Nice, qui ne sont pas du tout signalés dans HAL.

Par ailleurs les disciplines sont inégalement représentées du fait aussi des pratiques de publication des chercheurs, directement liées aux conditions d’évaluation (ex : publier un ouvrage compte-t-il ou non ?) et aux pratiques des communautés scientifiques et des maisons d’édition.

Pour les archives qui y sont déposées ou signalées, HAL-Unice constitue-t-il un bon corpus pour donner à voir toutes les collaborations entre laboratoires et structures de recherche ? On peut toujours essayer.

A chaque notice est associée l’affiliation du ou des auteurs. Cette affiliation est presque toujours exprimée de manière double, quand elle désigne le nom du labo et l’université de rattachement de celui-ci ; ou triple quand il s’agit d’une UMR, rattachée à la fois au CNRS et à l’Université.

En moyenne, une ressource est affiliée à 6 structures de recherche, avec un maximum de 56 pour l’ensemble étudié…

On peut donc considérer que chaque article est le fruit d’une collaboration entre les structures de recherche auxquelles appartiennent leurs auteurs. Chaque article donne à voir une collaboration entre deux structures de recherche.

De manière plus globale (c’est-à-dire en regardant les liens entre les structures de recherche, non pas notice par notice mais pour l’ensemble du corpus), on découvre tout un réseau continu entre les établissements.

Hal-Unice SetSpec

 

Explications

Les données qui ont permis de générer ce graphe :

A chaque article est associé un ou plusieurs « sets ». Quand il y a plusieurs affiliations d’établissements, cela apparaît sous la forme :

      <collection>UNICE</collection>
      <collection>SHS</collection>
      <collection>EPHE</collection>
      <collection>INRAP</collection>
      <collection>CNRS</collection>
      <collection>UNIV-TLSE2</collection>
      <collection>CEPAM</collection>
      <collection>TRACES</collection>
      <collection>CBAE</collection>
      <collection>UNIV-MONTP3</collection>
      <collection>UMR5140</collection>
      <collection>UNIV-AMU</collection>
      <collection>MMSH</collection>
      <collection>LADIR</collection>
      <collection>UPMC</collection>

 

On a considéré qu’à travers cette liste, chaque structure de recherche était liée à chacune des autres, ce qui a généré toutes les paires possibles :

UNICE;SHS / UNICE;EPHE / UNICE;INRAP / UNICE;CNRS / UNICE;UNIV-TLSE2 / UNICE;CEPAM / UNICE;TRACES / UNICE;CBAE / UNICE;UNIV-MONTP3 / UNICE;UMR5140 / UNICE;UNIV-AMU / UNICE;MMSH / UNICE;LADIR / UNICE;UPMC / 
SHS;EPHE / SHS;INRAP / SHS;CNRS / SHS;UNIV-TLSE2 / SHS;CEPAM / SHS;TRACES / SHS;CBAE / SHS;UNIV-MONTP3 / SHS;UMR5140 / SHS;UNIV-AMU / SHS;MMSH / SHS;LADIR / SHS;UPMC / 
EPHE;INRAP / EPHE;CNRS / EPHE;UNIV-TLSE2 / EPHE;CEPAM / EPHE;TRACES / EPHE;CBAE / EPHE;UNIV-MONTP3 / EPHE;UMR5140 / EPHE;UNIV-AMU / EPHE;MMSH / EPHE;LADIR / EPHE;UPMC / 
INRAP;CNRS / INRAP;UNIV-TLSE2 / INRAP;CEPAM / INRAP;TRACES / INRAP;CBAE / INRAP;UNIV-MONTP3 / INRAP;UMR5140 / INRAP;UNIV-AMU / INRAP;MMSH / INRAP;LADIR / INRAP;UPMC / 
CNRS;UNIV-TLSE2 / CNRS;CEPAM / CNRS;TRACES / CNRS;CBAE / CNRS;UNIV-MONTP3 / CNRS;UMR5140 / CNRS;UNIV-AMU / CNRS;MMSH / CNRS;LADIR / CNRS;UPMC / 
UNIV-TLSE2;CEPAM / UNIV-TLSE2;TRACES / UNIV-TLSE2;CBAE / UNIV-TLSE2;UNIV-MONTP3 / UNIV-TLSE2;UMR5140 / UNIV-TLSE2;UNIV-AMU / UNIV-TLSE2;MMSH / UNIV-TLSE2;LADIR / UNIV-TLSE2;UPMC / 
CEPAM;TRACES / CEPAM;CBAE / CEPAM;UNIV-MONTP3 / CEPAM;UMR5140 / CEPAM;UNIV-AMU / CEPAM;MMSH / CEPAM;LADIR / CEPAM;UPMC / 
TRACES;CBAE / TRACES;UNIV-MONTP3 / TRACES;UMR5140 / TRACES;UNIV-AMU / TRACES;MMSH / TRACES;LADIR / TRACES;UPMC / CBAE;UNIV-MONTP3 / CBAE;UMR5140 / CBAE;UNIV-AMU / CBAE;MMSH / CBAE;LADIR / CBAE;UPMC / 
UNIV-MONTP3;UMR5140 / UNIV-MONTP3;UNIV-AMU / UNIV-MONTP3;MMSH / UNIV-MONTP3;LADIR / UNIV-MONTP3;UPMC / 
UMR5140;UNIV-AMU / UMR5140;MMSH / UMR5140;LADIR / UMR5140;UPMC / 
UNIV-AMU;MMSH / UNIV-AMU;LADIR / UNIV-AMU;UPMC / 
MMSH;LADIR / MMSH;UPMC / 
LADIR;UPMC

L’ensemble de ces paires a ensuite été chargée dans Gephi, pour obtenir une clusterisation et une répartition spatiale qui a rapproché les établissements travaillant le plus souvent ensemble, et attribuant (ou tentant d’attribuer) des couleurs par sous-groupes.

Le corpus considéré de manière « brute » (sans sélection des données traitées) laisse entendre qu’il n’y a pas vraiment de sous-ensembles nets : aucun groupe de noeuds ne se détache vraiment des autres, il y a plutôt, dans l’activité de publication, un continuum de la recherche.

Limites et reprises

On peut voir d’emblée au moins 3 limites aux données en entrée :

  • il y a un trop grand nombre de noeuds (1177 « établissements » distincts) et de liens (31.000 liens distincts) pour obtenir un graphe satisfaisant
  • Les données en entrée ne sont pas propres : les collections « SHS », « AO-ECONOMIE », ne sont pas des établissements
  • Les universités sont sur le même plan que les laboratoires : donc toutes les universités sont finalement liées entre elles (via leurs laboratoires, y compris ceux qui ne travailleraient que dans un champ disciplinaire bien précis, et avec une liste fermée d’autres laboratoires du même champ disciplinaire).
    Cette absence de partition en sous-groupes est donc inévitable tant qu’on prend en compte les universités.

Voici donc 2 autres tentatives pour voir si une visualisation différente pourrait se dégager :

1. Données en entrée nettoyées des mentions de domaines de recherche, et des noms d’Université (ou CNRS)

Dans le graphe ci-dessous, les universités et le CNRS ont été retirées. Ne sont conservées que les structures de recherche de type Laboratoire ou Institut.
On passe ainsi à 1063 établissements (nœuds) et 18.000 liens :

201502_Hal-Unice_SetSpec_filtres_gephi-vignette

Certains sous-ensembles se dégagent mieux (le graphe est moins uniforme) : SophiaTech et l’INRIA avec le labo de math J.A. Dieudonné ; les laboratoires de l’OCA (en vert) – et juste à côté, dans un vert légèrement différent, des structures de recherche en SHS (la plus visible sur le graphe étant le CEPAM).

Pourtant de nombreux liens existent manifestement entre ces groupes, et on continue d’observer le continuum évoqué plus haut.

2. Données en entrée : les liens les plus importants

Une méthode supplémentaire pour « nettoyer » les données consiste à évacuer toutes les collaborations trop ponctuelles (1 à 5 occurrences), pour ne conserver que celles qui se sont répétées pour la rédaction de plusieurs archives déposées.

Ci-dessous le graphe exploitant les collaborations répétées au moins 6 fois dans le corpus étudié (404 structures de recherche, 2830 liens) :

201502_Hal-Unice_SetSpec_filtres_occ_gephi-vignette

Le risque est évidemment de faire disparaître des laboratoires très présents dans le corpus initial, mais qui travaillent ponctuellement avec un grand nombre d’autre laboratoires très diversifiés : chaque lien concernant ce labo apparaissant peu de fois, il finit par disparaître complètement du graphe…
661 structures sont évacuées suite à ce filtre supplémentaire, mais aucune ne relève de l’Université Nice Sophia Antipolis (qui est le sujet de ce billet).

Ultime remarque : les SHS semble avoir disparu dans la masse. Du coup, voici un graphe rien que pour eux.

GephiSHS
Celui-ci est dynamique et permet notamment de filtrer sur le nom d’un labo (via le petit moteur de recherche dans l’en-tête), pour voir identifier ses partenaires et sa position dans le réseau.
Pourquoi dans le graphe global ne voit-on presque plus que des structures de recherche en sciences ? Parce que dans les archives déposées ou signalées dans HAL-Unice, les SHS indiquent beaucoup moins d’affiliations : les collaborations entre labos sont en moins grand nombre :

Nb établissements par domaine

Comment lire ce graphique ?
exemple informatique

  • Pour chaque discipline, on voit le nombre d’établissements auxquelles sont rattachées les archives, avec leur dispersion.
    Par exemple, en physique, le nombre d’établissement par archive va de 1 à 48. La moitié des archives sont rattachés à 1-8 établissements, l’autre moitié des archives de physique sont rattachées à 8-48 établissements.
    En SHS, les 3/4 des publications sont rattachés à une seule structure de recherche

    On voit donc que les Sciences du Vivant (SDV), les SHS, la science non linéaire (NLIN) sont plus tassées, donc sont rattachées à un moins grand nombre de structures de recherche, que l’économie, les sciences de l’environnement (SDE) ou les sciences de l’Univers (SDU)
  • La largeur des colonnes rend compte du nombre d’archives recensées : il y en a beaucoup plus en informatique, en physique et en SHS qu’en économie et en statistiques

Les archives en SHS contiennent moins de liens entre structures de recherche que celles en informatique, ce qui permet d’expliquer en grande partie leur « disparition » dans le graphe globale des collaborations

Limite essentielle de l’exercice

Si la démarche est intéressante (et justifie la publication de ce billet), les observations ci-dessus sont trop tributaires de la source des informations, qui est très partielle. J’ai déjà signalé que le corpus n’était ni exhaustif ni représentatif.

Il y a un autre biais, tout aussi gênant : le champ « setSpec » où sont stockées les informations exploitées ci-dessus est uniquement la mention des tampons associés à chaque ressource. Donc si un laboratoire de recherche n’a pas choisi de demander l’activation d’un tampon pour ses publications, il n’est pas mentionné dans ces setSpec.

Peut-on exploiter une autre source d’informations pour rattacher chaque archive déposée à des structures de recherche ? 2 autres sources seraient envisageables :

  1. Le champ « contributeurs » mentionne souvent le nom des laboratoires
  2. à partir du nom du chercheur, retrouver le nom de son laboratoire grâce à l’API Affiliation des auteurs

La première piste est bloquée du fait que, contrairement au champ setSpec, l’information n’y est pas normalisée : sur 22295 « contributeurs » dans le corpus, il y a 8244 formes différentes, ce qui ne veut pas dire 8244 structures de recherche : l’INRIA de Sophia-Antipolis apparaît sous 75 formes différentes.

La seconde piste serait plus prometteuse, s’il n’y avait le problème des homonymes, et des affiliations multiples (qui sont parfois en fait la même structure bénéficiant de plusieurs « fiches » dans HAL) ou successives.

Conclusions

L’analyse des collaborations entre structures de recherche, au travers du cas du corpus de HAL-Unice, donne à voir (à visualiser) le réseau de la recherche française, à travers le prisme de leur activité dans HAL (nombre de dépôts et tampon).

On pourrait pousser cependant plus loin l’analyse, pour calculer, par exemple en fonction des disciplines, le nombre de structures de recherche (moyen, médian) auquel un laboratoire (ou l’un de ses chercheurs) de l’Université s’associe.

Une évolution sur la durée pourrait aussi se révéler intéressante, mais sur un autre corpus : celui de HAL-Unice, pour cela, est sans doute trop concentré sur le XXIe siècle.

En revanche une projection cartographique, avec des données de géolocalisation, donnerait à voir l’extension de ces collaborations, et le poids des partenariats locaux. Il faudrait pour cela lier chaque structure à ces informations.

Pour avoir une vision plus satisfaisante, il faudrait entreprendre un gros travail de reprise des données disponibles, en systématisant par exemple la constitution de « collections » (tampons) par structure de recherche.

Le travail d’analyse est aussi très tributaire des données : et telles qu’elles sont il n’est pas toujours simple de distinguer automatiquement les structures UNS des autres, de les rattacher à une ou plusieurs disciplines. On pourra donc envisager des opérations de nettoyage et d’amélioration de la base initiale, pour pouvoir ensuite l’exploiter un peu mieux.

Ces 2 billets étaient surtout l’occasion de donner à voir ce que contenait HAL-Unice, comme reflet  d’une partie de la production scientifique de l’Université.

Les thèses, produites elles durant 5 décennies, en sont un autre volet au moins aussi intéressant. Il en sera donc bientôt question.

Remonter