De BibTeX à HAL : le retour d'expérience de l'Université Paris Nanterre


À la suite de l’École des Ponts ParisTech (Frédérique Bordignon) et de l’Université de La Réunion (Nicolas Alarcon), l’Université Paris Nanterre livre ici son retour d’expérience concernant l’alimentation en masse d’un portail HAL, à partir notamment de Zotero - mais pas seulement.

Ce billet vise à expliquer notre démarche, éclairée par un certain contexte politique, ainsi que le choix des outils mis en place. Mais il vise aussi à mettre à la disposition de la communauté HAL quelques ressources que nous aurions aimé trouver au début de notre action mais avons finalement dû élaborer nous-mêmes : puissiez-vous les utiliser avec profit, mais aussi les améliorer et en faire bénéficier les autres !

L'Open Access à Paris Nanterre : quelques éléments de contexte

L’Université Paris Nanterre a ouvert son portail institutionnel dans HAL en juillet 2016. Elle ne disposait alors pas à proprement parler d’archive ouverte antérieure, mais utilisait un outil de gestion de la recherche (OGR) maison, dans lequel plusieurs centaines de publications datant d’entre 2008 et 2013 environ avaient été signalées par les chercheurs de l’Université. Même si certaines unités de recherche n’existent plus aujourd’hui, il importait de transférer ces références bibliographiques dans notre portail HAL, qui permet d’affilier des dépôts à des structures fermées.

Concernant les publications plus récentes, le souhait de l’Université était d’atteindre rapidement une masse critique permettant de mieux valoriser la recherche de l’établissement, notamment dans l’intégration d’autres dispositifs comme ScanR. Les listes de publications 2012-2017 des chercheurs de l’Université ont donc été récupérées, et signalées dans HAL sous forme de notices.

Comme à l’École des Ponts ParisTech et à l’Université de La Réunion, nous souhaitons ainsi faciliter le travail des chercheurs, qui n’auront plus qu’à rajouter le texte intégral de leurs publications.

Ces deux sources d’alimentation (données de l’OGR, listes de productions récentes) représentent plus de 30 000 références, même si certaines - comme les activités de recherche dont le résultat serait purement oral, les participations à des colloques sans actes ou les interventions radiophoniques, etc. - n’ont pas vocation à être intégrées dans HAL. Nous avons donc choisi d’utiliser le seul moyen de versement en masse à notre disposition, à savoir l’outil Bib2HAL mis au point par l’INRIA.

Le protocole SWORD ne permet en effet pas d'intégrer plusieurs fichiers en une seule fois, à moins de mettre en place une passerelle, ce que nous avons fait pour un de nos laboratoires qui dispose d’une base de données de gestion de ses publications, et surtout, d’un informaticien.

Restait à voir comment se conformer au mieux aux exigences de cet outil…

Mis à jour le 15 février 2022