|
ZOOM |
|
|
|
Un nouveau service de récupération des données de la BnF |
|
|
|
La BnF a ouvert le 23 octobre 2017 un service SRU d'interrogation de BnF catalogue général. Né de la volonté d'adapter le protocole Z39.50 aux technologies du web, le protocole SRU (Search / Retrieve via URL) permet, via de simples requêtes HTTP, de récupérer des notices au format XML. L'ensemble de BnF catalogue général est désormais interrogeable grâce à des critères de recherche proposés tant pour les notices bibliographiques (tous les mots, auteur, titre, sujet, type de document, numéro de notice, identifiant ARK, ISBN…) que pour les notices d'autorité (tous les mots, forme retenue ou rejetée, type de notice, numéro de notice, identifiant ARK, ISNI…).
Destiné aux différents réutilisateurs des données de la BnF (bibliothèques, fournisseurs de SIGB ou de données bibliographiques, éditeurs, chercheurs...), le service SRU peut notamment être utilisé par les catalogues en remplacement ou en complément du protocole Z39.50.
Pour en savoir plus sur le service SRU de la BnF
|
|
|
|
|
| | |
|
|
À LA
UNE | |
|
Un portail pour découvrir et utiliser les données de la BnF |
|
|
Le portail BnF API et jeux de données a ouvert le 23 novembre 2017 à l'occasion du deuxième hackathon BnF. Il décrit et documente l'ensemble des API (Application Programming Interface, interface de programmation applicative) qui permettent d'interroger et de récupérer les métadonnées des catalogues et les collections numérisées de la BnF. Pour faciliter l'accès aux données et leur utilisation, des jeux de données (images et textes, métadonnées, statistiques) ont également été constitués et sont directement téléchargeables via le portail. Chaque API ou jeu de données donne lieu à une présentation du contenu, une documentation technique, des précisions sur les droits d'utilisation et un accès direct aux données.
Vous trouverez notamment sur BnF API et jeux de données :
- L'API d'affichage et de récupération des images de Gallica (IIIF), les API d'interrogation des métadonnées de Gallica et de BnF catalogue général (SRU, Z39.50, OAI) et le sparql endpoint de data.bnf.fr.
- Des jeux de données qui constituent des extractions d'ensembles cohérents des catalogues (produits bibliographiques, dumps de data.bnf.fr).
- Des corpus documentaires réalisés dans le cadre de projets de recherche (par exemple les fichiers images et textes constitués dans le cadre du projet Europeana Newspapers).
- Des pages éditoriales (qui s'étofferont au fur et à mesure de l'avancée du projet) destinées à guider les utilisateurs dans la découverte et le choix des modes de récupération des données qui répondent au mieux à leurs besoins.
En structurant ainsi l'ensemble de son offre de diffusion de données, la BnF poursuit sa stratégie d'ouverture affirmée par l'adoption en 2014 de la Licence Ouverte pour l'ensemble de ses métadonnées. Il s'agit d'en simplifier l'accès et d'en susciter de nouveaux usages (alimentation de catalogues, création d'applications innovantes, fouille de données, datavisualisation, etc.) auprès de publics professionnels diversifiés (développeurs, entrepreneurs, acteurs de la culture et de la chaîne du livre, chercheurs, chercheurs des humanités numériques) ou tout simplement des amateurs de culture.
Découvrir BnF API et jeux de données
| |
|
|
|
VEILLE
CATALOGUE | |
|
Transition bibliographique : du nouveau pour la zone de l'adresse |
|
|
|
À compter du 1er janvier 2018, la BnF implémentera les éléments 2.9 à 2.11 de RDA-FR publiés en 2016. La zone de l'adresse bibliographique (Intermarc 260) se dote ainsi de deux nouvelles sous-zones :
$i Date de copyright ;
$j Date de protection phonographique.
| |
La valeur du deuxième indicateur de la zone permettra en outre de distinguer les mentions de publication des mentions de distribution/diffusion, dans l'adresse bibliographique comme dans la note sur l'adresse :
- # : indéterminé
- 1 : publication
- 2 : diffusion
- 3 : production audiovisuelle
- 4 : production phonographique
Les abréviations « cop. », « diff. » et « distr. » disparaissent donc des notices produites par la BnF : l'utilisation de sous-zones spécifiques et la valeur des indicateurs détermineront l'affichage en clair des mentions idoines dans l'interface de BnF catalogue général, pour une meilleure lisibilité et le plus grand confort des usagers. |
|
|
|
|
|
L’INVITÉ DU
MOIS | |
|
|
|
À l'occasion du passage des données du Catalogue Collectif de France (CCFr) sous le statut juridique de la Licence Ouverte de l'État, Wilfried Muller, coordinateur des évolutions et de la valorisation du CCFr, précise les raisons qui ont présidé à ces choix et les changements en perspective.
| |
De quelles données s'agit-il ? |
Le Catalogue Collectif de France (CCFr) est un portail qui, en interrogeant simultanément plusieurs catalogues nationaux ou régionaux, donne accès à plus de 30 millions de notices. Cela en fait l'outil de recherche bibliographique et documentaire le plus riche du domaine français.
Plusieurs des catalogues interrogés sont hébergés par le CCFr : la Base Patrimoine, le Catalogue général des manuscrits (CGM), le Répertoire des manuscrits d'auteurs du XXe siècle (Palme) et le Répertoire national des bibliothèques et fonds documentaires. |
Quels changements en perspective ? |
L'outil CCFr s'était déjà ouvert aux accès externes, grâce à la mise en place de liens pérennes, d'un résolveur de liens et d'un widget personnalisable. Ce sont désormais les données qui seront placées sous Licence Ouverte, permettant une réutilisation libre et gratuite contre la seule obligation d'en mentionner la source.
À cette occasion, et pour en faciliter l'accès, les données seront extraites des bases citées ci-dessus pour constituer des jeux de données mis à disposition sur trois plateformes de diffusion : https://www.data.gouv.fr, https://data.culturecommunication.gouv.fr/ et http://api.bnf.fr.
Au 1er janvier 2018, six jeux de données seront ainsi accessibles : l'ensemble de la Base Patrimoine, du CGM et de Palme ; le Répertoire, séparé en deux parties, « Bibliothèques » et « Fonds » ; le sous-ensemble « Patrimoine musical régional » de la Base Patrimoine.
À terme, d'autres sous-ensembles devraient être proposés, sous différents formats. |
Pourquoi ce passage sous la Licence Ouverte ? |
Le CCFr a pour mission de mettre en valeur et de diffuser les richesses patrimoniales des bibliothèques françaises. L'ouverture du statut juridique de ces données, leur publication sous une autre forme sur le web, leur possible rencontre avec d'autres données et la réutilisation de l'ensemble sous des formes nouvelles représentent ainsi une opportunité importante pour le CCFr.
Ce passage en Licence Ouverte suit par ailleurs le processus d'ouverture des données publiques encouragé par l'État. |
|
|
VOS
QUESTIONS | |
|
Pourquoi récupérer l'identifiant ARK des notices BnF lorsque le numéro FRBNF est déjà présent dans les notices de mon catalogue ?
|
|
La BnF continue d'avancer dans le vaste chantier de la FRBRisation de son catalogue, pour son propre bénéfice et celui de son réseau. Mais à l'issue de ce chantier, les bibliothèques qui voudront récupérer les notices mises à jour ne pourront pas directement récupérer les notices à partir des numéros FRBNF présents dans leurs catalogue. En effet, la pérennité de ce numéro, qui sert à mentionner la source de chaque notice, n'est pas garantie, et le FRBNF d'une notice dérivée risque fort d'avoir disparu au cours d'une fusion, sans qu'il existe de manière simple de retrouver à quelle notice il correspond aujourd'hui.
Ce qui distingue le FRBNF de l'ARK (autre identifiant de notice utilisé à la BnF), c'est le dispositif mis en place par la BnF pour rendre les ARK pérennes, même après dédoublonnage. Il est donc essentiel de travailler en amont à la récupération de ces ARK pour les bibliothèques qui voudront, dans quelques années, récupérer les fruits de la FRBRisation de la BnF. La BnF fournira, courant 2018, une méthodologie et des outils pour accompagner cette opération.
Pour en savoir plus, voir l'article Du numéro FRBNF à l'identifiant ARK publié sur le site Transition-bibliographique.fr
|
|
|
|
|
|
|
CHIFFRES
CLÉS |
|
|
|
|
|
Modifications automatisées de notices dans BnF catalogue général en 2017
|
|
|
|
|
|
440 000 notices bibliographiques modifiées par programme automatique | |
|
|
|
|
RENCONTRES |
|
|
|
|
|
Journée d'étude sur la diffusion des données de la Bibliothèque nationale de France (Paris, BnF, 20 mars 2018)
Cette journée permettra notamment de découvrir de nouveaux modes d'accès aux données de la BnF et dressera un panorama des échanges de métadonnées entre les différents acteurs de la chaîne du livre.
Sommet sur les identifiants ARK (Paris, BnF, 21 mars 2018)
Cette journée d'information sera l'occasion de rappeler les principes fondamentaux d'ARK, d'échanger sur les bonnes pratiques de mise en œuvre de cet identifiant et de présenter des implémentations concrètes d'ARK dans différents contextes.
|
|
|
|