S’abonner à la Lettre du CCFr.
Logo de la BnFLettre d’information du CCFr
Le Catalogue Collectif de France ouvre ses données
Les données du CCFr sont passées sous Licence Ouverte depuis le 1er janvier 2018. Elles sont donc désormais réutilisables librement et gratuitement sous réserve d’en mentionner la source.
Le CCFr a pour mission de mettre en valeur les richesses patrimoniales des bibliothèques françaises. Le nouveau statut juridique de ses données permet au CCFr de répondre à cette mission en élargissant les possibilités d’usage. Leur publication sous une autre forme sur le web, leur possible rencontre avec d’autres données et la réutilisation de l’ensemble sous des formes nouvelles représentent une opportunité importante pour le CCFr et l’ensemble de ses contributeurs et utilisateurs.
La Licence Ouverte
Des enjeux et des opportunités
S’inscrivant dans le mouvement d’ouverture des données publiques (« Open Data ») encouragé par l’Etat, la Bibliothèque nationale de France a décidé d’adopter la licence ouverte, établie par la mission gouvernementale Etalab, pour les métadonnées gérées et diffusées par le CCFr dans l’ensemble de ses applications et services. Ceci s’applique à la fois aux données existantes et aux données destinées à intégrer le CCFr à l’avenir, facilitant et encourageant la réutilisation des données publiques mises à disposition gratuitement.
La « Licence Ouverte » présente plusieurs caractéristiques notamment :
  • Elle est ouverte, libre, gratuite et apporte une sécurité juridique nécessaire aux producteurs et aux réutilisateurs des données publiques.
  • Elle promeut la réutilisation la plus large en autorisant la reproduction, la redistribution, l’adaptation et l’exploitation commerciale des données.
  • Elle s’inscrit dans un contexte international en étant compatible avec les standards des licences Open Data développées à l’étranger et notamment celles du gouvernement britannique (Open Government Licence) ainsi que les autres standards internationaux (ODC-BY, CC-BY 2.0).
  • Elle rend obligatoire la mention de la paternité faisant preuve d’exigence forte pour la transparence et la qualité des données.
  • Elle apporte des possibilités de mutualisation pour les autres données publiques en mettant en place un standard réutilisable par les collectivités territoriales.
Cette ouverture a pour vocation la valorisation des données des bibliothèques et doit faciliter leur mise en relation avec celles d’autres communautés présentes sur le web. Il s’agit là d’un enjeu majeur pour la mise en valeur et la diffusion des richesses patrimoniales des bibliothèques françaises.
Les données disponibles du CCFr
Le portail du CCFr, en interrogeant simultanément plusieurs catalogues nationaux ou régionaux, donne accès à plus de 30 millions de notices. Cela en fait l’outil de recherche bibliographique et documentaire le plus riche du domaine français.
Une partie des données était déjà disponible sous Licence Ouverte
Les données de ces quatre catalogues interrogeables via le CCFr, sont donc déjà sous Licence Ouverte et sont disponibles auprès des producteurs concernés.
En complément, plusieurs jeux de données sont, désormais, également disponibles sous Licence Ouverte
  • La Base patrimoine qui regroupe plus de 6,6 millions de notices de documents patrimoniaux conservés dans les fonds anciens, locaux ou spécialisés de 197 établissements,
  • Le Catalogue général de manuscrits (CGM) qui abrite près de 900 inventaires provenant de 470 bibliothèques publiques,
  • Palme, répertoire permettant de localiser les manuscrits d’un même auteur du XXe siècle dans les différents établissements qui les conservent,
  • Le Répertoire des bibliothèques et fonds documentaires, donnant accès à la description de plus de 5 000 bibliothèques françaises et de près de 3  600 fonds documentaires anciens, locaux et spécialisés conservés dans plus de 500 établissements.
La récupération des données du CCFr
Depuis le portail du CCFr, il est possible de sélectionner des notices puis d’en demander le téléchargement, directement ou en passant par le panier.
Les données sont disponibles en
  • XML-EAD pour le CGM et Palme,
  • UNIMARC, ISO 2709 ou texte tabulé pour la Base Patrimoine,
  • XML pour le Répertoire.
Par ailleurs, des extractions complètes des bases sont ou seront prochainement possibles depuis plusieurs plateformes de données ouvertes 
Ces jeux de données (ou dumps en anglais) permettent de récupérer tout le contenu d’une base en une seule opération. Compte-tenu des volumétries, le contenu d’une base peut cependant être découpé en plusieurs fichiers.
Au-delà de cette première étape, l’ouverture des données du CCFr se poursuivra avec des mises à jour régulières des jeux de données existants ou de nouvelles extractions correspondant à des corpus spécifiques. De nouveaux formats de fichiers devraient également faire leur apparition en même temps que des outils permettant un accès direct aux bases de données. Dans ce cadre, c’est avec le plus grand soin que seront examinées les remarques et suggestions des utilisateurs, afin de proposer les réponses les plus adaptées à leurs besoins.
En savoir plus
Différents accès aux CCFr
Le CCFR disposait déjà de différents modes d’accès ciblés aux données, via
  • Des permaliens donnant un accès direct aux notices,
  • Des résolveurs de liens permettant de lancer une recherche prédéfinie sur le CCFr ou d’accéder à un formulaire pré-rempli,
  • Des widgets permettant d’insérer un mini formulaire de recherche dans toute page internet, portail ou site de bibliothèque. Exemple ci-dessous sur le site de la bibliothèque municipale de Reims
À consulter
Bibliothèque nationale de France / Catalogue collectif de France – Janvier 2018
Conformément à la loi N° 2004-801 du 6 août 2004 relative à la protection des personnes physiques à l’égard des traitements de données à caractère personnel et modifiant la loi N° 78-17 du 6 janvier 1978 relative à l’informatique, aux fichiers et aux libertés, tout utilisateur ayant déposé des informations directement ou indirectement nominatives, peut demander la communication de ces informations et les faire rectifier le cas échéant.
Direction de publication : Laurence Engel, Sylviane Tarsot-Gillery
© Bibliothèque nationale de France, 2018 • Quai François Mauriac • Paris 75706 CEDEX 13
Site du CCFr Site de la BnF