Toutes les notices bibliographiques du Catalogue général de la BnF ont
intégré le catalogue collectif WorldCat* d’OCLC*.
Ce chargement, effectué pour l'essentiel en décembre 2009, s'est terminé
en mars 2010 avec le traitement des sous-notices analytiques. Il est
l'aboutissement d’une étude préalable menée en 2008 et d’un accord signé
en juin 2009 entre la BnF et OCLC. Il a nécessité la conversion des
notices depuis le format de travail de la BnF, INTERMARC, vers MARC
21*, opération assurée par OCLC en étroite collaboration avec la bibliothèque.
La mise à jour des données est maintenant mensuelle.
Les notices de la BnF sont visibles dans la version professionnelle
de WorldCat disponible sur abonnement via FirstSearch*. Une forme allégée
est visible dans la version
publique disponible sur le Web via http://www.worldcat.org.
La BnF a ainsi rejoint 34 autres bibliothèques nationales dans ce catalogue
collectif mondial.
Depuis le 15 février 2010, le site de la BnF www.bnf.fr a adopté une nouvelle charte graphique, travail de refonte mené de front avec la mise en place d'un outil de gestion de contenu. Ce changement dans la forme s’est accompagné d’un allègement et d'une réorganisation des rubriques du menu principal de la page d’accueil. La plus importante restructuration – directement en lien avec les sujets abordés dans cette lettre – concerne la rubrique Catalogage et indexation.
Les anciennes rubriques Normes, formats, modélisation et Autorités ont fusionné avec la rubrique qui s’intitulait déjà Catalogage et indexation, et comporte désormais cinq sous-rubriques couvrant cinq grandes thématiques : normes ; formats ; protocoles d’échange ; modélisation des données ; autorités.
La sous-rubrique Description et accès présente les nouveaux Principes internationaux de catalogage publiés en 2009 ; les ISBD et l’« ISBD intégré » publié en 2007 ; les normes françaises ; et le code de catalogage RDA* (Resource Description and Access) qui pourrait devenir prochainement le cadre normatif international.
On trouvera dans la sous-rubrique Formats, encodage, à côté des formats MARC* « traditionnels » qu’utilise la BnF, à savoir INTERMARC et UNIMARC, les nouvelles perspectives qu’offre le langage XML pour rendre ces formats compatibles avec l’évolution du Web. On y trouvera également la présentation de deux formats conçus pour les ressources archivistiques, mais qui sont de plus en plus utilisés en bibliothèque pour la description des manuscrits : EAD (Encoded Archival Description) et EAC-CPF (Encoded Archival Context – Corporate Bodies, Persons, Families), ainsi qu’une brève présentation du format générique initialement conçu pour les ressources numériques, le Dublin Core*. La complexité structurelle de ces ressources a rendu nécessaire la création de nouveaux formats comme METS*, format permettant de préserver la cohésion interne de ces documents, tout en les accompagnant de leur description.
La sous-rubrique Protocoles d’échange de données présente deux protocoles utilisés par la BnF pour l'échange de ses données catalographiques ou le référencement de ses documents numérisés : Z39.50* et OAI-PMH*. Le protocole SRU* (Search/Retrieval via URL) est aussi abordé.
La sous-rubrique Modélisation et ses applications aborde la question du développement des ontologies en général, et présente deux modèles conceptuels de données du domaine du patrimoine culturel : le modèle FRBR* pour les données bibliographiques, et le modèle CIDOC CRM* pour les données muséographiques.
On retrouve sous Autorités l'information sur les points d'accès aux notices bibliographiques du Catalogue général de la BnF, et notamment un lien vers le sous-site consacré à RAMEAU (Répertoire d’autorité-matière encyclopédique et alphabétique unifié).
Les textes définissant les grandes lignes de la politique de catalogage et d'indexation de la bibliothèque ainsi que des liens vers deux outils en ligne d'aide au catalogage, le Guide pratique du catalogueur et le Guide d'indexation RAMEAU, sont accessibles en colonne droite de l'écran.
Vous pouvez désormais vous inscrire aux fils RSS de www.bnf.fr : Actualités professionnelles mais aussi Actualités de la Bibliothèque et Actualités culturelles.
En 2007, la Bibliothèque nationale de France se dotait d’un catalogue spécifique pour certains de ses fonds d’archives, collections de manuscrits et manuscrits isolés : BnF archives et manuscrits (BAM, pour les intimes…), naissance annoncée dans Actualités du catalogue n°9 (octobre 2007). Ce nouveau catalogue présente pour particularité d’être encodé selon la DTD EAD*, outil conçu à l’origine par la communauté archivistique, mais qui est de plus en plus employé par les bibliothèques. Après un peu plus de deux ans de fonctionnement, où en est ce catalogue ?
BnF archives et manuscrits contient des descriptions produites par le
département des Manuscrits, le département des Arts du spectacle,
et la Bibliothèque de l’Arsenal. Ces descriptions proviennent
en grande partie de la rétroconversion de catalogues mais aussi
du traitement courant des collections. Elles sont réparties
en quatre dossiers : trois qui reprennent le nom du département concerné,
et un quatrième intitulé « Archives
administratives de la bibliothèque », documents conservés au
département des Manuscrits qui en a établi les descriptions.
Pour apprécier la taille d’un tel catalogue, on fait appel non pas à la notion
de « notices
bibliographiques », mais au nombre d'« instruments
de recherche » : une base en EAD est constituée d’un
ensemble de fichiers appelés « instruments de recherche »,
eux-mêmes constitués de « composants » qui peuvent correspondre
à différents niveaux d’unité documentaire (série, dossier, pièce ou simple articulation
logique au sein de l’instrument de recherche).
Au début de l’année 2010, BAM comptait plus de 10 700 instruments de recherche, totalisant près de 280 000 composants EAD. Un instrument de recherche peut décrire un document isolé (cas le plus fréquent au département des Manuscrits), ou un ensemble de plusieurs centaines de documents présentés selon une structure logique reflétant le plan de classement du fonds (pratique la plus fréquente au département des Arts du spectacle).
Département | Instruments de recherche | Composants |
---|---|---|
Département des Manuscrits | 10 340 | 189 560 |
Bibliothèque de l'Arsenal | 350 | 53 280 |
Département des Arts du spectacle | 46 | 36 784 |
À noter : le Catalogue général de la BnF contient également des descriptions de manuscrits, produites par d'autres départements que les trois mentionnés ci-dessus mais aussi par le département des Arts du spectacle, lorsqu’il s’agit de documents qui ne font pas partie d’un fonds organique.
Les statistiques de consultation de BAM n'existent que depuis juin 2009 et ne concernent que la page d’accueil, la liste des instruments de recherche et le formulaire de recherche. De juin à décembre, elles totalisent 42 248 visites, soit environ 200 par jour. Nous n’avons pour le moment aucun outil d’analyse du comportement des internautes sur les instruments de recherche eux‑mêmes.
En moyenne un internaute sur trois ne va pas au-delà de la page d’accueil : le contenu ne correspond pas à sa recherche ou la procédure est trop complexe. Les deux autres se dirigent ensuite vers la page listant les instruments de recherche ou vers le formulaire de recherche, avec une très légère préférence pour ce dernier. Le formulaire de recherche permet d’interroger la base en texte libre, ou de lancer une requête sur un ou plusieurs des critères suivants : cote, nom (de personne ou de collectivité), titre, sujet, année, lieu.
BAM continue de s’enrichir, tant par des rétroconversions que par le traitement courant. Gageons qu’il élargira son audience car il figure d’ores et déjà au nombre des grands catalogues produits en EAD par les bibliothèques françaises, aux côtés des bases Manuscrits du CCFr dans lequel il sera interrogeable prochainement, et Calames de l'ABES.
Le 4 octobre 2007, la BnF signait un accord de coopération avec la Bibliothèque du Congrès, la Bibliothèque nationale d'Allemagne et l'organisme Online Computer Library Center (OCLC) pour élaborer un fichier d'autorité international accessible sur Internet. Thomas Hickey est responsable de ce projet au sein d'OCLC. Il anime par ailleurs un blog sur les évolutions des catalogues via Internet, Outgoing : Library metadata techniques and trends. Nous l'avons interviewé sur ce projet.
VIAF a pour objectif de faciliter l’accès aux principaux fichiers d’autorité disponibles dans le monde actuellement pour les noms de personnes. Nous voulons identifier les relations qui existent entre ces fichiers, afin de renforcer la performance des requêtes, d’améliorer le confort de lecture de l’utilisateur en affichant les noms dans la langue et l’écriture de son choix, et de réduire les coûts du contrôle des noms en bibliothèque.
VIAF est aujourd'hui un service Web accessible gratuitement à l'adresse http://viaf.org. L'interface fait appel aux protocoles de recherche standards, utilisables tant par l’homme que par la machine. Pour l'instant, nous ne traitons que les noms de personnes, issus de 19 fichiers produits par 15 établissements (essentiellement des bibliothèques nationales).
Nous commençons à exposer la base VIAF sous forme de « données liées
» (Linked Data). Il s’agit d’une technique récente issue du Web sémantique,
qui vise à faciliter la compréhension et l’utilisation par des machines
de données structurées présentes sur le Web. En évitant de faire appel
aux protocoles dédiés aux bibliothèques, nous espérons rendre l’information
plus largement accessible.
On prend de plus en plus conscience du déficit de contrôle des noms en dehors
des bibliothèques. En effet, celles-ci disposent des plus
importants fichiers de noms contrôlés figurant sur les documents publiés.
Il faut que nous diffusions l’information que nous produisons. Les « données
liées » constituent le meilleur moyen d’y parvenir, et VIAF représente naturellement
le point d’aboutissement de certains de nos travaux.
VIAF peut être utilisé comme une source de toutes les variantes de
noms grâce auxquelles on peut enrichir l’affichage des notices avec les
formes locales, ou trouver la forme normalisée pour un nom rencontré
par un catalogueur pour la première fois. L’un des atouts de
VIAF réside dans sa capacité à traiter diverses écritures. Nous disposons
de variantes en
plusieurs écritures et de formes normalisées en alphabet arabe, cyrillique
et hébreu ;
nous espérons accueillir très prochainement quelques écritures d’Asie.
VIAF propose, en outre, des informations plus riches que ce que l’on trouve habituellement
dans une notice d’autorité, et qui résultent de la combinaison d’informations
tirées de nombreux fichiers d’autorité et des notices bibliographiques associées.
Le fichier d’autorité de la BnF est évidemment performant pour les noms du domaine français et francophone, mais il est aussi particulièrement riche pour les écritures non latines. De plus, il comporte des données telles que le sexe, la langue et la nationalité, qui enrichissent les notices de VIAF. C’est ici l’occasion de saluer la qualité des données produites par la BnF, qui figurent parmi les plus « propres » et les plus rigoureuses que nous sommes amenés à traiter.
Nous continuons d'enrichir cette base de nouveaux fichiers
d’autorité. Nous souhaitons l’ouvrir à d’autres types de noms : noms de collectivités,
noms géographiques (nous y avons déjà un peu travaillé), noms d’œuvres…
De nouveaux types d’identifiants internationaux sont en train d’émerger, notamment
l'ORCID* et l'ISNI* ; s’ils
viennent à être largement utilisés, il faudra que les bibliothèques puissent
assurer un lien entre ces nouveaux venus et nos identifiants traditionnels.
Nous participons donc à ces projets à travers VIAF.
Nous souhaiterions que VIAF s’intègre davantage aux processus de catalogage.
Nous cherchons un moyen de l’inclure dans les services proposés par OCLC, mais
tout le monde peut d’ores et déjà s’en servir, en tant que service Web ou en
utilisant directement le fichier.
La question arrive au moment où des changements sont amorcés. En effet, dans le fichier d’autorité de la BnF, jusqu’à la fin de l’année 2009, le traitement des personnes utilisant individuellement un ou plusieurs pseudonymes suivait les préconisations de la norme AFNOR Z 44-061 (1986) § 1.1. Choix entre plusieurs noms.
Pour les pseudonymes de notoriété publique ou que les auteurs autorisaient à dévoiler :
Pour les pseudonymes non dévoilés par une source publique (identité véritable connue, par exemple, uniquement par la déclaration de dépôt légal, considérée comme confidentielle), il est établi autant de notices d’autorité que de noms utilisés par la personne, mais ces notices ne sont pas liées entre elles.
Nous n’abordons pas ici aujourd’hui le cas des pseudonymes collectifs.
À partir de 2010, le principe général devient une autorité pour chacune des identités d’une personne. Ce changement est motivé par plusieurs facteurs liés au contexte international, d’une part :
D’autre part, la BnF s’appuie sur des données présentes dans les notices d’autorité et les notices bibliographiques pour déterminer si un document numérisé est tombé au non dans le domaine public. Or une œuvre déterminée, du point de vue du droit, est à mettre en relation avec une « identité » précise et non avec un individu, en particulier lorsque l’identité véritable de la personne cachée derrière un pseudonyme n’est pas dévoilée.
Par conséquent, dans le Catalogue général de la BnF commencent à se côtoyer deux modes de traitement des pseudonymes. Aucune campagne de modification systématique de l'existant n'est prévue pour le moment, par contre, les corrections effectuées sur les notices d'autorité établies selon les principes antérieurs sont faites au fur et à mesure de leur réutilisation pour le catalogage de nouvelles éditions ou nouvelles œuvres de la personne. Ces mises à jour seront fournies dans le produit courant du fichier d'autorité Personnes physiques, collectivités, titres.
Des informations détaillées sur les nouvelles pratiques concernant les pseudonymes paraîtront dans le Guide pratique du catalogueur.
Deux nouvelles fonctionnalités sont désormais disponibles dès la page d’accueil du Guide pratique du catalogueur :
Suite à la publication en 2008 de UNIMARC Manual : bibliographic
format, le Comité français UNIMARC entreprend la 6e édition française
du Manuel UNIMARC : format bibliographique.
De plus, dans un souci de cohérence et d'harmonisation terminologique, cette
nouvelle édition est l'objet d'une révision d'ensemble de la traduction française
du format. Ce travail de longue haleine est accessible pour
partie depuis début avril sur le site de la BnF. À ce jour, plus de trente
zones, principalement dans les blocs 0XX, 1XXet 2XX, ont été mises à jour.
Le 5 mars dernier, le Groupe de travail international pour l’élaboration de l’EAC a annoncé la publication du schéma EAC-CPF, 2010 sur son site officiel. Le schéma est téléchargeable sous trois syntaxes différentes : XML Schéma, RelaxNG et RelaxNG compact. Il s’accompagne de son dictionnaire des éléments (Tag Library) en anglais avec des exemples d’encodage, également librement téléchargeable et intégré dans les outils de production.
Deux enquêtes internationales ont permis aux professionnels de contribuer à l’élaboration du schéma par des commentaires abondants.
Ce schéma a déjà été choisi comme modèle de données pivot dans des projets collaboratifs de découverte et d’exploitation de ressources, notamment par le programme People Australia.
La diffusion de l’EAC-CPF sera promue par les traductions en différentes langues que le site officiel est prêt à accueillir. Le groupe français d’experts AFNOR CG 46/CN 357/GE4 Données d’autorité lancera bientôt les travaux pour la traduction en français de toute la documentation relative à l’EAC-CPF, tout comme il l’avait fait pour le dictionnaire des balises de la DTD-EAC, 2004, version bêta.
À l'occasion du lancement d'une nouvelle version de l'application IREL (Instruments de recherche en ligne) des Archives nationales d'outre-mer, le Service interministériel des Archives de France organise des journées d’études sur la production et la publication électronique de descriptions archivistiques structurées en XML/EAD (Description archivistique encodée).
Cette année, la journée d'étude organisée conjointement par l'AFNOR CG 46 « Information et documentation » et la Bibliothèque nationale de France abordera le thème de la fonction documentaire. Celle-ci, quelles que soient ses missions et son type d'organisation, est une activité de services : elle consiste toujours à offrir une prestation à un « client » au moyen de collections, d'outils et de compétences.
Le prochain Congrès ABF aura lieu du 20 au 23 mai 2010, au Centre des congrès de Tours avec comme thème : « Bibliothèques, et si on parlait d’argent ? ». Comme chaque année, la BnF y sera présente. Une permanence de la coordination des produits bibliographiques sera assurée la journée du 21 et la matinée du 22.
Contact : coordination-bibliographique@bnf.fr
"Conformément à la loi N° 2004-801 du 6 août 2004 relative à la protection des personnes physiques à l'égard des traitements de données à caractère personnel et modifiant la loi N° 78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, tout utilisateur ayant déposé des informations directement ou indirectement nominatives, peut demander la communication de ces informations et les faire rectifier le cas échéant."