Le catalogue général de la BnF contient plus de 10,8 millions de notices bibliographiques et environ 5 millions de notices d'autorité dont plus de la moitié provient de l'informatisation d'anciens catalogues imprimés ou sur fiches.
En 2008, les services chargés des corrections rétrospectives ont mis à jour 115 000 notices bibliographiques (soit l'équivalent de 1 % du volume du catalogue) et en ont dédoublonnées près de 60 000 (0,5 %). Ils ont également corrigé ou supprimé plus de 83 600 notices d'autorité (1,6 % du fichier d'autorité).
Certaines de ces corrections concernent des anomalies qui nous sont signalées, d'autres sont réalisées à l'occasion du programme de numérisation des fonds de la BnF. Par ailleurs, certaines corrections sont effectuées au cours de chantiers organisés sur des ensembles définis, dont deux exemples sont proposés dans la rubrique Veille catalogue.
Depuis début avril, une recherche par mots de la notice est disponible dans le catalogue général de la BnF. Plus facile à utiliser et plus complète, elle permet d’interroger tous les types de notices et de données.
Cette évolution majeure se traduit par d’importantes modifications dans l’agencement des différents écrans de recherche et dans la présentation des résultats. La colonne de gauche de l’interface de recherche a été réorganisée pour distinguer, dans les "recherches simples" et les "recherches avancées", les recherches traditionnelles "par index" (passage obligatoire par des entrées d’index) des nouvelles recherches "par mots".
La recherche par mots peut s'effectuer sur trois grands ensembles de filtres : par collections, par types de document, par types de notice.
L'affichage des résultats est immédiat sous la forme de listes de notices abrégées. Des fonctions permettent de détailler ou de modifier la recherche et de naviguer à travers les pages de résultats. Plusieurs possibilités de tri (croissant ou décroissant) sont offertes sur ces listes présentées par défaut selon la pertinence du moteur de recherche : par date, par auteur, par titre. On peut aussi affiner les résultats obtenus par collections, types de documents et types de notices.
La recherche simple permet une saisie intuitive à l'intérieur d'un seul champ de recherche dans lequel la casse, l’ordre des mots et l’accentuation sont indifférents. Le "et " est implicite entre les termes saisis et il est possible d’utiliser la troncature à droite (avec *).
La recherche avancée permet d'effectuer la recherche soit sur l'ensemble du contenu de la notice, soit sur certains de ses éléments qui peuvent être croisés.
La recherche par mots est également disponible dans les notices "autorités BnF" et RAMEAU.
L’accès à de nouvelles données jusque-là "enfouies"
Tous les mots sont indexés quel que soit leur positionnement dans la notice : notes des notices bibliographiques, données codées, notes liées aux exemplaires, supports, caractéristiques techniques, etc.
La disparition des seuils dans la recherche
Les recherches ramenant beaucoup de réponses sont désormais possibles. Malgré tout le feuilletage de pages est limité à …10 000 résultats ! Mais il est toujours possible d'affiner sa recherche.
Nous vous invitons à découvrir et explorer ce nouveau mode de recherche, en consultant l'Aide en ligne du catalogue général pour plus de détails sur les modes et les critères de recherche, ainsi que sur l'affichage des résultats. Puis lancez‑vous et découvrez par vous‑même ce que cette nouvelle offre peut vous apporter !
Parmi les chantiers de corrections des données du catalogue en cours de réalisation, citons ceux portant sur les notices d'autorité des auteurs français décédés au XXe siècle et sur les notices bibliographiques des œuvres des académiciens français.
Depuis l’existence du fichier d’autorité, l’exploitation régulière des notices nécrologiques de grands quotidiens a toujours été effectuée. Néanmoins, dans les notices d’autorité identifiant les personnes, les dates de naissance sont plus fréquentes que les dates de décès. Or ces dernières constituent des métadonnées capitales dans le cadre de la gestion des droits. La BnF ayant lancé un projet de gestion automatisée du calcul des droits d'accès aux documents numérisés, il était devenu nécessaire de disposer des informations permettant de déterminer si les œuvres étaient ou non dans le domaine public.
Selon la législation européenne, la durée de protection des œuvres, au titre du droit d’auteur, est de soixante‑dix ans après le décès de leur auteur. Mais, pour les auteurs, les compositeurs ou les artistes ayant été reconnus "morts pour la France" par l’État, la durée de protection a été prorogée d'une durée de trente ans. Il est donc devenu incontournable d’ajouter cette mention dans les notices d'autorité (création d’une zone spécifique dans le format INTERMARC pour une exploitation automatisée).
Un chantier de vérification de masse et de mise à niveau des notices d’autorité a été entrepris en exploitant systématiquement un certain nombre d'ouvrages et de bases de données sur les Français décédés. Il comporte deux volets : l’un général et l’autre spécifique consacré aux auteurs morts pour la France au cours des conflits du XXe siècle. L’objectif est de vérifier et compléter les notices d’autorité d’environ 10 700 personnalités françaises décédées au XXe siècle. D’après une série de tests, approximativement 4 500 notices nécessitaient une mise à niveau ou des dédoublonnages.
Le volet général et le volet spécifique du chantier sont menés simultanément depuis juin 2008. Au 30 avril, 2 395 notices ont été mises à jour.
Ce chantier prévoit la révision systématique des notices bibliographiques associées aux 718 membres de l’Académie française depuis sa fondation. Pourquoi ce choix ? Ce corpus permet de traiter un ensemble représentatif d’ouvrages de personnalités de notoriété diverse, qu'elles soient restées célèbres ou aient marqué leur temps, dans des disciplines variées : hommes de lettres, historiens, philosophes, hommes politiques, diplomates, militaires, hommes d’Église.
En moyenne, le tiers des notices de ces auteurs figurant dans le catalogue nécessite une correction : amélioration des données signalétiques (reformatage), des accès (contrôle des liens), des données d’exemplaires.
Par ailleurs, 15 % de notices bibliographiques associées à ces auteurs s’avèrent être des doublons et sont éliminées du catalogue à l’occasion du chantier.
Après traitement, les corpus liés à ces auteurs constituent donc des ensembles fiables en ce qui concerne le contenu et le format. Leur identification en est facilitée.
A ce jour, les correcteurs du service Coordination et administration des métadonnées ont traité les notices bibliographiques des œuvres de 180 académiciens, soit le quart des auteurs concernés, parmi lesquels Bergson, Chateaubriand, Musset et la plupart des académiciens en activité.
Le volume à traiter est considérable : 38 000 notices bibliographiques ont déjà été contrôlées, 13 000 corrigées et 5 600 dédoublonnées. Il reste encore beaucoup à faire ! Le travail porte notamment sur des classiques abondamment publiés, ce qui rend leur identification complexe : le catalogue général compte, par exemple, 140 éditions des Mémoires d'outre-tombe, ou plus de 1 800 entrées pour les seules Fables de La Fontaine !
Créée en 1999 à l’initiative de la Société des gens de
lettres (SGDL) et du Syndicat national de l'édition (SNE), la SOFIA
est une société civile de perception et de répartition de droits, administrée
à parité par les auteurs et les éditeurs dans le domaine du Livre. Elle rassemble
aujourd'hui plus de 5 160 auteurs et 150 éditeurs représentant 85 % du
chiffre d'affaires de l’édition.
Christian Roblin, directeur, et Jérôme Lévy, consultant informatique
pour la répartition des différents droits et les bases de données des adhérents
à la SOFIA, ont répondu à nos questions.
Cette société perçoit et répartit la part du livre de la rémunération pour la copie privée numérique, rémunération qui vise à compenser la possibilité offerte aux usagers par les nouvelles technologies de copier, pour un usage privé et strictement personnel, de la musique, des œuvres audiovisuelles ou encore des livres ou des images. A la suite à la loi du 18 juin 2003 relative à la rémunération au titre du prêt en bibliothèque et renforçant la protection sociale des auteurs, par arrêté du Ministre de la culture et de la communication du 7 mars 2005, elle est agréée en qualité de société de perception et de répartition des droits pour la gestion du droit à rémunération au titre du prêt en bibliothèque. Cette loi, effective depuis le 1er août 2003, a connu une période transitoire jusqu’au 31 juillet 2004 et fonctionne à plein régime depuis lors.
La source de financement de ce droit provient, d’une part, d’une prise en charge par l’État sous la forme d’une contribution annuelle calculée sur la base d'un montant forfaitaire par usager inscrit dans les bibliothèques accueillant du public pour le prêt, et, d’autre part, de la vente des livres à ces mêmes bibliothèques par le biais d’une contribution proportionnelle aux achats de livres fixée à 6% du prix public hors taxes versée par les fournisseurs de livres pour le compte des bibliothèques.
Les sommes perçues par SOFIA sont réparties en deux parts : l'une, calculée sur la base des exemplaires achetés chaque année par les bibliothèques de prêt, est versée à part égale directement aux ayants droit, auteurs et éditeurs ; l'autre est versée à la caisse désignée pour abonder la retraite complémentaire des écrivains et des traducteurs, régime instauré par la même loi du 18 juin 2003.
Les redevances, dont les montants sont strictement fixés par la loi, sont réglées par les fabricants et importateurs de supports vierges enregistrables. La SOFIA reverse ces sommes à part égale entre auteurs et éditeurs sur la base d’enquêtes d’usages.
Pour gérer le droit de prêt, outre les déclarations globales des
bibliothèques, la SOFIA recueille
les EAN 13 des livres figurant sur les factures transmises par
les fournisseurs de livres. 90% de ces déclarations se font par
échange de données informatisées. Pour répartir les rémunérations,
nous avons besoin d’informations telles que auteurs, éditeurs,
titres des ouvrages achetés par les bibliothèques de prêt, sachant
que ce sont leurs ayants droit, auteurs et éditeurs, qui bénéficient
de la rémunération. Ces données sont donc essentielles.
SOFIA a comme partenaire DILICOM qui gère le Fichier Exhaustif du Livre
(FEL), base de données commerciale dont les informations proviennent des adhérents
éditeurs/distributeurs. Cette base permet d’historiciser les prix et comporte
des informations bibliographiques (EAN, titres,…). Mais les fichiers de la BnF
nous sont très utiles pour obtenir des informations plus précises
: ce sont les seuls à être aussi riches, étendus et normalisés. Les fichiers
d'autorité et bibliographiques nous renseignent donc avec plus de sûreté sur
les auteurs, leur rôle et les éventuels traducteurs. Ils intègrent entre autres
les titres de l’édition publique.
Dans le cadre de la copie privée numérique, dont les droits sont versés aux adhérents en fonction du nombre de titres et de leur genre, la Dewey a été utilisée, ainsi que le cadre de classement de la Bibliographie nationale française.
Nous utilisons aussi vos fichiers pour actualiser notre base de données bibliographiques des adhérents.
Le format INTERMARC a nécessité une adaptation de notre part sans difficulté majeure d’appropriation, en raison notamment d’expériences antérieures. Il est vrai qu’un format XML à la place de l’ISO 2709 aurait été plus simple à manipuler, mais le volume des données en XML n’aurait pas facilité le transfert. Le vecteur de l’information est moins important que la qualité de celle‑ci.
Et nous tenons à remercier le service de la Coordination des produits et services bibliographiques pour sa disponibilité et son efficacité.
Des clients des produits ont signalé, lors de la récupération de certaines notices, la disparition de certains caractères, voire de certaines zones bibliographiques, comme la zone du titre et de la mention de responsabilité, pourtant affichés dans le catalogue général de la BnF.
D’après notre diagnostic, cela concerne les utilisateurs qui récupèrent les notices en encodage ISO 5426*. En effet, les données incriminées ont été filtrées car elles contenaient des caractères n’appartenant pas à cette norme de codage de caractères.
Si nous produisons aujourd'hui à la BnF nos données bibliographiques en UNICODE* (format que gèrent de plus en plus de SIGB), nous devons donc veiller à ce que les notices puissent être importées en ISO 5426, qui reste le standard le plus universellement compatible avec les catalogues des bibliothèques françaises.
C'est pourquoi, autant que possible en catalogage courant, tout élément typographique de la description n’appartenant pas à l'ISO 5426 est saisi, soit dans une zone parallèle spécifiquement signalée (c’est le cas des formes en écriture non latine), soit dans une zone redoublée, dans le cas de signes isolés. On restitue ainsi dans une zone de variante de titre les formes comprenant, par exemple, une lettre grecque ou le symbole euro. De cette façon, les systèmes qui gèrent l’UNICODE peuvent intégrer les graphies originales, sans risque de perte d’information pour les autres clients.
Néanmoins, des notices créées avant la diffusion de ces consignes, incomplètement mises à jour ou contenant des caractères importés, peuvent échapper à notre vigilance et contenir un caractère bridant l’export des données. Il s’agit d’une anomalie sérieuse qu’il convient de toujours nous rapporter afin que les corrections soient faites dans le catalogue général de la BnF.
Pour signaler une anomalie :
Le vocabulaire RAMEAU a été traduit à titre expérimental dans le langage SKOS* par Antoine Isaac, chercheur à la Vrije universiteit d'Amsterdam, avec la collaboration du Centre national RAMEAU.
Ce travail, qui s'inscrit dans le cadre du projet européen TELplus*, vise à diffuser largement le vocabulaire RAMEAU dans le contexte du Web sémantique*, au moyen d'un langage standardisé.
Des développements ultérieurs (mise à jour automatique des données, conception d'une interface plus intuitive, ...) sont prévus.
Traduction multilingue, mapping, formats, c’est dans ces perspectives futures que Joan Mitchell (OCLC) a introduit le symposium "La Dewey à travers l’Europe : l’usage et le développement de la CDD dans les bibliothèques européennes" au sein de la rencontre annuelle d’EDUG, groupe d’utilisateurs de la classification décimale Dewey en Europe.
Des comptes rendus d’expériences et d’usages associés aux réflexions sur les développements d’avenir ont permis aux différents membres de mesurer ensemble la consolidation de la CDD en Europe et sa diffusion.
Les représentants des pays utilisateurs de la CDD ont livré des analyses à valeur d’évaluation sur les contraintes et les avantages de la Dewey et aussi sur les stratégies mises en place pour tenir compte d’avancées technologiques multiples. La mobilisation des énergies se fait entre autres autour des questions :
Si on a entendu la diversité dans l’histoire culturelle et institutionnelle des uns et des autres ainsi que dans les projets inégalement avancés, les préoccupations sont communes parce qu’elles sont ancrées dans les technologies elles-mêmes appelant de plus en plus de coopération.
La Bibliothèque nationale de France et OCLC* ont signé, le 12 juin 2009, un accord de collaboration. A partir de 2010, les notices bibliographiques de BnF catalogue général seront versées dans WorldCat*, catalogue collectif géré par OCLC et ressource en ligne la plus importante au monde pour la recherche d’information dans les bibliothèques.
La nouvelle version du format INTERMARC B est en ligne depuis le 6 mai 2009.
Cette version est établie à partir de la version 9.0 du format INTERMARC Bibliographique, c’est‑à‑dire la version stabilisée et mise en production dans le catalogue général de la BnF depuis décembre 2008.
Elle intègre les zones d’indexation des documents iconographiques et cartographiques portant notamment sur l’esthétique ou la technique des images ou bien sur la typologie des cartes, mais aussi les zones de transcription des incipit textuels et musicaux, ainsi que toutes les zones spécifiques des notices de spectacle.
La réunion annuelle des responsables de centres régionaux du réseau SUDOC‑PS (ce réseau a la charge du signalement des publications en série dans le SUDOC, catalogue collectif des bibliothèques de l’enseignement supérieur.), organisée par l’ABES le 28 mai dernier, a été consacrée en partie à des questions relatives à l’ISSN :
Comme toute activité, la normalisation documentaire a un coût, une valeur ajoutée et des modèles économiques. 130 personnes ont participé aux débats entre des "consomm'acteurs" issus de différents secteurs (AFNOR, ISO, IFLA, W3C, etc.).
"Conformément à la loi N° 2004-801 du 6 août 2004 relative à la protection des personnes physiques à l'égard des traitements de données à caractère personnel et modifiant la loi N° 78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, tout utilisateur ayant déposé des informations directement ou indirectement nominatives, peut demander la communication de ces informations et les faire rectifier le cas échéant."