BnF-Lettre d'information Site BnF accueilActualités du catalogue accueil
Juin 2009 | n° 16

ACTUALITÉS DU CATALOGUE

Produits et services bibliographiques
Juin 2009 | n° 16

Zoom

L'amélioration de la qualité du catalogue général en 2008

Le catalogue général de la BnF contient plus de 10,8 millions de notices bibliographiques et environ 5 millions de notices d'autorité dont plus de la moitié provient de l'informatisation d'anciens catalogues imprimés ou sur fiches.

En 2008, les services chargés des corrections rétrospectives ont mis à jour 115 000 notices bibliographiques (soit l'équivalent de 1 % du volume du catalogue) et en ont dédoublonnées près de 60 000 (0,5 %). Ils ont également corrigé ou supprimé plus de 83 600 notices d'autorité (1,6 % du fichier d'autorité).

Certaines de ces corrections concernent des anomalies qui nous sont signalées, d'autres sont réalisées à l'occasion du programme de numérisation des fonds de la BnF. Par ailleurs, certaines corrections sont effectuées au cours de chantiers organisés sur des ensembles définis, dont deux exemples sont proposés dans la rubrique Veille catalogue.

 

À la une 

Un nouveau mode de recherche dans le catalogue général de la BnF : rechercher par mots de la notice

Depuis début avril, une recherche par mots de la notice est disponible dans le catalogue général de la BnF. Plus facile à utiliser et plus complète, elle permet d’interroger tous les types de notices et de données.

De nouvelles interfaces

Cette évolution majeure se traduit par d’importantes modifications dans l’agencement des différents écrans de recherche et dans la présentation des résultats. La colonne de gauche de l’interface de recherche a été réorganisée pour distinguer, dans les "recherches simples" et les "recherches avancées", les recherches traditionnelles "par index" (passage obligatoire par des entrées d’index) des nouvelles recherches "par mots".

 

La recherche par mots peut s'effectuer sur trois grands ensembles de filtres : par collections, par types de document, par types de notice.

 

L'affichage des résultats est immédiat sous la forme de listes de notices abrégées. Des fonctions permettent de détailler ou de modifier la recherche et de naviguer à travers les pages de résultats. Plusieurs possibilités de tri (croissant ou décroissant) sont offertes sur ces listes présentées par défaut selon la pertinence du moteur de recherche : par date, par auteur, par titre. On peut aussi affiner les résultats obtenus par collections, types de documents et types de notices.

 

La recherche simple permet une saisie intuitive à l'intérieur d'un seul champ de recherche dans lequel la casse, l’ordre des mots et l’accentuation sont indifférents. Le "et " est implicite entre les termes saisis et il est possible d’utiliser la troncature à droite (avec *).

 

La recherche avancée permet d'effectuer la recherche soit sur l'ensemble du contenu de la notice, soit sur certains de ses éléments qui peuvent être croisés.

 

La recherche par mots est également disponible dans les notices "autorités BnF" et RAMEAU.

Les atouts de la recherche par mots

L’accès à de nouvelles données jusque-là "enfouies"

 

Tous les mots sont indexés quel que soit leur positionnement dans la notice : notes des notices bibliographiques, données codées, notes liées aux exemplaires, supports, caractéristiques techniques, etc.

 

La disparition des seuils dans la recherche

 

Les recherches ramenant beaucoup de réponses sont désormais possibles. Malgré tout le feuilletage de pages est limité à …10 000 résultats ! Mais il est toujours possible d'affiner sa recherche.

Quelques exemples de recherches…

  • On peut par exemple lancer des recherches sur les supports ou les caractéristiques techniques figurant dans les zones codées des notices bibliographiques décrivant des ressources électroniques ou des documents audiovisuels.
  • Ou bien encore, rechercher des personnes ou des collectivités par leur nationalité.
  • On peut aussi lancer une recherche sur le mot "autographe" pour retrouver, par exemple, des données d'exemplaires contenant ce mot.
  • Ou encore, en interrogeant par une vedette matière en anglais issue des LCSH, retrouver la ou les notices RAMEAU correspondante(s).

 

Nous vous invitons à découvrir et explorer ce nouveau mode de recherche, en consultant l'Aide en ligne du catalogue général pour plus de détails sur les modes et les critères de recherche, ainsi que sur l'affichage des résultats. Puis lancez‑vous et découvrez par vous‑même ce que cette nouvelle offre peut vous apporter !

 

retour en haut de page

Veille catalogue 

Deux exemples de chantiers de corrections dans le catalogue général de la BnF

Parmi les chantiers de corrections des données du catalogue en cours de réalisation, citons ceux portant sur les notices d'autorité des auteurs français décédés au XXe siècle et sur les notices bibliographiques des œuvres des académiciens français.

Les auteurs français décédés au XXe siècle : un chantier prioritaire

Depuis l’existence du fichier d’autorité, l’exploitation régulière des notices nécrologiques de grands quotidiens a toujours été effectuée. Néanmoins, dans les notices d’autorité identifiant les personnes, les dates de naissance sont plus fréquentes que les dates de décès. Or ces dernières constituent des métadonnées capitales dans le cadre de la gestion des droits. La BnF ayant lancé un projet de gestion automatisée du calcul des droits d'accès aux documents numérisés, il était devenu nécessaire de disposer des informations permettant de déterminer si les œuvres étaient ou non dans le domaine public.

 

Selon la législation européenne, la durée de protection des œuvres, au titre du droit d’auteur, est de soixante‑dix ans après le décès de leur auteur. Mais, pour les auteurs, les compositeurs ou les artistes ayant été reconnus "morts pour la France" par l’État, la durée de protection a été prorogée d'une durée de trente ans. Il est donc devenu incontournable d’ajouter cette mention dans les notices d'autorité (création d’une zone spécifique dans le format INTERMARC pour une exploitation automatisée).

 

Un chantier de vérification de masse et de mise à niveau des notices d’autorité a été entrepris en exploitant systématiquement un certain nombre d'ouvrages et de bases de données sur les Français décédés. Il comporte deux volets : l’un général et l’autre spécifique consacré aux auteurs morts pour la France au cours des conflits du XXe siècle. L’objectif est de vérifier et compléter les notices d’autorité d’environ 10 700 personnalités françaises décédées au XXe siècle. D’après une série de tests, approximativement 4 500 notices nécessitaient une mise à niveau ou des dédoublonnages.

 

Le volet général et le volet spécifique du chantier sont menés simultanément depuis juin 2008. Au 30 avril, 2 395 notices ont été mises à jour.

Les académiciens français

Ce chantier prévoit la révision systématique des notices bibliographiques associées aux 718 membres de l’Académie française depuis sa fondation. Pourquoi ce choix ? Ce corpus permet de traiter un ensemble représentatif d’ouvrages de personnalités de notoriété diverse, qu'elles soient restées célèbres ou aient marqué leur temps, dans des disciplines variées : hommes de lettres, historiens, philosophes, hommes politiques, diplomates, militaires, hommes d’Église.

 

En moyenne, le tiers des notices de ces auteurs figurant dans le catalogue nécessite une correction : amélioration des données signalétiques (reformatage), des accès (contrôle des liens), des données d’exemplaires.

Par ailleurs, 15 % de notices bibliographiques associées à ces auteurs s’avèrent être des doublons et sont éliminées du catalogue à l’occasion du chantier.

Après traitement, les corpus liés à ces auteurs constituent donc des ensembles fiables en ce qui concerne le contenu et le format. Leur identification en est facilitée.

 

A ce jour, les correcteurs du service Coordination et administration des métadonnées ont traité les notices bibliographiques des œuvres de 180 académiciens, soit le quart des auteurs concernés, parmi lesquels Bergson, Chateaubriand, Musset et la plupart des académiciens en activité.

Le volume à traiter est considérable : 38 000 notices bibliographiques ont déjà été contrôlées, 13 000 corrigées et 5 600 dédoublonnées. Il reste encore beaucoup à faire ! Le travail porte notamment sur des classiques abondamment publiés, ce qui rend leur identification complexe : le catalogue général compte, par exemple, 140 éditions des Mémoires d'outre-tombe, ou plus de 1 800 entrées pour les seules Fables de La Fontaine !

retour en haut de page

Les invités du mois 

Logo de la Sofia

Christian Roblin et Jérôme Lévy

Société française des intérêts des auteurs de l'écrit (SOFIA)

Créée en 1999 à l’initiative de la Société des gens de lettres (SGDL) et du  Syndicat national de l'édition (SNE), la SOFIA est une société civile de perception et de répartition de droits, administrée à parité par les auteurs et les éditeurs dans le domaine du Livre. Elle rassemble aujourd'hui plus de 5 160 auteurs et 150 éditeurs représentant 85 % du chiffre d'affaires de l’édition.
Christian Roblin, directeur, et Jérôme Lévy, consultant informatique pour la répartition des différents droits et les bases de données des adhérents à la SOFIA, ont répondu à nos questions.

Quel est le rôle de la SOFIA ?

Cette société perçoit et répartit la part du livre de la rémunération pour la copie privée numérique, rémunération qui vise à compenser la possibilité offerte aux usagers par les nouvelles technologies de copier, pour un usage privé et strictement personnel, de la musique, des œuvres audiovisuelles ou encore des livres ou des images. A la suite à la loi du 18 juin 2003 relative à la rémunération au titre du prêt en bibliothèque et renforçant la protection sociale des auteurs, par arrêté du Ministre de la culture et de la communication du 7 mars 2005, elle est agréée en qualité de société de perception et de répartition des droits pour la gestion du droit à rémunération au titre du prêt en bibliothèque. Cette loi, effective depuis le 1er août 2003, a connu une période transitoire jusqu’au 31 juillet 2004 et fonctionne à plein régime depuis lors.

Comment est financé le droit de prêt ?

La source de financement de ce droit provient, d’une part, d’une prise en charge par l’État sous la forme d’une contribution annuelle calculée sur la base d'un montant forfaitaire par usager inscrit dans les bibliothèques accueillant du public pour le prêt, et, d’autre part, de la vente des livres à ces mêmes bibliothèques par le biais d’une contribution proportionnelle aux achats de livres fixée à 6% du prix public hors taxes versée par les fournisseurs de livres pour le compte des bibliothèques.

 

Les sommes perçues par SOFIA sont réparties en deux parts : l'une, calculée sur la base des exemplaires achetés chaque année par les bibliothèques de prêt, est versée à part égale directement aux ayants droit, auteurs et éditeurs ; l'autre est versée à la caisse désignée pour abonder la retraite complémentaire des écrivains et des traducteurs, régime instauré par la même loi du 18 juin 2003.

Et celui de la copie numérique ?

Les redevances, dont les montants sont strictement fixés par la loi, sont réglées par les fabricants et importateurs de supports vierges enregistrables. La SOFIA reverse ces sommes à part égale entre auteurs et éditeurs sur la base d’enquêtes d’usages.

Pourquoi les fichiers de la BnF ?

Pour gérer le droit de prêt, outre les déclarations globales des bibliothèques, la SOFIA recueille les EAN 13 des livres figurant sur les factures transmises par les fournisseurs de livres. 90% de ces déclarations se font par échange de données informatisées. Pour répartir les rémunérations, nous avons besoin d’informations telles que auteurs, éditeurs, titres des ouvrages achetés par les bibliothèques de prêt, sachant que ce sont leurs ayants droit, auteurs et éditeurs, qui bénéficient de la rémunération. Ces données sont donc essentielles.
SOFIA a comme partenaire DILICOM qui gère le Fichier Exhaustif du Livre (FEL), base de données commerciale dont les informations proviennent des adhérents éditeurs/distributeurs. Cette base permet d’historiciser les prix et comporte des informations bibliographiques (EAN, titres,…). Mais les fichiers de la BnF nous sont très utiles pour obtenir des informations plus précises : ce sont les seuls à être aussi riches, étendus et normalisés. Les fichiers d'autorité et bibliographiques nous renseignent donc avec plus de sûreté sur les auteurs, leur rôle et les éventuels traducteurs. Ils intègrent entre autres les titres de l’édition publique.  

 

Dans le cadre de la copie privée numérique, dont les droits sont versés aux adhérents en fonction du nombre de titres et de leur genre, la Dewey a été utilisée, ainsi que le cadre de classement de la Bibliographie nationale française.

 

Nous utilisons aussi vos fichiers pour actualiser notre base de données bibliographiques des adhérents.

Avez-vous rencontré des difficultés dans l’utilisation de nos données ?

Le format INTERMARC a nécessité  une adaptation de notre part sans difficulté majeure d’appropriation, en raison notamment d’expériences antérieures. Il est vrai qu’un format XML à la place de l’ISO 2709 aurait été plus simple à manipuler, mais le volume des données en XML n’aurait pas facilité le transfert. Le vecteur de l’information est moins important que la qualité de celle‑ci.

Et nous tenons à remercier le service de la Coordination des produits et services bibliographiques pour sa disponibilité et son efficacité.

 

retour en haut de page

Vos questions 

Pourquoi manque-t-il des zones dans la notice bibliographique BnF que j'ai importée ?

Des clients des produits ont signalé, lors de la récupération de certaines notices, la disparition de certains caractères, voire de certaines zones bibliographiques, comme la zone du titre et de la mention de responsabilité, pourtant affichés dans le catalogue général de la BnF.

D’après notre diagnostic, cela concerne les utilisateurs qui récupèrent les notices en encodage ISO 5426*. En effet, les données incriminées ont été filtrées car elles contenaient des caractères n’appartenant pas à cette norme de codage de caractères.

 

Si nous produisons aujourd'hui à la BnF nos données bibliographiques en UNICODE* (format que gèrent de plus en plus de SIGB), nous devons donc veiller à ce que les notices puissent être importées en ISO 5426, qui reste le standard le plus universellement compatible avec les catalogues des bibliothèques françaises.

 

C'est pourquoi, autant que possible en catalogage courant, tout élément typographique de la description n’appartenant pas à l'ISO 5426 est saisi, soit dans une zone parallèle spécifiquement signalée (c’est le cas des formes en écriture non latine), soit dans une zone redoublée, dans le cas de signes isolés. On restitue ainsi dans une zone de variante de titre les formes comprenant, par exemple, une lettre grecque ou le symbole euro. De cette façon, les systèmes qui gèrent l’UNICODE peuvent intégrer les graphies originales, sans risque de perte d’information pour les autres clients.

 

Néanmoins, des notices créées avant la diffusion de ces consignes, incomplètement mises à jour ou contenant des caractères importés, peuvent échapper à notre vigilance et contenir un caractère bridant l’export des données. Il s’agit d’une anomalie sérieuse qu’il convient de toujours nous rapporter afin que les corrections soient faites dans le catalogue général de la BnF.

 

Pour signaler une anomalie :
coordination.catalogue@bnf.fr ou coordination‑bibliographique@bnf.fr

Rencontres et publications

RAMEAU en SKOS

Le vocabulaire RAMEAU a été traduit à titre expérimental dans le langage SKOS* par Antoine Isaac, chercheur à la Vrije universiteit d'Amsterdam, avec la collaboration du Centre national RAMEAU.

Ce travail, qui s'inscrit dans le cadre du projet européen TELplus*, vise à diffuser largement le vocabulaire RAMEAU dans le contexte du Web sémantique*, au moyen d'un langage standardisé.

Des développements ultérieurs (mise à jour automatique des données, conception d'une interface plus intuitive, ...) sont prévus.

consulter le prototype

Journées EDUG : utilisation de la classification Dewey en Europe, Vienne, 28 avril 2009

Traduction multilingue, mapping, formats, c’est dans ces perspectives futures que Joan Mitchell (OCLC) a introduit le symposium "La Dewey à travers l’Europe : l’usage et le développement de la CDD dans les bibliothèques européennes" au sein de la rencontre annuelle d’EDUG, groupe d’utilisateurs de la classification décimale Dewey en Europe.

 

Des comptes rendus d’expériences et d’usages associés aux réflexions sur les développements d’avenir ont permis aux différents membres de mesurer ensemble la consolidation de la CDD en Europe et sa diffusion.

 

Les représentants des pays utilisateurs de la CDD ont livré des analyses à valeur d’évaluation sur les contraintes et les avantages de la Dewey et aussi sur les stratégies mises en place pour tenir compte d’avancées technologiques multiples. La mobilisation des énergies se fait entre autres autour des questions :

  • de traduction dans les langues nationales,
  • de mise en ligne de l’outil Dewey ,
  • des services à l’utilisateur dont les améliorations sont toujours recherchées,
  • de l’alignement entre sujets et indices DEWEY.

 

Si on a entendu la diversité dans l’histoire culturelle et institutionnelle des uns et des autres ainsi que dans les projets inégalement avancés, les préoccupations sont communes parce qu’elles sont ancrées dans les technologies elles-mêmes appelant de plus en plus de coopération.

Le catalogue général de la BnF participera à WorldCat en 2010

La Bibliothèque nationale de France et OCLC* ont signé, le 12 juin 2009, un accord de collaboration. A partir de 2010, les notices bibliographiques de BnF catalogue général seront versées dans WorldCat*, catalogue collectif géré par OCLC et ressource en ligne la plus importante au monde pour la recherche d’information dans les bibliothèques.

Format INTERMARC B nouvelle version en ligne

La nouvelle version du format INTERMARC B est en ligne depuis le 6 mai 2009.

Cette version est établie à partir de la version 9.0 du format INTERMARC Bibliographique, c’est‑à‑dire la version stabilisée et mise en production dans le catalogue général de la BnF depuis décembre 2008.

Elle intègre les zones d’indexation des documents iconographiques et cartographiques portant notamment sur l’esthétique ou la technique des images ou bien sur la typologie des cartes, mais aussi les zones de transcription des incipit textuels et musicaux, ainsi que toutes les zones spécifiques des notices de spectacle.

Réunion annuelle du SUDOC‑PS, 28 mai 2009

La réunion annuelle des responsables de centres régionaux du réseau SUDOC‑PS (ce réseau a la charge du signalement des publications en série dans le SUDOC, catalogue collectif des bibliothèques de l’enseignement supérieur.), organisée par l’ABES le 28 mai dernier, a été consacrée en partie à des questions relatives à l’ISSN :

  • Numérotation des collections de monographies : quelles priorités dans les demandes adressées par les centres régionaux au Réseau de l'ISSN ?
  • projet d'évolution pour la gestion des demandes ISSN par l'ABES après rappel du circuit actuel ;
  • annonce des principales nouveautés du Manuel de l’ISSN dont la version anglaise a été publiée en janvier 2009 par le Centre international de l'ISSN ;
  • présentation du bilan chiffré 2008 du Centre ISSN France et annonce de la mise en ligne prochaine de l'édition française du Manuel de l'ISSN.

"A qui profite la normalisation documentaire ?" Journée AFNOR‑BnF, 5 juin 2009

Comme toute activité, la normalisation documentaire a un coût, une valeur ajoutée et des modèles économiques. 130 personnes ont participé aux débats entre des "consomm'acteurs" issus de différents secteurs (AFNOR, ISO, IFLA, W3C, etc.).

Lexique

ISO 5426
Norme qui définit le jeu de caractères latins codés, avec ou sans diacritiques, pour l'échange d'information bibliographique.
OCLC = Online Computer Library Center
Le Online Computer Library Center (OCLC), fondé en 1967, est une organisation à but non lucratif mondiale au service des bibliothèques dont l'objectif est d'offrir un meilleur accès public aux informations et d’en réduire le coût. 71 700 bibliothèques dans le monde utilisent les services de l'OCLC afin de trouver les notices bibliographiques correspondant aux documents qu'elles possèdent, de cataloguer ou de localiser leurs ouvrages.
SKOS
Simple Knowledge Organisation System
Système simple d'organisation des connaissances
SKOS est un langage permettant la représentation formalisée de thésaurus, répertoires de vedettes‑matière et autres types de vocabulaires contrôlés et structurés, ainsi que l’expression de correspondances (alignements) entre vocabulaires. SKOS est développé par le W3C dans le cadre du Web sémantique.
UNICODE (ISO 10646)
Standard informatique international donnant à tout caractère de n'importe quel système d’écriture un identifiant numérique dans un référentiel unique, présenté par blocs correspondant aux différentes écritures (latine, grecque, cyrillique, arménienne, hébraïque, arabe, devanagari, hangul, etc.)
TELplus
TELplus est un programme de The European Library visant à améliorer l’accès aux contenus signalés dans TEL. Un volume important de ressources numériques "océrisées" sera ainsi rendu accessible ; les entrepôts OAI seront utilisés à cet effet. La recherche multilingue constitue un des axes du programme TELplus en vue d’améliorer l’accès aux contenus.
Web sémantique
Ensemble de technologies permettant une description approfondie et structurée des données du Web en vue d'un accès performant et global à ces données. Le Web sémantique repose notamment sur le modèle RDF (Resource Description Framework) destiné à décrire les données et leurs relations entre elles selon la syntaxe suivante : sujet - prédicat - objet. L'intérêt du Web sémantique pour les bibliothèques réside dans la capacité à créer davantage de liens entre les données des catalogues, dans la même conception que les modèles de données tels que les FRBR (Functional Requirements for Bibliographic Records), et à les rendre plus visibles sur le Web.
WorldCat
WorldCat est un catalogue collectif en ligne géré par l’OCLC (Online Computer Library Center), réputé le plus grand catalogue OPAC (Online public access catalog) du monde. Créé en 1971, il contient les données relatives à plus de 71 700 bibliothèques (dont plus de 16 000 hors des États‑Unis) réparties dans 105 pays, soit 137 millions de notices.
retour en haut de page
Contact : coordination-bibliographique@bnf.fr

"Conformément à la loi N° 2004-801 du 6 août 2004 relative à la protection des personnes physiques à l'égard des traitements de données à caractère personnel et modifiant la loi N° 78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, tout utilisateur ayant déposé des informations directement ou indirectement nominatives, peut demander la communication de ces informations et les faire rectifier le cas échéant."

Direction de publication : Bruno Racine, Jacqueline Sanson
Bibliothèque nationale de France, Quai François Mauriac
75706 Paris Cedex 13