BnF-Lettre d'information

ACTUALITÉS DU CATALOGUE

Produits et services bibliographiques
Octobre 2008 | n° 13

Zoom

Les entrepôts OAI : un autre moyen d'accéder aux données de la BnF

La Bibliothèque nationale de France a ouvert deux entrepôts OAI* destinés à faciliter l'accès à ses collections et à ses données. Le premier, OAI-NUM, contient les notices de tous les documents numérisés et accessibles via les bibliothèques numériques Gallica et Gallica2. Le second, OAI-CAT, a pour vocation de contenir l'ensemble des notices des documents de la Bibliothèque nationale de France, numérisés ou non. Il contient actuellement presque 10 millions de notices.

Ces deux entrepôts sont enrichis régulièrement. Ils sont librement moissonnables en vertu du protocole OAI-PMH et nous vous invitons à utiliser ce protocole désormais pour référencer dans vos propres bases les documents numérisés et les données bibliographiques produites par la BnF.

 

Information
A la suite à de nombreux problèmes de connexion au catalogue BN‑OPALE PLUS, la BnF a mené en septembre des travaux pour essayer d'améliorer la qualité du service. Un certain nombre de correctifs ont été apportés suite à des tests, qui ont permis la diminution du nombre d'erreurs. La BnF poursuit ses efforts pour remédier aux problèmes rencontrés par les utilisateurs du catalogue et s'excuse pour la gêne occasionée.
Consulter le communiqué de la Direction sur les dysfonctionnnements du catalogue BN‑OPALE PLUS

À la une 

Le catalogue "BnF archives et manuscrits"

Depuis août 2007, un nouveau catalogue de la Bibliothèque nationale de France est disponible en ligne, BnF archives et manuscrits, qui mérite d'être promu auprès d'un vaste public de professionnels et de chercheurs.

Les contours du catalogue

BnF Archives et manuscrits a pour vocation de décrire les manuscrits et les fonds d'archives ou collections de la Bibliothèque nationale de France conservés au département des Manuscrits, au département des Arts du spectacle et à la Bibliothèque de l’Arsenal. Il décrit donc des objets très divers, mais selon une structure identique fondée sur la DTD* EAD*.

 

Concernant les arts du spectacle, on y trouvera des inventaires de fonds d'archives résultant de l'activité des praticiens du théâtre ou du cinéma, des inventaires de collections constituées par des personnes privées autour de praticiens du théâtre ou du cinéma, des descriptions de manuscrits isolés (correspondances, manuscrits de textes dramatiques ou à caractère documentaire), et les notices anciennement contenues dans la base Palme (Manuscrits littéraires français du 20e siècle, autrefois consultables dans BN‑OPALINE).

 

Les collections du département des Manuscrits y sont représentées par des notices de manuscrits issues des conversions rétrospectives : nouvelles acquisitions françaises, Fonds Pelliot pour les manuscrits chinois, Index Vajda pour les manuscrits arabes, par exemple. Mais aussi par des notices issues du catalogage courant (manuscrits hébreux, latins, grecs, etc.)

 

Pour le moment, seule une petite partie des fonds et collections est recensée dans le catalogue BnF archives et manuscrits ; celui‑ci s'enrichira peu à peu de nouvelles collections, notamment du catalogue des manuscrits de l'Arsenal issu de la rétroconversion, ainsi que des nouvelles acquisitions.

Les dessous du catalogue : EAD et PIXML

Le catalogue BnF archives et manuscrits est encodé selon la DTD* EAD*.

 

La production des unités de description, appelées "instruments de recherche", se fait dans l'application PIXML (Production d'Instruments de recherche en XML), application réalisée pour la BnF par la société 4D Concept, enrichie en 2007 par la société SOLLAN. L'accès se fait au moyen du navigateur Web Internet Explorer et l'édition d'information avec l'éditeur XML XMETAL (dans sa version plug-in Web, XMAX). Une fois les instruments de recherche validés, ils sont publiés via le logiciel PLEADE.

Mode d'emploi : accès et interfaces

L'interface publique propose deux modes de navigation et de recherche :

  • la recherche par "Collections" qui affiche une arborescence par département (Arts du spectacle, Manuscrits, Arsenal) puis par sous-ensemble (fonds, collections, manuscrits etc.) ;
  • la recherche par "Formulaire" permettant une recherche sur l'ensemble des notices, par nom de personne, cote, titre, sujet, année, lieu, avec la possibilité d'utiliser les index et de filtrer par collection.

Il n’y a pas de gestion de fichier d’autorité. Cependant les notices d'autorité de BN‑OPALE PLUS sont utilisées, quand elles existent, pour gérer les accès noms de personne du catalogue BnF archives et manuscrits, permettant ainsi l'exploitation des formes retenues et des renvois pour les recherches dans ce catalogue. L’indexation matière est peu développée. La recherche en texte libre porte sur l’intégralité du texte des descriptions.

 

L'écran de description des collections ou des documents est composé de trois parties : la zone supérieure rappelle la recherche, la zone de gauche décrit l'arborescence de l'objet, ainsi qu'un index, et enfin la zone centrale contient des éléments biographiques, la présentation générale de la collection, et les conditions de communication.

Des liens vers des ressources complémentaires peuvent également être proposés et ils permettent de rebondir d’un instrument de recherche à un autre.

 

Les évolutions

L'application de production des documents en XML-EAD (PIXML) et l'application de publication de ces documents (PLEADE) ont fait l'objet d'évolutions techniques et fonctionnelles en 2008. L'année à venir sera consacrée à l'enrichissement du catalogue.

retour en haut de page

Veille catalogue 

Le catalogue et la bibliothèque numérique : une offre complémentaire

L’offre de documents numérisés de la BnF est en constante expansion, et le rythme de cette croissance s’accélère chaque jour grâce aux marchés de numérisation de masse entamés en 2007. A l’heure où la BnF est en train de rénover sa bibliothèque numérique, Gallica, rappelons que celle-ci n’est qu’un des outils d’accès à cette richesse documentaire. En effet, les documents numériques sont également accessibles via le catalogue BN‑OPALE PLUS. Redondance ou complémentarité ? Quelques éclaircissements s’imposent sur cette pluralité des accès…

Le signalement des documents dans BN‑OPALE PLUS est une condition préalable à leur numérisation. En effet, la première étape de la chaîne de numérisation consiste à vérifier la cohérence de la notice bibliographique qui décrit le document que l’on a sélectionné, et le cas échéant, la correction ou la création de cette notice. Aucun document ne peut donc être numétrisé s’il n’a pas été préalablement signalé dans BN‑OPALE PLUS, à l’exception des manuscrits qui sont signalés dans le catalogue BnF archives et manuscrits.

 

Dans les années 1990, numériser un document était considéré comme produire une nouvelle édition de ce document et celui-ci faisait l’objet d’une notice bibliographique propre. Ce n’est plus le cas aujourd’hui, la politique de la BnF ayant évolué sur ce point  : comme l'exemplaire d'une microforme, l'exemplaire numérique est rattaché à la notice du document original. Le rattachement des objets numériques aux notices les décrivant dans le catalogue est de plus en plus automatisé, notamment dans le cas des fascicules de presse numérisés. La grande majorité des notices des documents numérisés créées dans les années 1990 a été supprimée. Il en reste aujourd’hui environ 4500 à dédoublonner avec les notices décrivant les documents originaux.

 

Ainsi le catalogue est aujourd’hui le référent bibliographique unique pour les documents numérisés. C’est de celui-ci que l’on extrait les notices décrivant les documents numérisés pour les verser dans l’entrepôt OAI-NUM. Les notices OAI-NUM contiennent un lien pérenne vers la notice du catalogue et vers le document consultable dans Gallica. C’est également via le catalogue que le lecteur sur place est informé de la présence d’un exemplaire numérisé.

 

Par ailleurs, tandis que le fonds des documents numérisés accessibles dans Gallica est restreint aux documents libres de droits (jusqu’en 1938 pour les plus récents), on trouve dans BN‑OPALE PLUS les notices d’environ 3500 documents contemporains, pour lesquels des accords ont été passés avec les ayants droit, et qui sont consultables en version numérisée dans les salles de lecture uniquement.

 

Aujourd’hui, l’accès aux documents numérisés par le catalogue et par Gallica ne constitue donc pas une redondance mais correspond à des usages différents d’un même fonds par des publics également très différents, les études ayant montré que deux tiers des internautes utilisant Gallica ne viennent jamais à la BnF.

retour en haut de page

Les invités du mois 

Logo du catalogue BN-OPALE PLUS

Anne Ducomet et Laurent Séguin

Garantir la cohérence de l'information bibliographique dans BN‑OPALE PLUS implique un travail organisé de correction. Anne Ducomet, coordinatrice des corrections du catalogue BN‑OPALE PLUS, et  Laurent Séguin, responsable du Pôle données bibliographiques au département de l'Information bibliographique et numérique, travaillent, avec l'ensemble des services compétents, aux corrections du catalogue. Ils ont accepté de répondre à nos questions.

Les corrections dans BN‑OPALE PLUS

Pourquoi corriger BN‑OPALE PLUS ?

Les données du catalogue proviennent de multiples sources. Si les notices créées depuis la fin des années 1970 sont conformes aux descriptions normalisées, la majorité des notices de BN‑OPALE PLUS sont issues de la rétroconversion* d’anciens catalogues édités ou sur fiches. Certains ont été rédigés pendant plus d’un siècle. Inévitablement, leur contenu et leur qualité sont hétérogènes et il y a des informations lacunaires, ou erronées. Par ailleurs, il existe aussi beaucoup de doublons.

Comment expliquez-vous la présence de doublons ?

Comme nous venons de le dire, à son ouverture en 2002, BN‑OPALE PLUS a accueilli des données auparavant dispersées et qui se recoupaient partiellement : les catalogues informatisés et les conversions rétrospectives des imprimés et de l’audiovisuel. Par souci d’exhaustivité et pour des raisons techniques, tout a alors été restitué, même les descriptions redondantes. De même, les accès qui n’ont pas toujours été formulés exactement de la même façon ont été conservés.

Cependant, BN‑OPALE PLUS contenant plus de 10 millions de notices bibliographiques, la BnF n’a  pas les moyens de les contrôler et de les corriger systématiquement. Il faut donc établir des priorités.

Quelles sont les priorités de correction ?

Nous remédions d’abord aux problèmes qui empêchent la communication des ouvrages, par exemple les erreurs de cote. Nous accordons également une attention particulière aux corrections nécessaires pour faciliter la recherche dans le catalogue et donc l'accès aux documents. Ces erreurs sont souvent signalées par les utilisateurs : personnel, lecteurs en salle ou utilisateurs des données de la BnF.

Parallèlement, des campagnes de corrections "de fond" sont menées sur certains ensembles de notices. Il s’agit encore aujourd’hui majoritairement de corrections manuelles. Pour les compléter, d’autres chantiers de mises à jour automatisées sont développés en partenariat avec le service informatique.

Et pour les doublons ?

Les corrections ont aussi pour objectif la résorption progressive des doublons. L'expertise des catalogueurs chargés des corrections rétrospectives s’avère  indispensable pour s’assurer qu’il s’agit bien du même ouvrage ou du même auteur, et pour ne pas risquer de perdre des informations. Cela représente de longues années de travail de reprise manuelle des notices et nous travaillons aussi avec le service informatique au développement de programmes de dédoublonnage automatisés.

Exemple d'une autorité auteur en grappe dans BN OPALE PLUS
En attendant, pour faciliter la recherche des ouvrages d'un auteur et des notices d'autorité dans BN‑OPALE PLUS, les différentes formes d'un nom venues des anciens catalogues et qui n’ont pas encore été dédoublonnées sont agrégées dans des "grappes" (cf. exemple de Percey F. Smith ci-contre). D’autre part, à  l’occasion des nouveaux chargements, comme les rétroconversions de fichiers des départements spécialisés, nous limitons désormais au maximum l’apport de doublons.

Les informations et les accès des notices diffusées dans les produits courants sont-ils à jour ?

Oui, car les catalogueurs chargés des nouvelles entrées procèdent à toutes les mises à jour nécessaires à la qualité du signalement. A ce titre, un important travail est réalisé, par exemple pour actualiser les informations biographiques dans les notices d’autorité Noms de personne.

 

Pour signaler une erreur
 Cliquer sur " Ecrire à la BnF" (représenté parfois par une enveloppe) dans les pages du site web de la BnF, ou bien utiliser directement l’adresse coordination.catalogue@bnf.fr
retour en haut de page

Vos questions 

Quelle norme et quel système d'indexation géographique pour les documents cartographiques ?

Plusieurs bibliothèques souhaiteraient des précisions sur la norme et le système d'indexation utilisés pour les documents cartographiques. Comment peut-on consulter ces notices dans BN‑OPALE PLUS et les récupérer ?

Réponse de la coordination des produits et de la coordination générale RAMEAU et Noms géographiques

L'indexation des documents cartographiques suit la norme Z44081 qui donne les règles de structuration des vedettes noms géographiques et de l'utilisation des subdivisions.

 

Cette norme préconise des règles de construction différentes de celles de RAMEAU : le nom géographique est l'entrée la plus importante, il est donc toujours le premier élément de la construction. Les subdivisons de sujet selon cette norme doivent correspondre à des descripteurs issus d'une liste d'autorité ou d'un thésaurus, RAMEAU par exemple.

 

A la BnF, dans un souci de cohérence de l'utilisation de la liste RAMEAU et afin de conserver dans BN‑OPALE PLUS l'indexation des documents cartographiques issue de l'ancienne base BN‑OPALINE, il a été décidé de créer des notices d'autorité sujet élémentaires dont la terminologie est semblable à celle de RAMEAU. Ces autorités élémentaires sont donc employées en subdivision aux autorités noms géographiques ou en tête de vedette, pour exprimer les grandes thématiques. Par ailleurs, l’indexation des documents cartographiques permet d'employer en subdivisions aux autorités noms géographiques des précisions géographiques et chronologiques, qui correspondent là encore à des notices d’autorité élémentaires.

 

Néanmoins, ces notices d'autorité élémentaires sont provisoires. Un travail de réflexion est en cours pour harmoniser ces points d'accès dans BN‑OPALE PLUS. Par conséquent, actuellement, seules les notices d'autorité Noms géographiques BnF complètes sont contrôlées.

 

La consultation de ces différentes notices d’autorité (élémentaires et complètes) s’effectue dans BN‑OPALE PLUS par le critère "équation de recherche" GEO. Les autorités noms géographiques complètes sont directement accessibles dans la rubrique Autorités, puis dans Autorités BnF par le critère de recherche Nom géographique BnF.

 

Seules les notices d'autorité Noms géographiques BnF complètes sont récupérables par transfert en ligne depuis BN‑OPALE PLUS et par abonnement aux produits courants et/ou rétrospectifs.

Rencontres et publications

Publication de la traduction de l'ISBD sur le site de la BnF

La BnF a assuré la traduction en français d’International standard bibliographic description (ISBD) : preliminary consolidated edition 2007 de l’IFLA, sous le titre Description bibliographique internationale normalisée (ISBD) : édition intégrée provisoire. Elle en propose la consultation ou le téléchargement.

 

Depuis avril 2007, l'ISBD intégré se substitue aux ISBD spécialisés dont il est la fusion, décidée en 2005 par le Groupe de révision des ISBD de l'IFLA. Il intègre en outre les récentes mises à jour des ISBD(A), ISBD(CM) et ISBD(ER).

L’originalité de cet ISBD est l'harmonisation des règles pour la description de tous les types de ressources (le terme "resource", traduit par "ressource" en français, est utilisé systématiquement pour désigner tout objet de description bibliographique).

L'ISBD intégré prend également en compte les règles introduites par les FRBR*, Functional requirements for bibliographic records (en français Spécifications fonctionnelles des notices bibliographiques).

 

Dans cette traduction, certains exemples donnés en d'autres langues que l'anglais sont traités de façon différente selon le contexte : certains sont traduits tandis que d'autres sont conservés dans leur langue d'origine, accompagnés d'une note de traduction. Il a paru important de garder le caractère international de l'ISBD dans la version en langue française.

en savoir plus sur l'ISBD intégré

74e congrès de l'IFLA cet été à Québec

Sur le thème des "bibliothèques sans frontières : naviguer vers une compréhension globale", le dernier congrès de l'IFLA, s'est tenu à Québec du 10 au 14 août dernier, précédé et suivi de son assemblée générale. L'ensemble des communications est accessible sur le site du comité français IFLA.

Sur le thème "Partager les normes : coopérer avec d'autres acteurs", la Section Catalogage (session 156) avait programmé une communication intitulée "Bibliothèques et archives : partager des normes pour faciliter l’accès au patrimoine" et une présentation des FRBRoo (orienté objet).

"Classification et indexation sans barrières linguistiques" était le thème retenue par la Section Classification et indexation (session 129). L'expérimentation menée conjointement par la BnF, la Bibliothèque nationale des Pays-Bas et l'Université d'Amsterdam en matière de Web sémantique* a été présentée dans ce cadre.

Une réflexion sur Les usages de la Bibliographie nationale française et un rapport d'étape du Groupe de travail chargé de rédiger des recommandations sur les bibliographies nationales à l'ère du numérique ont été les temps forts de la Section Bibliographie (session 162).

1er congrès mondial de l'AIFBD cet été à Montréal

En marge du congrès de l'IFLA, l'Association internationale francophone des bibliothécaires documentalistes, fondée en 2001 et regroupant des professionnels francophones en provenance d’Europe, d’Afrique, d'Asie et d’Amérique du Nord, a tenu son premier congrès mondial du 3 au 6 août 2008 à Montréal. Ce congrès a réuni 240 participants. Parmi les thèmes abordés dans le programme : le travail en réseau et les accès à l'information, la formation et les compétences des professionnels, les publics et les nouveaux usages, les SIGB libres, etc.

 

La séance sur les outils d'accès à l'information a été l'occasion de présenter RAMEAU, son nouveau site, et plus particulièrement, le Fichier national des propositions RAMEAU comme exemple d'outil collaboratif au service d'un travail en réseau dans un contexte francophone.

Lexique

Conversion rétrospective (ou rétroconversion)
Nom donné aux opérations d’informatisation d’anciens fichiers bibliographiques sur support papier (par exemple, des catalogues imprimés ou sur fiches). Soixante cinq bibliothèques municipales ou spécialisées proposent ainsi via le Catalogue collectif de France les données issues de la rétroconversion de leurs fonds anciens . A la BnF, les chantiers les plus importants en volume sont ceux de la Conversion rétrospective des imprimés (CRI) et de la Conversion rétrospective de l’audiovisuel (CRA), ainsi que ceux des départements spécialisés toujours en cours.
DTD : Document Type Definition
(Définition de type de document)
Une DTD fixe l’ensemble des règles définissant la structure arborescente d’un document XML pour une catégorie donnée de documents : l’intitulé des éléments, leur caractère obligatoire ou facultatif, leur ordre de succession ou leur imbrication, etc. Lorsqu'un document XML respecte une DTD, on dit qu’il est valide.
EAD : Encoded Archival Description
(Description archivistique encodée)
L'EAD est le schéma de métadonnées (disponible sous forme d'une DTD ou d'un schéma XML) défini par la Société des Archivistes Américains pour produire et publier les instruments de recherche qui permettent d’exploiter des fonds d’archives, en conformité avec la Norme de description archivistique ISAD(G). Sa première édition date de 1998. Elle s'appuie sur le langage de balisage XML et permet d'une part de rendre compte de la structure hiérarchique d'un fonds ou d'un document isolé, d'autre part d'intégrer au texte même de la description archivistique les formes normalisées qui vont alimenter les index et permettre la navigation au sein de la base documentaire. Ce format tend de plus en plus à s'imposer dans les bibliothèques françaises pour les collections de manuscrits, et un groupe de l'AFNOR va commencer à travailler à l'établissement d'un Guide national des bonnes pratiques en EAD dans les bibliothèques françaises.
consulterle site des Archives de France pour des informations complètes sur cette DTD.
FRBR
Functional Requirements for Bibliographic Records
Modèle conceptuel de données bibliographiques élaboré en 1997 par l’IFLA ayant pour caractéristique notamment de décrire chaque oeuvre dans sa relation avec les autres oeuvres (traductions, oeuvres du même auteur, éditions d'une même oeuvre etc.), ainsi qu'avec les personnes et collectivités, concepts, lieux, événements s'y rapportant. Il repose sur une description du document à quatre niveaux, en tant qu'objet ou item, en tant que publication ou manifestation, en tant qu'expression d'une activité intellectuelle d'une ou plusieurs personnes, et enfin en tant qu'oeuvre c'est-à-dire création abstraite. Le rapport Functional requirements for bibliographic records a été traduit en français sous le titre Spécifications fonctionnelles des notices bibliographiques.
ISBD
International Standard for Bibliographic Description
Description bibliographique internationale normalisée, élaborée par l’IFLA et constituant un ensemble normatif de règles validées au niveau international, pour la description bibliographique de toute ressource publiée existant dans les bibliothèques, quel qu’en soit le support.
OAI : Open Archives Initiative
(Initiative pour les archives ouvertes)
L'Open archives initiative est une organisation internationale dont l'objectif est de créer des standards libres et ouverts pour faciliter la visibilité sur Internet des archives numériques. Elle est à l'origine du protocole technique OAI-PMH (Protocol for Metadata Harvesting, protocole pour la collecte des métadonnées) qui permet d'échanger des métadonnées descriptives de ressources numériques. Seules les métadonnées sont échangées, les documents restent accessibles uniquement sur le site d'origine, via une URL contenu dans la notice OAI.
Une bibliothèque peut exposer ses métadonnées sur un serveur Internet (appelé "entrepôt") afin qu'elles soient automatiquement récupérées (ou "moissonnées") par un ou plusieurs fournisseurs de services (autres bibliothèques, sites portails, moteurs de recherche, etc.).
Le protocole OAI-PMH utilise XML comme langage de transport des métadonnées, HTTP comme langage de communication entre serveurs et le Dublin Core simple comme format de métadonnées descriptives.
Web sémantique
Ensemble de technologies permettant une description approfondie et structurée des données du Web en vue d'un accès performant et global à ces données. Le Web sémantique repose notamment sur le modèle RDF (Resource Description Framework) destiné à décrire les données et leurs relations entre elles selon la syntaxe suivante : sujet - prédicat - objet. L'intérêt du Web sémantique pour les bibliothèques réside dans la capacité à créer davantage de liens entre les données des catalogues, dans la même conception que les modèles de données tels que les FRBR*, et à les rendre plus visibles sur le Web.
retour en haut de page
Contact : coordination-bibliographique@bnf.fr

"Conformément à la loi N° 2004-801 du 6 août 2004 relative à la protection des personnes physiques à l'égard des traitements de données à caractère personnel et modifiant la loi N° 78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, tout utilisateur ayant déposé des informations directement ou indirectement nominatives, peut demander la communication de ces informations et les faire rectifier le cas échéant."

Direction de publication : Bruno Racine, Jacqueline Sanson
Bibliothèque nationale de France, Quai François Mauriac
75706 Paris Cedex 13