BnF-Lettre d'information Site BnF accueilActualités du catalogue accueil
Février 2010 | n° 18

ACTUALITÉS DU CATALOGUE

Produits et services bibliographiques
Février 2010 | n° 18

Zoom

Serveur Z39.50 : un accès plus fluide

Le service informatique de la BnF a mis en œuvre des moyens matériels et techniques pour améliorer la connexion au serveur Z39.50*.

Un serveur plus robuste a été installé le 17 décembre 2009. L'adresse d'accès reste inchangée : z3950.bnf.fr.

De plus, de nombreuses connexions inactives encombraient notre serveur. Pour résoudre ce problème et permettre un accès plus fluide, les connexions sont automatiquement coupées après 15 minutes d’inactivité.

À noter : si vous avez des problèmes de connexion, une réinitialisation de votre pare-feu doit être effectuée. L'adresse IP du serveur de la BnF à déclarer dans votre pare-feu doit être z3950.bnf.fr.

En savoir plussur Z39.50

 

À la une 

Des notices extra-fraîches grâce à l'Extranet du dépôt légal

Depuis juillet 2009, la BnF met en ligne un nouveau service à destination des éditeurs de livres et de périodiques : l’Extranet du dépôt légal des éditeurs. C’est un site sécurisé qui permet aux éditeurs d’enregistrer leurs déclarations de dépôt légal en ligne, de recevoir leurs récépissés électroniques et de suivre les étapes du traitement de leur dépôt à la BnF.

Page d'accueil de l'extranet éditeur
Des données disponibles dès la date de publication

Les éditeurs doivent déposer leurs publications au plus tard le jour de leur mise en circulation. Dès la réception des documents à la BnF, les données bibliographiques saisies par les éditeurs dans l’Extranet sont importées dans le catalogue. C’est ainsi que sont générées des notices non normalisées, annonçant les nouveautés et contenant les éléments essentiels d’identification fournis par l’éditeur.

Ces notices sont ensuite complétées par les services de la Bibliographie nationale française-Livres et Périodiques pour offrir des notices complètes et conformes aux normes de catalogage.

 

Comment les reconnaître ?

Exemple d'une notice livre créée par un éditeur
importée dans le catalogue

 

Exemple d'une notice saisie dans l'extranet par un éditeur
Les notices importées de l’Extranet ont un statut de "notice élémentaire*".

Elles contiennent les données telles qu’elles ont été saisies par l’éditeur :
- pour les livres : titre, auteur, éditeur, date de publication, collection, format, prix, ISBN et EAN ;
- pour les périodiques : titre, éditeur, date de publication et périodicité.

Elles peuvent être récupérées en ligne, par panier ou via le protocole Z39.50, comme notices de gestion par exemple pour effectuer des commandes, mais elles ne figurent pas dans les produits extraits du catalogue.

 

Et après ?

 

Une fois complétées par les services de catalogage et enrichies avec des liens aux notices d’autorité, elles prennent le statut de "notice complète*". Après avoir été soumises à des opérations de contrôle qualité, les notices sont publiées dans la Bibliographie nationale française : cette étape finale est identifiable grâce à la présence d'un numéro de Bibliographie nationale (zone 015 en INTERMARC, zone 020 en UNIMARC).

 

Petit rappel concernant le statut : en INTERMARC, zone 000 position 6, valeur 9 pour "notice élémentaire" et valeur 0 pour "notice complète".

 

retour en haut de page

Veille catalogue 

Le catalogue général de la BnF : bilan 2009

Les contenus

Au 31 décembre 2009, le catalogue général de la BnF comptait plus de 11 millions de notices bibliographiques, soit 200 000 notices supplémentaires par rapport à 2008.

 

Le catalogue contient par ailleurs un peu plus de 5 millions de notices d’autorité (complètes et élémentaires), soit 28 350 de plus qu’en 2008.

 

2 millions de ces notices d’autorité sont diffusées dans les produits (soit 40 % du total, avec une nette progression pour les notices de collectivités).

 

La répartition entre les différents types de notices d’autorité (Noms de personne, Collectivités, Titres, Rameau, Dewey, Noms géographiques) n'a pas changé en 2009, par rapport à 2008.

 

La part des notices bibliographiques créées directement dans le catalogue depuis février 2002 (date de son ouverture) représente 12,6 % du total. Celles qui proviennent de conversions rétrospectives représentent près de 50 % et celles issues des anciennes bases informatiques (lesquelles comportaient elles-mêmes aussi le résultat de rétroconversions) près de 38 %.

 

Les types de documents décrits se répartissent comme suit :

Répartition par types de documents dans le catalogue général de la BnF en 2009

 

La part de l’imprimé a augmenté en 2009 tandis que celle des images fixes baissait.

 

Les langues les plus représentées restent le français, l’anglais, l’allemand, le latin, l’italien et l’espagnol.

La consultation

Entre le 1er janvier et le 31 décembre 2009, le catalogue général a reçu plus de 3,3 millions de visites, soit une moyenne de 9 041 par jour (8 672 en 2008, soit une augmentation quotidienne de près de 370 visites), par plus de 2,4 millions de visiteurs différents (100 000 de plus qu’en 2008). Au total, ce sont presque 29 millions de pages qui ont été consultées pendant cette période.

 

La courbe de consultation du catalogue général en 2009 est la suivante :

Courbe de consultation du catalogue général en 2009

Source : XiTi, service de mesure d'audience et de statistiques pour les sites Web

 

Les internautes restent majoritairement localisés en France (80,5 %). Nos voisins belges, italiens, espagnols arrivent en tête des statistiques de consultation après la France.

 

Les comportements des internautes demeurent identiques à ce qui avait été observé en 2008 : on accède au catalogue général de la BnF à partir d’un même poste une, voire plusieurs fois par jour. Les durées des sessions sont très variables, entre 1 et 30 minutes. En moyenne, 7,5 pages sont consultées par visite.

retour en haut de page

L'invité du mois 

Éric Kergosien, Laboratoire informatique de l’Université de Pau et des Pays de l’Adour

Éric Kergosien

Laboratoire informatique de l’Université de Pau et des Pays de l’Adour
http://ekergosien.free.fr/

Éric Kergosien est doctorant en informatique à l’Université de Pau, avec pour sujet de thèse : "Indexation, recherche et navigation hybride au sein de fonds documentaires territorialisés". Il a bien voulu répondre à nos questions sur son travail de recherche qui prend notamment en compte, d’une manière originale, l’indexation RAMEAU de fonds numérisés.

Représentation sémantique d’un territoire à partir de RAMEAU

Quel est votre projet de recherche ?

Nos travaux s’inscrivent dans un projet visant à décrire un territoire - en l’occurrence, Pau et sa région - par le biais de documents patrimoniaux numérisés le concernant (textes, images, etc.). L’objectif est d’aboutir à une représentation sémantique visuelle qui mette en valeur le territoire à partir des indexations RAMEAU des documents concernés. À terme, il s’agit de proposer une interface permettant à tout type d’utilisateur de découvrir ce territoire en naviguant à travers les documents qui le décrivent.

Disposez-vous de partenariats pour mener à bien ce projet ?

Oui, ce travail fait l’objet d’une collaboration entre plusieurs partenaires : le Laboratoire informatique de l’Université de Pau, l’entreprise Document Image Solution, localisée à Bidart, et la communauté d’agglomération de Pau. En outre, nous travaillons à partir des documents patrimoniaux numérisés par la médiathèque de Pau, avec laquelle nous sommes en contact étroit, et la BnF nous a fourni une extraction du référentiel RAMEAU. Nous sommes également en relation avec le Centre national RAMEAU.

Pouvez-vous nous résumer votre démarche ?

Une grande partie des fonds documentaires indexés par les bibliothécaires correspond à des documents "territorialisés" : ils décrivent/racontent un territoire donné (études, récits de voyage, contes, cartes postales, etc.). Nous avons donc cherché à identifier un ensemble de données géographiques, temporelles et thématiques relatives à cet espace. L’expérimentation a été menée sur un corpus de 750 notices décrivant des documents consacrés au patrimoine culturel pyrénéen, ce qui correspondait à 1 449 autorités RAMEAU.

 

Notre approche comprend trois étapes. La première consiste à définir automatiquement un thésaurus en utilisant deux types de ressources que sont les notices descriptives et le référentiel RAMEAU : on obtient ainsi une carte de concepts. La deuxième étape consiste à enrichir ce thésaurus avec des entités toponymiques externes fournies par l’Institut géographique national afin d’aboutir à une ontologie* légère. Enfin, la troisième étape consiste à proposer un outil visuel, le prototype TERRIDOC, grâce auquel on obtient une représentation sémantique claire et attractive d’un territoire, qui peut se prêter à toutes sortes de recherches thématiques et géographiques.

Pourquoi avoir choisi RAMEAU ?

Nos travaux s’inscrivent dans le cadre d’une collaboration avec la médiathèque de Pau qui, comme de nombreux établissements documentaires, emploie RAMEAU pour son indexation. Il était donc naturel de partir du langage d’indexation utilisé pour la description des fonds numérisés.

Mais, de plus, RAMEAU nous est apparu comme une ressource très intéressante pour structurer l’information car le thésaurus a l’avantage d’être riche (plus de 150 000 termes), encyclopédique, contrôlé (polysémie et synonymie) et structuré grâce aux relations sémantiques (liens hiérarchiques et associatifs).

Quelques mots sur les perspectives de vos travaux ?

Nous cherchons actuellement à enrichir le modèle que nous avons mis au point, dans le cadre du projet d’ontologie géographique GEONTO en partenariat avec l'IGN, qui porte sur l'interopérabilité de données diverses relatives à l'information géographique.

Par ailleurs, nous travaillons avec les bibliothécaires de la médiathèque de Pau à la définition de processus de vérification automatique des indexations susceptibles de les aider dans leur travail d’experts.

J’ajouterai que la traduction de RAMEAU en SKOS*, réalisée pour l’instant à titre expérimental, ouvre une perspective intéressante pour mon travail.

retour en haut de page

Vos questions 

Le label, un champ obligatoire ?

Une bibliothèque en cours de réinformatisation s’est aperçu que le prestataire du logiciel choisi ne prévoit pas dans les paramétrages la présence du label, alors que celui-ci est un champ obligatoire dans le format UNIMARC. Elle demande des précisions sur le rôle et l'importance du label.

Réponse du pôle Modélisation fonctionnelle et de la Coordination des produits

Selon la norme ISO 2709* qui définit la structure de tous les formats MARC, le label est effectivement obligatoire dans toutes les notices MARC.

Il rassemble sur 24 caractères l’ensemble des informations codées nécessaires au traitement informatique de la notice :

  • sa longueur et son adresse,
  • son statut,
  • son niveau hiérarchique le cas échéant (catalogage à niveau),
  • sa complétude et sa conformité à l’ISBD,
  • le type de document et de publication qu’elle décrit.

 

Seules ces deux dernières informations concernent le document décrit et permettent de contrôler l’utilisation des champs pertinents dans la notice.
Exemple en format UNIMARC :

  • Pour une notice décrivant une ressource continue (label position 7=s), les champs 110 (Zone de données codées : ressources continues), 207 (Zone particulière à certains types de ressources : ressources continues - numérotation), 326 (Note sur la périodicité) peuvent être présents dans la notice.
  • Si cette ressource continue est électronique (label position 6=l), les champs 135 (Zone de données codées – ressources électroniques), 230 (zone particulière à certains types de ressources : ressources électroniques), 336 (Note sur le type de ressources électroniques), 337 (Note sur la configuration requise) sont autorisés dans la notice.

 

La plupart des informations ne sont pas saisies par le catalogueur. Certaines valeurs sont constantes dans le format UNIMARC (par exemple, les positions 10 et 11 précisant le nombre d’indicateurs et la longueur des codes de sous‑champs), d’autres sont calculées par le système (longueur de la notice par exemple), d’autres enfin sont générées par le choix d’un modèle de grille de saisie.

 

Quoi qu'il en soit, il est essentiel que le label soit présent dans toute notice en format MARC pour :

  • permettre les échanges de notices, y compris en export, et donc la participation à des projets collectifs ;
  • assurer l’évolution du catalogue lors de migrations ou d’évolution de système ;
  • garantir la pérennité des données.

 

En savoir plus sur le label

 

Rencontres et publications

Guide pratique du catalogueur : dernières parutions

Le Guide du catalogueur continue de s'étoffer. Au cours des six derniers mois, ont été publiées :

  • Fiches Généralités / Fiches communes :
    - Départements, chefs-lieux et codes
    - Translittération de l'arabe à la BnF
    - Translittération de l'arménien à la BnF
    - Translittération du géorgien à la BnF
  • Fiches Bibliographiques / Choix des accès :
    - Accès titres - Titres de forme, Expositions
    - Accès titres - Titres de forme, Mélanges
    - Accès titres - Titres de forme, règles d'établissement

 

Consultez régulièrement leGuide pratique du catalogueur

Récupération de notices et interopérabilité des catalogues, formation ENSSIB, 6-8 avril 2010

Du 6 au 8 avril, l’ENSSIB propose, dans les locaux de la BnF (site François-Mitterrand), une formation pour :

  • préciser la place de la récupération de notices dans la constitution d'un catalogue aujourd'hui ;
  • en évaluer l'impact sur la cohérence globale d'un catalogue, sur l'organisation du travail et sur l'exploitation des notices récupérées ;
  • apprendre à choisir les réservoirs de notices les mieux adaptés aux besoins, comprendre les processus techniques qui entrent en jeu lors d'une récupération.

 

Vous inscrire à ce stage

Journées UNIMARC, ENSSIB, Lyon, 31 mars-1er avril 2010

Après Lisbonne (2006) et Florence (2008), l'ENSSIB reçoit la 3e Rencontre internationale d'utilisateurs d'UNIMARC, qui accueillera des utilisateurs de Grèce, d'Italie et d'ailleurs. Cette manifestation est organisée par le programme UNIMARC de l'IFLA (IFLA UNIMARC Core Activity), hébergé par la Bibliothèque nationale du Portugal.

Elle sera suivie de la 3e Journée d'étude du Comité français UNIMARC. Les communications, en français, s'adresseront à tous les utilisateurs d'UNIMARC de langue française. Elles présenteront notamment les nouveautés des formats pour les notices bibliographiques et d'autorité, publiés respectivement en 2008 et 2009, et aborderont les mutations de l'environnement normatif dans lequel s'inscrit UNIMARC.

Pour participer à ces journées, il est obligatoire de s'inscrire.

En savoir plus sur ces journées

INTERMARC : révision du référentiel Codes de Langues

Le référentiel Codes de Langues utilisé pour INTERMARC a été révisé pour suivre les évolutions de la norme ISO 639-2*.
Les zones et sous-zones concernées :

  • Format d'autorités : $w pos. 06-08, 008 pos. 14-16 et 041 $a, $t et $v ;
  • format bibliographique : $w pos. 06-08, 008 pos. 31-33 et 041 $a, $b, $c, $d, $e, $f, $g, $h et $i.

De nouveaux codes font leur apparition, d'autres sont précisés et certains disparaissent. Par exemple, "ooo" et "zzz" sont remplacés par "zxx" = "sans contenu linguistique", "mul" = "multilingue" est précisé par "un même texte en plusieurs langues".

Les notices nouvellement créées prennent en compte ce changement, celles créées antérieurement feront l'objet d'un chantier de corrections.

Le nouveau référentiel sera prochainement mis en ligne sur les pages destinées aux professionnels, intitulées Produits et services bibliographiques, mieux utiliser les produits.

Association internationale des bibliothèques, archives et centres de documentation musicaux

Le groupe français de l’Association internationale des bibliothèques, archives et centres de documentation musicaux (AIBM/IAML) proposait une journée professionnelle le 20 avril 2009, tandis que le congrès annuel de l’association internationale avait lieu du 5 au 10 juillet 2009 à Amsterdam. Pour prendre connaissance des communications sur le traitement des ressources musicales et du compte rendu de la sous-commission UNIMARC, consultez le Bulletin n° 17 (décembre 2009) du groupe français de l’AIBM.

La BnF au Salon du livre de Paris 2010

Le prochain Salon du livre de Paris aura lieu du 26 au 31 mars 2010, Porte de Versailles. Comme chaque année, la BnF y sera présente. Une permanence de la coordination des produits bibliographiques sera assurée sur son stand le lundi 29 mars, journée professionnelle, de 9h30 à 18h30.

Lexique

Norme ISO 2709:2008
Information et documentation - Format pour l'échange d'information
Norme internationale définissant une structure générale pour les échanges de divers types de notices (notices bibliographiques, d'autorité, de données locales, etc.) entre systèmes de traitement de l'information. Elle ne précise ni la taille ni le contenu des notices, et n'attribue aucune valeur aux étiquettes, aux indicateurs ou aux identificateurs de sous-champs, ces spécifications étant définies par le format des notices elles-mêmes, généralement un format de type MARC.
Norme ISO 639-2:2008
Codes pour la représentation des noms de langue
L'ISO 639 est une norme internationale qui définit des codes pour la représentation des noms des langues. La norme a plusieurs composantes : ISO 639-2 est l'une d'elle. Elle consiste en une liste de codes (3 caractères alphabétiques) accompagnée de libellés en français et en anglais permettant de désigner la langue. Cette partie de la norme est notamment utilisée par les bibliothèques (zones des codes de langues des formats MARC). La gestion de ces codes est assurée par la Bibliothèque du Congrès.
Notice d'autorité
(notice élémentaire, notice complète)
Ensemble des données d'identification d'une entité (personne, collectivité, œuvre, marque, nom géographique, sujet, etc.) permettant de normaliser les points d'accès aux notices bibliographiques des catalogues. Les notices d'autorité de la BnF comportent la forme retenue, d’éventuelles formes parallèles en d’autres langues et/ou écritures, d'éventuelles formes rejetées, et des notes d'information, de sources, d'utilisation. Dans le catalogue général de la BnF, il existe des notices complètes contenant toutes les informations nécessaires à leur réutilisation et des notices dites "élémentaires" comparables à des entrées d’index.
Ontologie
Une ontologie définit un vocabulaire commun qui regroupe un ensemble de concepts décrivant complètement un domaine. Son objectif est de modéliser cet ensemble de connaissances pour une utilisation dans un contexte informatique.
SKOS : Simple Knowledge Organisation System
(Système simple d'organisation des connaissances)
SKOS est un langage permettant la représentation formalisée de thésaurus, répertoires de vedettes-matière et autres types de vocabulaires contrôlés et structurés, ainsi que l’expression de correspondances (alignements) entre vocabulaires. SKOS est développé par le W3C dans le cadre du Web sémantique.
Z39.50
Protocole client-serveur pour la recherche d'information, défini dans la norme NF ISO 23950 de décembre 1999. Définit les procédures et les formats régissant l'échange de messages entre un client et un serveur : le client demande au serveur de faire une recherche sur une ou plusieurs bases de données, identifie les enregistrements qui correspondent aux critères spécifiés dans la recherche, et transfère tout ou partie des enregistrements identifiés.
retour en haut de page

 

Contact : coordination-bibliographique@bnf.fr

"Conformément à la loi N° 2004-801 du 6 août 2004 relative à la protection des personnes physiques à l'égard des traitements de données à caractère personnel et modifiant la loi N° 78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, tout utilisateur ayant déposé des informations directement ou indirectement nominatives, peut demander la communication de ces informations et les faire rectifier le cas échéant."

Direction de publication : Bruno Racine, Jacqueline Sanson
Bibliothèque nationale de France, Quai François Mauriac
75706 Paris Cedex 13