Dans le cadre de mes activités SABIX, j'ai pu constater que le programme Google Book Search (GBS) progresse dans la numérisation du patrimoine scientifique francophone. Faisant une recherche avancée polytechnique sur GBS, je trouve un certain nombre de résultats, dont le fameux Journal de l'Ecole polytechnique (revue scientifique de référence avant les Comptes-rendus de l'Académie des Sciences créées par Arago en 1835), numérisé en mode texte et image. Les documents proviennent soit de New York Public Library, soit de Stanford Library (cf. sur l'image ci-contre le filigrane). Une preuve de plus, si besoin était, que notre patrimoine francophone est présent dans les grandes bibliothèques américaines, et qu'il fait partie du programme de numérisation GBS (bibliothèques).
J’ai regardé le site Europeana de la BnF, présenté à J. Chirac mercredi 21 mars. Ce n’est pas (encore ?) une bibliothèque numérique européenne : les documents non BnF qui y figurent, venant des bibliothèques nationales de Hongrie ou du Portugal, sont certes intégrés au moteur de recherche, mais restent visibles dans leur site d’origine.
C’est en revanche une évolution intéressante de Gallica, avec une interface utilisateur beaucoup plus moderne et conviviale. Bien évidemment tous les documents sont (aussi) en mode texte, à la différence de Gallica.
Moteur de recherche
-
> Recherche " Fermat " dans le moteur de recherche : apparaît en premier le résultat où Fermat figure dans le titre de l’ouvrage (ce qui est bien) ; dans les autres résultats, le terme recherché est dans le corps du document, et le moteur nous envoie vers la première page du document (et non vers la page d’occurrence " Fermat ", ce qui serait mieux).
-
> Le cartouche sur la gauche " Affiner la recherche " est bien fait, il permet de sélectionner, parmi les 144 occurrences de Fermat, les ouvrages par date (siècle) ou par auteur, etc.
Téléchargement
-
> Comme l’indique la brochure, en un clic, il est possible de télécharger le document consulté.
-
> Cartouche orange Utiliser, cliquer sur la disquette d’enregistrement, le document complet est téléchargé en PDF. C’est le document PDF image (non cherchable plein texte) de Gallica.
Mode texte/ mode image
-
> Le mode texte semble comporter des erreurs assez importantes d’OCR (ex. recherche Fermat, premier document Brassinne 1853, en mode texte la page de garde, la page suivante, comportent des erreurs importantes). Ces re-numérisations en mode texte sont-elles issues des marchés passés par la BnF à partir d’octobre 2006, ou sont-ce des re-numérisations expérimentales ?
-
> Rappel : en tout état de cause le mode texte, même avec des erreurs, reste indispensable pour la recherche des termes dans les documents, et leur indexation par les moteurs de recherche.
-
> Le mode texte, proposé en affichage pour les " déficients visuels ", n’est pas téléchargeable.
Pour en savoir plus, revue de presse sur Internet à propos de cette maquette :
Dernière minute le 29 mars: M. Bruno Racine, conseiller à la Cour des Comptes, actuel directeur du Centre Georges Pompidou, a été nommé président de la BnF en remplacement de M. Jean-Noël Jeanneney.
L'actualité "Bibliothèques numériques" se calme, c'est dommage...mais Google semble continuer à engranger les partenariats en Europe, après l'Espagne (mon post du 14 janvier), c'est une grosse bibliothèque allemande, celle de Bavière, qui signe pour un million de livres avec Google. Et en Allemagne, pays dont l'unité fut récente, ce sont les bibliothèques des Länder importants , et non la Bibliothèque nationale, qui contiennent le plus de documents.
Extrait de la news Netéconomie: Après le Royaume-Uni et l'Espagne, l'Allemagne est le troisième pays européen, le second non-anglophone, a rejoindre le projet de bibliothèque numérique lancé fin 2004 par Google. La société Internet américaine et la Bibliothèque d'Etat de Bavière vont numériser et mettre en ligne plus d'un million de livres du domaine public, de Goethe à Schiller. «Nous ouvrons notre bibliothèque au monde entier pour remplir notre véritable mission - la découverte des livres et de la connaissance en franchissant le seuil décisif de l'ère numérique. Ce travail passionnant va permettre aux lecteurs du monde entier, à leur gré, où qu'ils se trouvent, de découvrir et de bénéficier en ligne de la riche tradition littéraire allemande », a souligné Rolf Griebel, directeur de la Bibliothèque d'Etat de Bavière, dans un communiqué daté du 6 mars 2007.
Lire aussi le communiqué de la Bayerische Staatsbibliothek (accord passé sous l'égide et en présence du Ministre de la Culture de l'Etat de bavière).
Derniers Commentaires