Overblog
Suivre ce blog Administration + Créer mon blog
9 avril 2007 1 09 /04 /avril /2007 13:08
Suite à mon post précédent concernant Europeana, j’ai été amené à regarder un certain nombre de blogs, et ai retenu les URLs suivantes :
Au hasard de ces derniers posts, même si je ne partage pas toujours le ton qui les anime, je retrouve un certain nombre de questions que je me pose. Au moment où les " porteurs " du giga-projet s’en vont (MM. Chirac et Jeanneney), et – pourquoi ne pas l’espérer ? – pour éclairer leurs successeurs, reprenons-en quelques-unes ci-dessous :

  1. 1) Comment peut-on à la fois voir se développer une " contribution française à la bibliothèque numérique européenne " (Europeana) et le projet de bibliothèque numérique européenne validé par l’Union Européenne (développement de The European Library, cf. mon post précédent) ?
    Il y a en effet fort à parier, comme on peut le lire dans ces billets, que : Europeana s’oriente doucement et sûrement vers un Gallica V2 (qui était absolument nécessaire, ne serait-ce que pour le mode texte)…et The European Library sera la BnUE, mais quand, et comment ?

  2. 2) pourquoi continue-t-on à lire que Google exige l’exclusivité d’une bibliothèque avec laquelle il signe ?
    Le post d'O. Morin nous ramène au texte du contrat Google/ U of Michigan. Sous réserve d'interprétation erronnée de ma part, ce texte signifie qu’un ouvrage de bibliothèque numérisé par Google pourra être mis en ligne sur le site de la bibliothèque elle-même, mais ne pourra pas être vu dans le service MSN Book Search.
  3. A ce propos je pose une question à laquelle je n’ai toujours pas la réponse : le moteur simple MSN (pas MSN Book Search) pourra-t-il indexer les contenus numérisés par Google et Stanford Library par exemple ? autrement dit un internaute utilisant MSN peut-il accéder aux livres Google/ Stanford ? (ou un internaute utilisant Google peut-il accéder aux livres MSN/ Bristish Library ?)

  4. 3) Dans l’interview de la directrice générale de la BnF je lis : " l’adhésion à un système, celui de Google, de la part de ces bibliothèques, qui comprend, comporte intrinsèquement l’accès aux documents en fonction d’un ordre régi par des critères de rentabilité commerciale ". Autant ce débat sur le page ranking peut se justifier à propos du moteur Google, autant je ne comprends pas ce débat à propos de Google Book Search…Par exmple je fais une recherche " polytechnique " sur Google Book Search, j’obtiens des résultats, mais je ne vois pas quel type de " page ranking commercial " Google pourrait faire sur des livres patrimoniaux. Quelqu’un peut-il m’éclairer ?

N'hésitez pas à metre vos interprétations et réponses éventuelles, notamment sur les points 2) et 3). 

Partager cet article
Repost0
25 mars 2007 7 25 /03 /mars /2007 14:25

J’ai regardé le site Europeana de la BnF, présenté à J. Chirac mercredi 21 mars. Ce n’est pas (encore ?) une bibliothèque numérique européenne : les documents non BnF qui y figurent, venant des bibliothèques nationales de Hongrie ou du Portugal, sont certes intégrés au moteur de recherche, mais restent visibles dans leur site d’origine.

 
C’est en revanche une évolution intéressante de Gallica, avec une interface utilisateur beaucoup plus moderne et conviviale. Bien évidemment tous les documents sont (aussi) en mode texte, à la différence de Gallica.
 
Moteur de recherche
  • > Recherche " Fermat " dans le moteur de recherche : apparaît en premier le résultat où Fermat figure dans le titre de l’ouvrage (ce qui est bien) ; dans les autres résultats, le terme recherché est dans le corps du document, et le moteur nous envoie vers la première page du document (et non vers la page d’occurrence " Fermat ", ce qui serait mieux).
  • > Le cartouche sur la gauche " Affiner la recherche " est bien fait, il permet de sélectionner, parmi les 144 occurrences de Fermat, les ouvrages par date (siècle) ou par auteur, etc.
Téléchargement 
  • > Comme l’indique la brochure, en un clic, il est possible de télécharger le document consulté.
  • > Cartouche orange Utiliser, cliquer sur la disquette d’enregistrement, le document complet est téléchargé en PDF. C’est le document PDF image (non cherchable plein texte) de Gallica.
Mode texte/ mode image
  • > Le mode texte semble comporter des erreurs assez importantes d’OCR (ex. recherche Fermat, premier document Brassinne 1853, en mode texte la page de garde, la page suivante, comportent des erreurs importantes). Ces re-numérisations en mode texte sont-elles issues des marchés passés par la BnF à partir d’octobre 2006, ou sont-ce des re-numérisations expérimentales ?
  • > Rappel : en tout état de cause le mode texte, même avec des erreurs, reste indispensable pour la recherche des termes dans les documents, et leur indexation par les moteurs de recherche.
  • > Le mode texte, proposé en affichage pour les " déficients visuels ", n’est pas téléchargeable.
 Pour en savoir plus, revue de presse sur Internet à propos de cette maquette :

 Dernière minute le 29 mars: M. Bruno Racine, conseiller à la Cour des Comptes, actuel directeur du Centre Georges Pompidou, a été nommé président de la BnF en remplacement de M. Jean-Noël Jeanneney.

Partager cet article
Repost0
4 février 2007 7 04 /02 /février /2007 13:08

Le portail de l’Internet scientifique www.science.gouv.fr ouvre une nouvelle rubrique consacrée aux bibliothèques numériques scientifiques (cliquez dans la colonne de gauche). Le principe adopté est de recenser les bibliothèques numériques exclusivement consacrées à la science. L’idée est de faire connaître ainsi aux 140 000 visiteurs/mois de science.gouv.fr (soit un peu moins de 5 000 visiteurs/jour) les efforts de numérisation et de mise en ligne du patrimoine scientifique – souvent mal connus – faits par les instituts culturels, bibliothèques universitaires, équipes universitaires ou de recherche,…Dans ce dernier cas (équipes), il s’agit parfois d’initiatives non institutionnelles, d’un ou plusieurs chercheurs ou chargés de cours mettant en ligne des ressources scientifiques patrimoniales sur lesquelles il travaille.

La valorisation (on pourrait aussi dire la vulgarisation) en faveur d’un public ciblé a priori intéressé à la science, de ces initiatives décentralisées, s’inscrit dans le mouvement croissant d’un Internet " vernaculaire ", centré sur des communautés d’intérêt, à distinguer de projets plus centralisés comme celui de " Très Grande Bibliothèque numérique ". N’hésitez pas à nous faire connaître ici, en commentaires, votre avis sur cette initiative, ou toute bibliothèque numérique scientifique que vous souhaiteriez faire inscrire.

(certaines bibliothèques déjà répertoriées dans ce blog, comme Flaubert- Unversité de Rouen ou Euler - Université de Strasbourg dont partie du premier recensement du portail science.gouv.fr)

Partager cet article
Repost0
14 janvier 2007 7 14 /01 /janvier /2007 16:37

Comme le Figaro du jeudi 11 janvier (sous la plume de Marie-Laetitia Bonavita) nous l'apprend, "Google signe un accord avec cinq bibliothèque catalanes".

Nous avons pu retrouver le communiqué originel (en catalan) sur le site de la Bibliothèque nationale de Catalogne, à Barcelone. Avec quatre autres bibliothèques catalanes de Barcelone, de moindre envergure, il s'agit de numériser quelques centaines de milliers de livres dans le cadre du projet "Google Library", afin que les contenus soient indexés dans Google Book Search (et non de centaines de milliards (sic) d'oeuvres comme l'écrit Le Figaro- toujours cette course aux grands nombres qui se fait au détriment du bon sens et parfois de l'efficacité).

C'est ainsi la deuxième bibliothèque hispanophone de grande envergure, après la Complutense de l'Université de Madrid (notre post de fin septembre 2006) à s'allier à Google.

Pour plus de clarté, nous signalerons que c'est une troisième bibliothèque, la Biblioteca nacional de España à Madrid (site) qui elle est engagée dans le projet BnUE- Europeana- EDL (European Digital Library)- The European Library.

La langue espagnole et la langue française sont sans doute les deux langues qui ont le plus besoin d'être présentes au niveau mondial sur Internet, et leurs patrimoines mis en valeur. La stratégie et la façon dont nos voisins espagnols avancent (rapidement) ne peut manquer de nous interpeller.

Rajoût du 12 février 2007: Comme nous n'avons pas l'intention d'ouvrir un post à chaque fois que Google annonce un partenariat dans son programme Google Library, nous mentionnons ici que depuis l'annonce ci-dessus, l'Université du Texas et l'Université de Pinceton ont rejoint le projet Google (cf. communiqué Princeton pour 1 million de livres sur six ans).

Partager cet article
Repost0
30 décembre 2006 6 30 /12 /décembre /2006 15:03

La Bibliothèque nationale du Luxembourg (BnL) a annoncé diverses initiatives numériques (article du Tageblatt du 7 décembre accessible après inscription); nous sommes allés voir les différents portails pour les décrire pour vous ici.

Le premier www.portail.bnu.lu est un méta-portail donnant accès à huit portails de revues scientifiques: par exemple les portails JSTOR, ScienceDirect d'Elsevier, Springer...S'agissant d'abonnements payants pris par la BnL auprès des grands groupes d'édition scientifique, on ne peut accéder à la plupart d'entre eux que losrqu'on est dans les locaux de la BnL, mais aussi en rentrant son numéro de carte de lecteur BnL (d'où la mise sur Internet du portail, car sinon cela n'aurait aucun intérêt). Cette possibilité est à ma connaissance unique en Europe, et je ne crois pas qu'une telle possibilité existe en France. Dommage que nous n'ayons pas de carte de lecteur de la BnL! Ce portail relève donc plus de l'édition scientifique (notre rubrique) que des bibliothèques numériques pour tous.

Le deuxième www.luxemburgensia.bnu.lu correspond, lui, à une première esquisse de bibliothèque numérique, avec trois types de documents:

1) livres imprimés (ce qui a été numérisé n'a pour l'instant pas grand intérêt)

2) cartes postales anciennes du Luxembourg. A signaler que la collection numérique de cartes postales est présentée en basse résolution, images non cliquables. Pour y accéder, il faut être sur un ordinateur dans le site physique de la BnL. C'est à ma connaissance la première restriction sur un contenu destiné à rejoindre la BnUE.

3) journaux luxembourgeois, un certain nombre d'années du XIX° et du XX° siècle, en français comme en allemand, la collection paraît intéressante (cf. illustration).

Le Luxembourg fait partie des 9 pays non encore intégrés à The European Library, qui seront intégrés dans le cadre du projet EDL (ces jargons européens ne sont pas toujours faciles à comprendre).

Partager cet article
Repost0
26 décembre 2006 2 26 /12 /décembre /2006 10:51

Les Echos du 26 décembre sous la plume de Nathalie Silbert:

Les Allemands se retirent du projet Quaero

[ 26/12/06 ]

Le partenariat noué entre les industriels français et allemands autour du projet de moteur de recherche Quaero a fait long feu. La semaine dernière, lors du sommet national de Potsdam sur les technologies de l'information, le secrétaire d'Etat allemand à l'Economie, Hartmut Schauerte a officialisé le retrait des industriels allemands qui devaient participer au projet, parmi lesquels notamment le géant de médias Bertelsmann. Ces derniers ont en effet décidé de monter leur propre programme baptisé Theseus. Outre Empolis GmbH, une filiale de Bertelsmann AG, il mobilisera plusieurs géants allemands, dont Siemens, SAP et la Fraunhofer Gesellschaft. « Le projet Quaero continue et certains laboratoires allemands restent partenaires du programme », soulignait vendredi un porte-parole de l'Agence de l'innovation industrielle qui doit financer 50 % de la recherche et développement de Quaero.

Des différences d'approche seraient à l'origine du divorce entre les industriels. Avec Quaero, les industriels français menés par le groupe Thomson, souhaitent développer un moteur de recherche grand public et multimédia. Les Allemands, en revanche, souhaitent développer avec Theseus une approche plus professionnelle avec une gestion de la connaissance sémantique, c'est-à-dire capable de faire des recherches « intelligentes » basées sur le sens des mots.

« En réalité, il n'y a pas rupture puisque le projet n'avait pas encore été approuvé par Bruxelles. Simplement désormais il y a deux programmes au lieu d'un et en réalité ils sont complémentaires », relativisait vendredi l'AII.

Une coloration hexagonale

Alors qu'il devait être le fruit d'une coopération franco-allemande, le projet Quaero (« je cherche » en latin) qui a été doté d'un budget de 250 millions d'euros sur cinq ans, va toutefois prendre une coloration nettement plus hexagonale. Aux côtés du groupe Thomson, chef de file du programme, le moteur de recherche français Exalead, Jouve, LTU et VecsyChef participent à ce programme, annoncé en 2005 par Jacques Chirac pour concurrencer le moteur de recherche américain Google.

Partager cet article
Repost0
20 décembre 2006 3 20 /12 /décembre /2006 12:13
(entretiens des 7 & 8 décembre de la BnF sur le thème « Numérique et bibliothèques : le second choc » , voir programme)
 
Jean-Noël Jeanneney, président de la BnF, a annoncé en introduction que son établissement bénéficierait de 10M€ et de 12 emplois budgétaires supplémentaires en 2007 pour le projet BnUE.
 
Pour l’aspect numérisation, il annonce que Gallica sera proposé en quasi-totalité en mode texte début 2007 ; par ailleurs il y aura numérisation de 30 000 ouvrages nouveaux en 2006 et de 100 000 ouvrages nouveaux en 2007.
Une maquette du projet baptisé Europeana est visible (voir démonstrateur http://maquette.bnf.fr/labs/scenario/Europeana.html  NdA: vous pouvez nous faire part en commentaires ci-dessous de vos réaction sur ce démonstrateur) ; J.N. Jeanneney indiquant que cela n’entre pas en concurrence avec le site The European Library (www.theeuropeanlibrary.org) de la CENL, support de la future bibliothèque numérique européenne choisi par la Commission Européenne.
 
Le représentant de la Commision Européenne (Horst Forster) a redonné les chiffres déjà publiés en mars, 2 millions d’objets digitaux (livres au départ, mais aussi archives, images fixes et animées) en 2008, et 6 millions d’objets en 2010.
 
Jill Cousins, directrice, Bureau de La Bibliothèque européenne (La Haye, Pays-Bas), donne quelques informations nouvelles sur The European Library : le projet regroupe 23 bibliothèques nationales fin 2006, en regroupera 32 fin 2007 ; il collecte déjà 2 millions d’objets numérisés (NdA : donc a priori l’objectif de la Commission Européenne pour 2008 est déjà atteint) et attire 100 000 visiteurs/mois.
Elle rappelle les projets en cours financés par la Commission pour la BnUE :
ð     TEL-ME-MOR (rappel TEL = The European Library), en cours, il s’agit d’intégrer les nouveaux pays européens à TEL.
ð     EDL (European Digital Library = EDL) ; le leader est la Deutsche Bibliothek ; il s’agit d’intégrer opérationnellement 9 nouveaux pays (dont la Belgique et le Luxembourg pour l’instant absents) au projet, et de créer un registre européen de métadonnées basé sur l’OAI. Voir site EDL (en anglais); budget 2,1M€ dont subvention UE de 1M€; démarrage septembre 2006 durée 18 mois.
Elle indique les projets déposés pour une demande de financement de la Commission pour la BnUE :
ð     TELPlus, mené par l’Estonian National Library, pour un financement prévu de 7,5M€.
ð     EDLNet, mené par la Bibliothèque des Pays-Bas pour définir la future structure de gouvernance du projet, financement prévu de 1,3M€.
Pour l'instant, je n'ai pas investigué en détail ces quatre projets; toutes contributions sont les bienvenues.

A peu près concomittamment ont été annoncés les membres de la commission tripartite en charge de la gestion de la taxe sur les photocopieurs du CNL permettant de dégager le budget de 10M€ mentionné ci-dessus:
- pour le CNL (Ministère): MM. Yvert, directeur du livre, président du CNL; Wagner, Directeur adjoint du livre; Silicani, conseiller d'Etat; Hébert, président de la Cité des Sciences.
- pour les Editeurs: MM. Eyrolles, Président du SNE; Kouck, PDG d'Editis; Nourry, PDG d'Hachette Livres.
- pour la BnF: Mmes. Saal, directrice générale; Sanson, directrice des collections; Lupovici, chef de projet Europeana.
Partager cet article
Repost0
13 décembre 2006 3 13 /12 /décembre /2006 12:43

La Bibliothèque municipale de Lyon, une des plus importantes de France a annoncé son intention de créer sa propre bibliothèque numérique avec 500 000 ouvrages (annonce du 20 novembre 2006)

Les chiffres avancés, si la presse les retranscrit bien, apparaissent trop élevés et font craindre pour la bonne gestion de l'argent public: 60 millions d'euros pour 500 000 documents, à environ 300 pages par document, cela fait 40 centimes d'euros par page, ce qui est beaucoup comparé au 10 centimes annoncés par Google et aux 9 centimes annoncés par J.N. Jeanneney au colloque du 7 décembre.


A ce propos l'étude faite par IBM pour la BnF, donnant ce chiffre de 9 centimes d'euros, devrait être disponible pour tous comme l'a annoncé M. Jeanneney.

Espérons enfin que, dans les annonces des autres bibliothèques type BM Lyon, il n'y aura pas de doublons de numérisation (c'est à dire les mêmes ouvrages numérisés deux fois!) avec Gallica, encore une fois pour la bonne gestion de l'argent public!

Partager cet article
Repost0
11 décembre 2006 1 11 /12 /décembre /2006 18:32

Pas européenne, la Bibliothèque numérique, mais mondiale! Voir le communiqué sur une réunion tenue à l'UNESCO à Paris entre l'UNESCO et la Library of Congress (LoC) (Washington)

NB: nous écrivions page 14 de notre rapport "Bibliothèque numérique européenne" (février 2006) quelques éléments sur la politique de la Library of Congress, nous les retranscrivons ci-dessous:


Le concept de la « World Digital Library » (WDL), tel que proposé par le Directeur de la LoC à l’UNESCO (voir discours du 6 juin 2005) est intéressant à plus d’un titre :
Ø      C’est le prolongement direct du rapport du PITAC (Président’s Information Technology Advisory Committee) de 2001 intitulé « Digital Libraries : Universal Access to Human Knowledge », et de la « National Digital Library » lancée par LoC dès 1995.
Ø      Les coopérations entre la LoC et l’Espagne, les Pays-Bas, la France (BnF) y sont présentées comme visant à éclairer l’histoire coloniale des Etats-Unis…
Ø      La perche est tendue vers l’UNESCO pour contribuer à la mise en place d’une WDL, prioritairement tournée vers « les cultures chinoises et d’extrême-orient, du subcontinent indien, du monde islamique de l’Indonésie à l’Afrique ». L’Europe semble ne pas y avoir sa place, autrement que pour éclairer l’histoire coloniale des Etats-Unis…
 
C’est aussi parce que la moitié des documents de la LoC sont dans une autre langue que l’anglais que la LoC est en mesure de proposer ce concept de WDL. On peut penser que les fonds de mécénat (dont Google) iront en priorité à la numérisation de ces documents, permettant de constituer des corpus numériques « utilisables par d’autres bibliothèques à travers le monde ».
Enfin, point à signaler, LoC a déjà effectué avec Google un test de numérisation de 5000 documents, test incluant la manipulation de documents fragiles.

Lire l'article du Figaro du 4 décembre 2006 sur J. Billington.
Rajoût  du  18 octobre 2007,  article du Monde "Le prototype de Bibliothèque Mondiale présenté à l'Unesco"
 
Partager cet article
Repost0
8 décembre 2006 5 08 /12 /décembre /2006 16:38
Merci à ZDNet de nous l’apprendre, comme on pouvait s’y attendre MSN (Microsoft) ouvre son service de recherche plein texte dans les livres.
Ce service avait été évoqué la première fois lors de l’annonce de la coopération British Library/ Microsoft (communiqué du 4 novembre 2005) : il était indiqué que Microsoft numérisera 100 000 livres de la British Library et ouvrira un service courant 2006. Un an après ce communiqué, il n’est donc pas trop tard, et comme nous l’indiquions page 16 de notre rapport Bibliothèque numérique européenne, le service est effectivement à cette URL :
Les fonctionnalités sont pour l’instant rudimentaires (version béta), très peu d’options de recherche, mais gageons que , même si pour l’instant ce lancement se fait dans une certaine discrétion, nous aurons à suivre de près l’évolution de ce service.
Les Echos à juste titre en première page du numéro de lundi 11 décembre: "Microsoft ouvre sa bibliothèque numérique" (article sur Internet)
Partager cet article
Repost0

Présentation

  • : Humanités numériques, édition scientifique, diffusion numérique de la connaissance, Enseignement supérieur et recherche, géographie et histoire industrielles (auteur Alexandre Moatti) = ISSN 2554-1137
  • : Discussions sur le projet de Bibliothèque numérique européenne, sur les bibliothèques numériques en général; sur l'édition scientifique papier & en ligne.
  • Contact

Avant-propos

Ce blog est créé à la rentrée scolaire 2006 pour suivre les sujets suivants:
# Bibliothèque numérique européenne (BNUE), et bibliothèques numériques en général.
# Edition et revues scientifiques.
Il est étendu en 2023 sur des sujets connexes aux précédents, mais néanmoins liés : patrimoine industriel, géographie industrielle.

 
Alexandre Moatti
 
 

Recherche