Voir le résumé
Le Web est une banque de données universelle, accessible gratuitement à toute personne ayant un ordinateur et une connexion Internet. Sa taille est estimée aujourd'hui à 1 milliard de pages et devrait être multipliée par 100 d'ici deux ans. On y trouve des informations de toutes natures : annuaires, dictionnaires, catalogues de produits, descriptions de personnes et d'entreprises, etc. Cependant, alors que l'information nécessaire est à portée de main, il est encore difficile, voire impossible, d'obtenir la réponse à des questions simples telles que : " à quelle vitesse court un puma ? " ou " quels sont les éditeurs espagnols de bandes dessinées ? ". Cette déficience est principalement due au mode actuel de représentation des données sur le Web : il n'offre aux logiciels aucune clé permettant une analyse rapide du contenu d'un document. C'est pourquoi le World Wide Web consortium (W3C) propose un nouveau standard, XML, qui, s'il réussit à s'imposer, devrait créer une révolution. Verra-t-on demain, comme dans les livres de science-fiction, un ordinateur omniscient répondre à toutes nos questions ?
Mot(s) clés libre(s) : crawler, hachage, HTML, indexation, moteur de recherche, recherche sur Internet, représentation des données, World Wide Web, XML, Xylème