Moteur de recherche

De Espace TIC
Aller à : navigation, rechercher

Le Web contient une masse d'information considérable, probablement des milliards de pages. Il n’est pas toujours aisé de trouver ce que l’on cherche. Au début, en consultant les outils de recherche, on est vite noyé dans une liste de centaines d'adresses qui contiennent ou pas l’information recherchée. Le moteur de recherche vous aidera à retrouver des ressources (pages web, forums, images, vidéo, fichiers, etc.) associées à des mots identifiés comme mots clés ou seulement présents dans la page. Les principaux outils qui permettent d'accéder à l'information sont les annuaires et les moteurs de recherche (robots).

Les annuaires

Les annuaires fonctionnent sur un mode hérité du papier : il s'agit d'une gigantesque encyclopédie dont on consulte la table des matières ou l'index. Cette table des matières et cet index sont constitués manuellement et mis à jour régulièrement. Un annuaire demande beaucoup de maintenance mais fournit des résultats présélectionnés donc a priori plutôt pertinents. En revanche, cette sélection induit la perte des nombreuses informations potentiellement pertinentes qui n'ont pas été sélectionnées. L'annuaire le plus connu est Yahoo, il offre cependant aussi un moteur de recherche.

Page d'accueil de Yahoo

Les moteurs de recherche

Les robots sont des programmes de lecture automatisés qui parcourent le web de façon automatique et constituent un gigantesque index de la totalité des mots contenus dans chaque page consultée. Chaque page identifiée est alors indexée dans une base de données, accessible ensuite par les internautes à partir de mots-clés. Lorsque l'internaute entre un mot ou une expression sur le site du robot, il reçoit en retour toutes les pages consultées qui contiennent ce mot ou cette expression. Il n'y a pas d'intervention humaine dans le choix des pages. Les résultats fournis sont complets, mais leur nombre peut facilement dépasser la dizaine de milliers pour des mots courants. Le robot le plus connu est Google.

Page d'accueil de Google