Comment Google travaille t il pour nous proposer ses résultats de recherche ? Sous le capot du géant, une armée de robots travaillent inlassablement pour nous proposer la page web la plus adaptée à notre requête. Voici comment s’y prend notre moteur de recherche favori pour accomplir sa tâche.

La cartographie du web par Google

index webNous avons tous ce réflexe d’aller consulter ce bon vieux Google dès lors que l’on a une recherche ou une question. Mr Google consulte alors sa base de données et nous propose la réponse qu’il juge la plus en adéquation avec la requête initiale. Mais pour constituer cette immense bibliothèque, le sieur Google doit parcourir inlassablement le web et en scanner les sites. C’est ce qu’on appelle l’indexation. Ce processus est réalisé par des robots (nommés « spiders ») qui écument les pages web, allant de liens en liens et répertoriant au fur et à mesures celles-ci. De cette indexation découlera par la suite le fameux classement Google qui nous est si familier.

90 % du web reste « inexploré » par Google

1million-serveurs-googleMais pour réaliser ce processus appelé « crawling », la firme de Mountain View mobilise pas moins d’un million de serveurs ! En comparaison, un autre géant comme Facebook n’en utilise que 181 000, Intel 75 000 et Ebay 54 000. Ce qui permet à Google de posséder la plus grande base de données de sites indexés, deux fois plus que Yahoo et Bing. Avec 40 milliards de pages indexées le géant du web ne parvient pourtant qu’à péniblement répertorier 10 % de toutes les pages existantes. 90 % du web reste donc « inexploré » par Google. 450 milliards de pages qui échappent encore à la surveillance de Google et que l’on appelle le « web invisible ».

A quelle fréquence Google crawle t il le web ?

frequence crawl googleLes robots de Google travaillent inlassablement à répertorier de nouvelles pages mais ce n’est pas là leur seule fonction. Les spiders doivent également revenir sur les sites déjà indexés pour prendre en compte les changements. Les crawls peuvent donc advenir plusieurs fois par jour tous les six mois. Mais il faut noter que plus un site est mis à jour régulièrement , plus les robots de Google viendront le visiter. Maintenir des relations cordiales avec Google, et donc qu’il vienne visiter régulièrement un site est donc primordial pour le référencement. Dans le cas d’un site fraîchement né, il faudra patienter un délai de 1 jour à 6 semaines avant que la bambin ne soit visité par les petits robots de Google et donc fasse son apparition sur les moteurs de recherche.

Partager: