Nous ouvrons Google sur nos ordinateurs et tapons notre recherche. Environ 0,5 secondes plus tard, des milliers de résultats apparaissent pour répondre à notre question. Ce geste est répété quotidiennement environ 3,5 milliards de fois, en moyenne chaque utilisateur le fait 1 ou 2 fois par jour. Mais que se passe-t-il vraiment dans cette minuscule fraction de seconde? Comment fonctionne la recherche sur Google?
Appuyons sur la touche “Entrée”.
Qu’en est-il de notre entrée? Le chemin du logiciel se divise en 3 étapes.
Et nous voulons vous les expliquer en détail. Voyons ensemble ce qui se passe lorsque nous faisons une recherche sur Google!
Les 3 étapes de la recherche Google
- Un logiciel met en marche la première étape que nous pouvons appeler le “matching” ou “match“, capable de prendre les mots que vous tapez et les rechercher sur le World Wide Web (WWW). Cette chose est possible grâce au fait que le logiciel a une copie complète de tous ces sites, donc il cherche dans chacun d’eux des mots qui peuvent se connecter en quelque sorte à notre recherche.
Ce serait un peu la même chose qu’un bibliothécaire rapide pourrait faire dans une immense bibliothèque… Voulons-nous un livre qui parle de radiateurs? Il nous apportera en un instant, tous les livres qui contiennent ce mot. - La deuxième étape est liée au “meaning“, donc à la signification de notre recherche. Le logiciel est associé à un algorithme de “machine learning”, qui est un algorithme qui apprend automatiquement comment sélectionner les meilleurs résultats, parmi tous ceux qui existent. C’est ainsi qu’il nous les présente dans la section de la page la plus en haut, sur notre écran Google.
- Ainsi, vous arrivez à la phase finale, atteinte en environ 0,5 secondes. Tout l’index de Google s’ouvre avec un très long ensemble de contenus de différents types, qui peuvent répondre à notre question de départ.
Comment fonctionne l’algorithme de Google?
Le parcours très rapide que fait notre recherche, implique une capacité de calcul énorme. En effet, des milliards de questions se posent chaque jour et environ 15% d’entre elles, sont toujours totalement nouvelles, car liées à l’actualité et aux nouveautés du moment.
La tentative de Google est de fournir une réponse aussi précise que possible, en organisant des milliards d’informations.
La partie difficile est ici: l’algorithme doit indexer le contenu, puis le cartographier et le trier. Et pour ce faire, il est continuellement testé, évalué et mis à jour.
Lors des tests, l’objectif est d’obtenir la plus grande pertinence du contenu proposé dans l’index. L’idée est de renvoyer environ 4 types d’informations différentes (sites Web, images, nouvelles et vidéos), afin qu’elles ressemblent au résultat, que proposerait un être humain.
“Un algorithme peut décider qui, comment et dans quel ordre Google doit afficher les résultats, après une recherche.”
Donc, si nous regardons d’abord “koala”, nous trouverons immédiatement des images avec l’animal, plutôt que des informations sur les restaurants qui s’appellent ainsi. L’algorithme est calibré en fonction des préférences des utilisateurs, mais aussi de la fiabilité des informations et de l’origine géographique du contenu.
Mais ce système peut avoir des failles. Les évaluateurs entrent donc en jeu.
Les “search quality raters” sont en effet des personnes, extérieures à Google, chargées d’évaluer la qualité des recherches.
Ils ont un document qui s’appelle “general guidelines“, dans lequel sont toutes les directives générales à suivre, pour comprendre quand une recherche est une “bonne recherche”, donc si elle est utile aux gens. Les trois caractéristiques à rechercher sont l’autorité, la compétence et la fiabilité. Les évaluateurs font des recherches et renvoient des commentaires à Google sur leur validité.