Colibri (Hummingbird, anglais) a été annoncé par Google en septembre 2013. Le dernier algorithme a pour principale fonction d’améliorer la pertinence des résultats fournis par le moteur. L’objectif est de comprendre ce que demande l’internaute pour lui fournir une réponse adéquate en tenant compte de chaque mot compris dans la requête
Mais comment Google peut-il mieux comprendre les requêtes des internautes ?
L’Américain Bill Slawski s’est intéressé aux brevets déposés par la firme de Mountain View et de ses employés, qui pourraient avoir servi à Google pour déployer Hummingbird.
Deux d’entre eux méritent une plus grande attention :
Un brevet pour faire remonter des résultats en phase avec le sens des requêtes.
L’un des brevets, attribué en 2013 explique comment procéder pour trouver et évaluer les synonymes qui pourraient remplacer des termes dans les requêtes. Cette méthode passe notamment par l’analyse des autres mots de la requête et repose sur un score de confiance envers le synonyme, qui doit être atteint avant que le moteur de recherche ne « décide » de le remplacer.
Un brevet sur la réécriture de requête
Un brevet déposé en 2003, et attribué en 2011, détaillait des méthodes pour affiner des requêtes en trouvant des termes alternatifs, c’est-à-dire des synonymes.
Ce brevet évoque trois pistes pour trouver ces synonymes
– Les déclinaisons de mot qui ont une même racine (comme constitutionnel est lié à constitution par exemple)
– Puiser dans un thesaurus, et l’utiliser comme un dictionnaire de synonymes potentiels, associant « auto » et « voiture » par exemple. Le brevet imagine même y inclure les hyperonymes (animal pour chat) et hyponymes (chat pour animal).
– Remplacer un terme de la requête par un autre qui apparaît souvent dans les résultats remontés par le moteur
Pour en savoir plus : http://www.journaldunet.com/