Une petite note rapide pour signaler un nouvel opérateur Google.
Il s’agit de AROUND(n) qui permet d’effectuer une recherche en intégrant la notion de proximité entre les termes. Peut-être que l’algorithme n-gram n’est pas très loin derrière cet opérateur.
C’est l’inévitable Barry Schwartz qui nous apprend l’apparition de l’opérateur AROUND(n), où (n) sert à délimiter la proximité entre les termes.
AROUND(n)
Par exemple, la requête [mots clés AROUND(10) autres mot clés] va retourner une proximité assez large, tandis que [mot clés AROUND (2) autres mots clés] recherche des termes plus rapprochés.
Par contre, aucune idée de l’échelle de proximité définie par les chiffres.
En fait, cet opérateur se révèle utile pour chercher dans des documents très longs où Google a plus de difficulté à retourner des relations entre les termes.
Cela permet d’affiner des requêtes qui retournent pas des résultats satisfaisants au premier abord.
Attention de bien utiliser AROUND(n) tout en majuscule.
En tout cas, d’après mes premiers essais, cet opérateur Google a l’air plutôt efficace.
Bing possède également un opérateur équivalent avec « near ».
L’algorithme n-gram
Je suppose que l’algorithme n-gram n’est pas très loin derrière cet opérateur puisqu’il concerne (entre autres) la proximité entre les termes dans le calcul de pertinence. Pour les plus curieux, c’est du côté de la Chaîne de Markov qu’il faut regarder pour comprendre la prédiction des termes suivants en fonction de ceux saisis.
Google a annoncé depuis longtemps son affection pour l’algorithme n-gram, notamment pour la traduction, la reconnaissance vocale, la correction d’orthographe, l’extraction d’information et la détection d’entités.
Dire que cet algorithme est très présent dans la technologie Google est presque redondant.