L’opérateur AROUND(n) dans Google

Extrait de l'algorithme n-gramUne petite note rapide pour signaler un nouvel opérateur Google.

Il s’agit de AROUND(n) qui permet d’effectuer une recherche en intégrant la notion de proximité entre les termes. Peut-être que l’algorithme n-gram n’est pas très loin derrière cet opérateur.

C’est l’inévitable Barry Schwartz qui nous apprend l’apparition de l’opérateur AROUND(n), où (n) sert à délimiter la proximité entre les termes.

AROUND(n)

Par exemple, la requête [mots clés AROUND(10) autres mot clés] va retourner une proximité assez large, tandis que [mot clés AROUND (2) autres mots clés] recherche des termes plus rapprochés.

Par contre, aucune idée de l’échelle de proximité définie par les chiffres.

En fait, cet opérateur se révèle utile pour chercher dans des documents très longs où Google a plus de difficulté à retourner des relations entre les termes.
Cela permet d’affiner des requêtes qui retournent pas des résultats satisfaisants au premier abord.

Attention de bien utiliser AROUND(n) tout en majuscule.
En tout cas, d’après mes premiers essais, cet opérateur Google a l’air plutôt efficace.

Bing possède également un opérateur équivalent avec « near ».

L’algorithme n-gram

Je suppose que l’algorithme n-gram n’est pas très loin derrière cet opérateur puisqu’il concerne (entre autres) la proximité entre les termes dans le calcul de pertinence. Pour les plus curieux, c’est du côté de la Chaîne de Markov qu’il faut regarder pour comprendre la prédiction des termes suivants en fonction de ceux saisis.

Google a annoncé depuis longtemps son affection pour l’algorithme n-gram, notamment pour la traduction, la reconnaissance vocale, la correction d’orthographe, l’extraction d’information et la détection d’entités.
Dire que cet algorithme est très présent dans la technologie Google est presque redondant.

24 réflexions sur “L’opérateur AROUND(n) dans Google”

  1. Cet opérateur est peut etre interessant pour nous mais quid de l’internaute lambda.

    Parce que perso je me vois bien utiliser le machin pour aller chopper des coincurrents ou des sites proche quand je chasse le lien. par contre je vois mal ma maman faire des recherches de ce type

  2. Tout comme le juge, je ne pense pas que cet opérateur sera utilisé, d’autant plus que l’information n’a pas été communiqué aussi clairement que la sortie de chrome. 😉

  3. C’est tout simplement un opérateur booléen, utilisé par tout chercheur habitué à interroger les bases de données. Pour ma part, j’ai l’habitude de me servir de « near » quand je cherche de la documentation à la bibliothèque du coin et c’est fort utile !

  4. @LeJuge & @Aurélien : l’utilisateur lambda n’utilise pas d’opérateur. Celui là ou un autre.
    Pourtant, je ne peux pas m’en passer. C’est rare que j’entre une requête brute.

    @Romain BOYER : bien vu, mais je n’ai pas confirmation de l’utilisation dans l’algo Google. Contrairement à n-gram qui est partout.

    @Referenceur : à propos d’opérateur booléen, j’ai toujours déploré que Google (et Yahoo + Bing) n’accepte pas la troncature. Pourtant, ça serait bien pratique.

  5. Je trouve cet opérateur très utile ! Il est clair que l’utilisateur lambda ne s’en servira pas comme le dit si justement Laurent, mais il se révèlera utile pour tous les web masters, référenceurs et autres chercheurs de documentations peu communes !

  6. Il est vrai que l’utilisateur « normal » ne se servira jamais de cet opérateur, tout comme il n’utilisera jamais d’autres opérateurs. Quand à aller chopper des backlinks de nos confrères ou concurrents il y a des outils bien plus simple et automatiques.

  7. Je ne parle pas uniquement de choper les backlinks. Je pense que lorsqu’on touche de prés ou de loin aux métiers de l’information, il est nécessaire de maitriser les outils de recherche même si évidemment certaines tâches de recherches répétitives peuvent être automatisées (et heureusement 😀 )

  8. Bonjour Laurent,

    Penses-tu que l’opérateur Around soit utilisé dans la fonction Google Suggest ? c’est l’une des premières questions que je me suis posé quand j’ai lu ton billet…

    Yvan,

  9. Je suis d’accord, je pense que cette fonctionnalité est plus orienté pour les webmasters et référenceurs, un peu moins pour les internautes lambda.

  10. Oui, évidemment, ce ne sera pas utilisé par beaucoup de monde. Mais ça permet de trouver des sites proches d’un mot clé sans qu’ils soient bien référencés sur ce mot-clef, ce qui est très pratique. Par contre, est-ce vraiment différent de la « roue » (je ne sais pas comment ça s’appelle, l’outil qui donne des mots clés proches). Parce que si ça utilise les mêmes données pour faire les rapprochement entre terme, je ne suis pas sûr que ce soit hyper utile. Ou alors il faut m’expliquer (ce qui est probable ^^).

  11. J’ai pas tout saisi mais ça a l’air chiadé si on maîtrise. Et l’algo pour être en première page et en premier place, vous auriez ?

  12. pour les referenceurs web c’est un outil intéressant pour l’étude des champs sémantiques; quelque chose qui sera pris en compte plut tard peut être par Google sous une autre forme.
    ps : cela existe depuis un moment, et ca ressort aujourd’hui partout sur bcq de blog (bizarre) !

  13. Je n’arrive pas à bien saisir. Au fait, il faut saisir le KW1 + AROUND(n)+ KW2.
    Exemple :
    hotel tunisie AROUND(10) hotel hammamet
    me donne le même résultat que si je change le n en le mettant égal à 2 par exemple.
    Dites moi, je suis à côté ?

  14. Bien tenté les liens dans les mots clés de la requête 😛
    Désolé, mais j’ai édité.

    Sinon, ta requête ne change pas sûrement parce qu’il n’y a pas de différence au niveau du contenu.
    En essayant

    tunisie AROUND(10) hammamet

    j’ai des résultats différents.

  15. pris sur le fait et je m’en excuse, qui ne tente rien n’a rien disons :p )
    Bon, sinon, je comprends un peu mieux.
    Je viens de tester avec ces requêtes :
    restaurant AROUND(10) hotel
    et les résultats ne sont pas les même. et même le positionnement n’est pas le même.

    Alors merci @Laurent.

  16. Rien de bien grave. Au moins c’est du « commentaire participatif optimisé » à opposer au tout automatique.
    Vaut mieux tenter ça ailleurs que chez un référenceur qui te voit venir avec tes gros sabots.

  17. Je connaissais toute une tripotée d’opérateur tels que intitle, inurl etc, mais pas celui-ci. Ça va m’être utile pour certaines requêtes récalcitrantes qui renvoie des pages avec les mots recherchés éparpillés sur toute la page.

  18. Ping : Blekko est un moteur de recherche représentant une alternative à Google

  19. C’est assez sophistiqué comme opérateur.
    Pas vraiment à la portée du commun des utilisateurs – intéressant néanmoins.

Laisser un commentaire