{"id":102,"date":"2009-07-24T20:48:59","date_gmt":"2009-07-24T18:48:59","guid":{"rendered":"http:\/\/www.laurentbourrelly.com\/blog\/?p=102"},"modified":"2009-07-24T20:48:59","modified_gmt":"2009-07-24T18:48:59","slug":"google-nous-ment-car-il-suit-les-liens-en-nofollow","status":"publish","type":"post","link":"https:\/\/www.laurentbourrelly.com\/blog\/102.php","title":{"rendered":"Google nous ment une fois de plus car il suit les liens en nofollow"},"content":{"rendered":"<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2009\/07\/test-attribut-nofollow.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"size-full wp-image-104 alignleft\" style=\"border: 0pt none; margin: 10px;\" title=\"test-attribut-nofollow\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2009\/07\/test-attribut-nofollow.jpg\" alt=\"test-attribut-nofollow\" width=\"150\" height=\"107\" align=\"left\" \/><\/a>J\u2019ai r\u00e9alis\u00e9 un test qui vise \u00e0 d\u00e9montrer que GoogleBot, le robot d\u2019indexation Google, suit parfaitement liens prot\u00e9g\u00e9s par l\u2019attribut \u00ab\u00a0nofollow.\u00a0\u00bb<\/p>\n<p>D\u2019autres avant moi ont \u00e9mis cette hypoth\u00e8se, mais je voulais mettre en place un test dans les r\u00e8gles de l\u2019art plut\u00f4t qu\u2019\u00e9mettre des hypoth\u00e8ses bas\u00e9es sur l\u2019instinct et les observations.<br \/>\nLe cas du nofollow est simplement d&rsquo;un chapitre de plus o\u00f9 Google ne dit pas toute la v\u00e9rit\u00e9 et envoie les webmasters sur de fausses pistes.<!--more--><br \/>\nC\u2019est avec la complicit\u00e9 d\u2019Aur\u00e9lien Bardon de <a href=\"http:\/\/oseox.fr\/\" target=\"_blank\">Oseox<\/a>, que j\u2019ai mis en place un protocole de test qui permet de d\u00e9montrer le fait que l\u2019attribut nofollow ne rend absolument pas un lien opaque au robot d\u2019indexation de Google (GoogleBot). Contrairement aux affirmations officielles de\u00a0 <a href=\"http:\/\/www.google.com\/support\/webmasters\/bin\/answer.py?hl=fr&amp;answer=96569\" target=\"_blank\">Google Inc;.<\/a>, l\u2019attribut nofollow n\u2019emp\u00eache pas le moteur de suivre les liens vers une autre page.<br \/>\nLe protocole complet et les r\u00e9sultats du test sont d\u00e9velopp\u00e9s sur le <a href=\"http:\/\/www.laboratoire-referencement.fr\/suivi-lien-nofollow.php\" target=\"_blank\">Laboratoire du R\u00e9f\u00e9rencement<\/a>. Le but de cet article est d\u2019expliquer comment vous pouvez reproduire le test, ainsi qu\u2019\u00e9laborer sur les implications du crawl des liens en nofollow par GoogleBot.<br \/>\n<strong>Proc\u00e9der au test de suivi des liens en nofollow <\/strong><\/p>\n<p>(bien suivre le <a href=\"http:\/\/www.laboratoire-referencement.fr\/suivi-lien-nofollow.php\" target=\"_blank\">protocole du Labo<\/a> pour rendre le test le plus fiable possible).<\/p>\n<ul>\n<li>Cr\u00e9er une page cible en .php qui contient l\u2019include suivante en d\u00e9but de code source \u2013 avant le DOCTYPE et le HEAD<br \/>\n&lt;?<br \/>\n$trouve=strpos($_SERVER[\u00ab\u00a0HTTP_USER_AGENT\u00a0\u00bb],\u00a0\u00bbGooglebot\u00a0\u00bb);<br \/>\n$adr_expediteur = &lsquo;robot@google.com&rsquo;; \/\/<br \/>\n$to=\u00a0\u00bbVOTREMAIL@VOTRESITE.com\u00a0\u00bb; \/\/ CHANGEZ LE MAIL<br \/>\n$sujet=\u00a0\u00bbPASSAGE GOOGLEBOT\u00a0\u00bb; \/\/ Sujet du mail<br \/>\nif($trouve!==false)<br \/>\n{<br \/>\nif ($QUERY_STRING != \u00ab\u00a0\u00a0\u00bb)<br \/>\n{$url = \u00ab\u00a0http:\/\/\u00a0\u00bb.$SERVER_NAME.$PHP_SELF.&rsquo;?&rsquo;.$QUERY_STRING;}<br \/>\nelse<br \/>\n{$url = \u00ab\u00a0http:\/\/\u00a0\u00bb.$SERVER_NAME.$PHP_SELF;}<br \/>\n$today = date(\u00ab\u00a0F j, Y, g:i a\u00a0\u00bb);<br \/>\nmail($to,$sujet, \u00ab\u00a0$todaynGoogle crawled $urlnNavigateur :<br \/>\n$HTTP_USER_AGENTnAdresse IP : $REMOTE_ADDR nNom de domaine :<br \/>\n$domaine\u00a0\u00bb, \u00ab\u00a0From: $adr_expediteur\u00a0\u00bb);<br \/>\n}<br \/>\n?&gt;<\/li>\n<li>Uploadez (encore une fois, lisez bien les pr\u00e9cautions du protocole pour ne pas \u00e9mettre de signaux perturbateurs vers Google).<\/li>\n<li>Mettez en place un lien vers la page cible qui sera prot\u00e9g\u00e9 par l\u2019attribut nofollow.\u00a0 Exemple\u00a0: &lt;a href=\u00a0\u00bbhttp:\/\/www.site.com\/page-cible.php\u00a0\u00bb&gt;test nofollow&lt;\/a&gt;.<\/li>\n<\/ul>\n<p>Etant donn\u00e9 qu\u2019il faut \u00e9viter que les visiteurs cliquent sur le lien, il est pr\u00e9f\u00e9rable de cacher le lien de test. Plusieurs solutions sont \u00e0 votre disposition, mais j\u2019ai opt\u00e9 pour le lien de m\u00eame couleur que le fond. Exemple :<\/p>\n<pre id=\"line116\">&lt;<span>a<\/span><span> href<\/span><span>=\"<\/span>http:\/\/www.site.com\/page-cible.php<span>\" <\/span><span>rel<\/span>=<span>\"nofollow\" <\/span>&gt;&lt;<span>font<\/span><span> color<\/span>=<span>\"#CCCC99\"<\/span>&gt;test&lt;\/<span>font<\/span>&gt;&lt;\/<span>a<\/span>&gt;<\/pre>\n<p>C\u2019est n\u2019est pas une solution id\u00e9ale, mais en r\u00e9p\u00e9tant le test plusieurs fois sur diff\u00e9rentes sites et pages, le facteur probabilit\u00e9 de d\u00e9couverte du lien diminue fortement jusqu&rsquo;\u00e0 \u00eatre consid\u00e9r\u00e9e comme n\u00e9gligeable.. De plus, la visite de GoogleBot s\u2019av\u00e8re prendre place tr\u00e8s rapidement si la page qui contient le lien est crawl\u00e9e r\u00e9guli\u00e8rement.<br \/>\nQuelques heures (3 \u00e0 7 dans mon cas) apr\u00e8s l\u2019upload sur le serveur de la page cible et du lien externe, vous devriez recevoir un eMail avertissant du passage de GoogleBot sur la page cible. C\u2019est la preuve que le robot d\u2019indexation a suivi le lien en nofollow, omettant de respecter la fonction principal de cet attribut qui indique de ne pas suivre un lien prot\u00e9g\u00e9 de la sorte.<br \/>\nCe test est uniquement une d\u00e9monstration, ne pr\u00e9tendant absolument pas \u00eatre le premier \u00e0 \u00e9mettre cette hypoth\u00e8se. D\u2019autres sources ont peut-\u00eatre expliqu\u00e9 la situation avant moi, mais je focalise plut\u00f4t sur la voie officielle de Google, au travers de son ing\u00e9nieur superstar <a href=\"http:\/\/www.mattcutts.com\/blog\/bot-obedience-herding-googlebot\/\" target=\"_blank\">Matt Cutts, qui affirme que le moteur ne suit pas les liens en nofollow<\/a>.<br \/>\n<strong>A quoi \u00e7a sert de savoir que GoogleBot suit les liens en nofollow ?<\/strong><br \/>\nL\u2019application la plus \u00e9vidente sugg\u00e8re qu\u2019il ne faut surtout pas compter sur le nofollow pour prot\u00e9ger un lien. Si jamais vous ne voulez pas que le moteur visite une page, ce n\u2019est pas avec ce syst\u00e8me qu\u2019il faille proc\u00e9der.<br \/>\nConcernant l\u2019apport de popularit\u00e9, je ne crois pas que le lien en nofollow ait un impact. Par contre, il n\u2019y a pas que le PageRank qui importe puisque diff\u00e9rents types de popularit\u00e9 sont envisageables. Du coup, le lien en nofollow peut tout \u00e0 fait transmettre quelque chose d\u2019autre que des visiteurs.\u00a0 N\u2019ayant pas de preuves pour expliquer plus en avant cette notion, je pr\u00e9f\u00e8re ne pas en dire plus. Par contre, je me suis toujours fi\u00e9 \u00e0 mon instinct \u00e0 propos de Google et il ne m\u2019a jamais tromp\u00e9.<br \/>\nL\u2019id\u00e9e principale que je voudrais sugg\u00e9rer est que l\u2019aversion pour l\u2019attribut nofollow doit se contenir \u00e0 la r\u00e9alit\u00e9. C\u2019est-\u00e0-dire qu\u2019il ne faut pas croire qu\u2019un lien en nofollow implique que Google ne sera jamais au courant de l\u2019existence du lien ou de la page vers lequel il pointe. Ce que Google fait ensuite de cette information sera impossible \u00e0 d\u00e9celer puisque c\u2019est bien enfoui dans son algorithme.<br \/>\nCrawler n\u2019est pas indexer<br \/>\nL\u2019indexation de la page cible n\u2019a pas fait partie du test , donc je mentionne seulement qu\u2019elle s\u2019est rapidement index\u00e9e au sein des r\u00e9sultats de recherche (visible en tapant site\u00a0:monsite.com).<br \/>\nSur un autre plan, je voulais aborder le manque de compr\u00e9hension \u00e0 propos de ce qui se trame r\u00e9ellement \u00e0 l\u2019int\u00e9rieur de Google. Pour r\u00e9sumer, le robot d\u2019indexation passe sur la page et va la ressortir en fonction des requ\u00eates tap\u00e9es par l\u2019internaute. Ce qui n\u2019est pas \u00e9vident concerne tout ce qui se passe entre le moment o\u00f9 GoogleBot crawle la page et la milliseconde qui pr\u00e9c\u00e9de l\u2019affichage des r\u00e9sultats de recherche.\u00a0 Entre ces deux phases, il se d\u00e9roule un grand nombre d\u2019op\u00e9rations qui nous sont totalement opaques. Mes seules \u00e9l\u00e9ments d\u2019observation concernent les pages mises en ligne et les r\u00e9sultats de recherche.\u00a0 Afin de comprendre comment le r\u00e9f\u00e9rencement, il faut admettre que l\u2019affichage des r\u00e9sultats de recherche n\u2019est pas une repr\u00e9sentation directe de l\u2019index. Au sein de ces r\u00e9sultats, Google nous distille seulement ce qu\u2019il veut bien nous montrer, mais cela ne d\u00e9montre en aucun cas qu\u2019il affiche tout ce qui est contenu dans l\u2019index.<br \/>\n<strong>Les foutaises du reverse engineering<\/strong><\/p>\n<p>Ainsi, j\u2019ai toujours d\u00e9cri\u00e9 les notions de \u00ab\u00a0reverse engineering\u00a0\u00bb se rapportant \u00e0 Google. Arriver \u00e0 comprendre le fonctionnement de l\u2019algorithme du moteur \u00e0 partir de l\u2019analyse des r\u00e9sultats de recherche pr\u00e9sente d\u2019\u00e9normes limitations li\u00e9es \u00e0 ce que je viens d\u2019expliquer pr\u00e9c\u00e9demment Trop souvent, je croise des pseudos th\u00e9ories qui s\u2019apparentent au fantasme car elles poussent trop loin l\u2019analyse par rapport aux observations des r\u00e9sultats de recherche.<br \/>\nCela n\u2019emp\u00eache pas d\u2019\u00e9mettre d\u2019\u00e9mettre des trouvailles qui visent \u00e0 am\u00e9liorer notre compr\u00e9hension du r\u00e9f\u00e9rencement, mais il est vital de savoir poser les bonnes limites. R\u00e9guli\u00e8rement, le Web s\u2019enflamme \u00e0 propos de simili d\u00e9couvertes qui ne sont rien de plus que des l\u00e9gendes urbaines. Le PageRank Google a souvent \u00e9t\u00e9 la victime de ces hallucinations que le moteur de recherche n\u2019est pas le dernier \u00e0 alimenter la promotion. Bien entendu, j\u2019adore \u00e9mettre des hypoth\u00e8ses qui vont plus loin que la raison ne le permet. Sauf que je ne trouve pas int\u00e9ressant de les propager au-del\u00e0 du cercle d\u2019initi\u00e9s qui comprennent parfaitement la port\u00e9e de ces hypoth\u00e8ses. Il n\u2019est pas sain de la part de certaines personnes influentes de lancer des hypoth\u00e8ses sous la forme d\u2019affirmation. Par exemple, dans le cadre de ce post, je me permets de partager le test, mais je ne vais pas d\u00e9lirer outre mesure. M\u00eame si j\u2019ai mes propres convictions \u00e0 propos de l\u2019interpr\u00e9tation des liens suivis par Google, il n\u2019est pas souhaitable de les d\u00e9velopper outre mesure en public.<br \/>\nParmi les l\u00e9gendes urbaines majeurs du r\u00e9f\u00e9rencement qui m\u2019ont fortement agac\u00e9es, je cite le <a href=\"https:\/\/www.laurentbourrelly.com\/blog\/40.php\" target=\"_blank\">TrustRank Google<\/a>. Le cas du nofollow est sensiblement diff\u00e9rent puisqu\u2019il s\u2019agit plut\u00f4t de mensonges et de manque de transparence dont j\u2019accuse Google. Cependant, le moteur de recherche est pass\u00e9 ma\u00eetre dans l\u2019art de laisser le petit monde du r\u00e9f\u00e9rencement s\u2019engager sur des fausses pistes.<br \/>\nFinalement, le nofollow revient dans la face de Google autrement qu\u2019il avait pr\u00e9vu. La preuve en est <a href=\"http:\/\/www.mattcutts.com\/blog\/pagerank-sculpting\/\" target=\"_blank\">cette annonce par Matt Cutts<\/a> qui vise \u00e0 d\u00e9courager la de pratique du PageRank sculpting. Le suivi des liens en nofollow est simplement \u00e0 mettre sur le compte des nombreuses d\u00e9ceptions \u00e0 propos de la transparence chez Google vis-\u00e0-vis des webmasters. Au travers de divers effets d\u2019annonce, le moteur fait semblent de communiquer, tandis qu\u2019il demeure parfaitement opaque. En fait, il agit tout comme les webmasters le d\u00e9rangent, oubliant peut-\u00eatre que c\u2019est sur le dos de nos pages qu\u2019il se fait des montagnes de fric et qu\u2019il domine la plan\u00e8te virtuelle.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>J\u2019ai r\u00e9alis\u00e9 un test qui vise \u00e0 d\u00e9montrer que GoogleBot, le robot d\u2019indexation Google, suit parfaitement liens prot\u00e9g\u00e9s par l\u2019attribut \u00ab\u00a0nofollow.\u00a0\u00bb D\u2019autres avant moi ont \u00e9mis cette hypoth\u00e8se, mais je voulais mettre en place un test dans les r\u00e8gles de l\u2019art plut\u00f4t qu\u2019\u00e9mettre des hypoth\u00e8ses bas\u00e9es sur l\u2019instinct et les observations. Le cas du nofollow [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[8],"tags":[202],"class_list":["post-102","post","type-post","status-publish","format-standard","hentry","category-moteurs-de-recherche","tag-google"],"_links":{"self":[{"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/posts\/102","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/comments?post=102"}],"version-history":[{"count":0,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/posts\/102\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/media?parent=102"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/categories?post=102"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/tags?post=102"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}