{"id":387,"date":"2009-11-14T22:49:22","date_gmt":"2009-11-14T21:49:22","guid":{"rendered":"http:\/\/www.laurentbourrelly.com\/blog\/?p=387"},"modified":"2009-11-14T22:49:22","modified_gmt":"2009-11-14T21:49:22","slug":"faut-il-avoir-peur-de-la-mise-a-jour-google-cafeine","status":"publish","type":"post","link":"https:\/\/www.laurentbourrelly.com\/blog\/387.php","title":{"rendered":"Faut-il avoir peur de la mise \u00e0 jour Google Caf\u00e9ine ?"},"content":{"rendered":"<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2009\/11\/google-cafeine.png\"><img loading=\"lazy\" decoding=\"async\" class=\"alignleft size-thumbnail wp-image-388\" style=\"border: 0pt none; margin: 0px 10px;\" title=\"La mise \u00e0 jour de Google Cafeine\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2009\/11\/google-cafeine-150x150.png\" alt=\"La mise \u00e0 jour de Google Cafeine\" width=\"135\" height=\"135\" align=\"left\" \/><\/a>Les stigmates des bouleversements caus\u00e9s par certaines mises \u00e0 jour Google, telles que Florida en 2003 restent grav\u00e9s dans la m\u00e9moire collective du r\u00e9f\u00e9rencement.<\/p>\n<p>L\u2019annonce d\u2019une mise \u00e0 jour surnomm\u00e9e Caf\u00e9ine (Caffeine en anglais) provoque des remous plus ou moins justifi\u00e9s, au travers de ceux qui s&rsquo;int\u00e9ressent \u00e0 Google et au r\u00e9f\u00e9rencement de site Internet.<!--more--><\/p>\n<p>Faut-il que ceux, qui poss\u00e8dent des sites positionn\u00e9s convenablement parmi les r\u00e9sultats de recherche Google,\u00a0 redoutent la mise \u00e0 jour Caf\u00e9ine?<\/p>\n<p>Comme d\u2019habitude, les pseudo analyses, suppositions et autres interpr\u00e9tations fleurissent au travers des blogs et forums \u00e0 propos de la mise \u00e0 jour Caf\u00e9ine. C\u2019est comme cela que naissent les mythes du r\u00e9f\u00e9rencement, habilement aliment\u00e9s par Google caus\u00e9 par un manque de transparence r\u00e9curent.<\/p>\n<h1>Qu&rsquo;est ce que Google Caf\u00e9ine?<\/h1>\n<p>Il \u00e9tait \u00e9vident que certains allaient sortir des th\u00e9ories alimentant la pompe \u00e0 <a href=\"https:\/\/www.laurentbourrelly.com\/blog\/369.php\" target=\"_blank\">mythes et secrets du r\u00e9f\u00e9rencement<\/a>.<br \/>\nEn guise d&rsquo;avertissement, nous avons re\u00e7u une <a href=\"http:\/\/googlewebmastercentral.blogspot.com\/2009\/08\/help-test-some-next-generation.html\" target=\"_blank\">annonce<\/a> officielle de Google, plusieurs interviews de Matt Cutts, ainsi qu&rsquo;un <a href=\"http:\/\/www.mattcutts.com\/blog\/google-caffeine-update\/\" target=\"_blank\">post<\/a> sur son blog se voulant rassurant. Sur le Web, la discussion est bien lanc\u00e9e sur <a href=\"http:\/\/blogsearch.google.com\/blogsearch?q=google+caffeine\" target=\"_blank\">blogs<\/a>, <a href=\"http:\/\/www.webmasterworld.com\/google\/3999055.htm\" target=\"_blank\">forums<\/a>, <a href=\"http:\/\/search.twitter.com\/search?q=google+caffeine\" target=\"_blank\">Twitter<\/a>, etc.<br \/>\nUne <a href=\"http:\/\/www2.sandbox.google.com\/\" target=\"_blank\">URL<\/a> mettait \u00e0 disposition l\u2019acc\u00e8s \u00e0 un aper\u00e7u de l&rsquo;index Google Caf\u00e9ine. Cet acc\u00e8s est ferm\u00e9 depuis le 10 novembre 2009.<\/p>\n<h4>Interview de Matt Cutts \u00e0 propos de Google Caffeine<\/h4>\n<p><a href=\"http:\/\/www.youtube.com\/v\/NU5cKDryjy0\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-medium wp-image-389\" title=\"Interview de Matt Cutts parlant de Google Caf\u00e9ine\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2009\/11\/Matt-Cutts-Google-Caffeine-300x193.png\" alt=\"Interview de Matt Cutts parlant de Google Caf\u00e9ine\" width=\"300\" height=\"193\" \/><\/a><\/p>\n<h2>Propagation de la rumeur et mise en route d\u2019un mythe<\/h2>\n<p>Au d\u00e9part, <a href=\"http:\/\/mashable.com\/2009\/08\/10\/google-caffeine\/\" target=\"_blank\">Mashable<\/a> sort une analyse que je qualifie de tout \u00e0 fait superficielle. Le point subjectif concerne une soi-disant pond\u00e9ration sup\u00e9rieure des mots cl\u00e9s sur Google Caf\u00e9ine.<\/p>\n<p>Un blogueur fran\u00e7ais orient\u00e9 r\u00e9f\u00e9rencement\u00a0 <a href=\"http:\/\/bababillgates.free.fr\/index.php\/googe-caffeine-a-t-il-un-impact-sur-le-seo-et-le-referencement\/\" target=\"_blank\">reprend<\/a> la teneur de l\u2019analyse Mashable \u00e0 son propre compte (sans citer la source d\u2019origine qui l&rsquo;a inspir\u00e9) et d\u2019<a href=\"http:\/\/www.global-referencement.fr\/SEO\/google\/tests-sur-impact-google-caffeine-seo.html\" target=\"_blank\">autres<\/a> vont citer ce billet sur leurs <a href=\"http:\/\/www.concepteur-redacteur-blog.com\/2009\/11\/12\/rank-tracker-google-caffeine\/\" target=\"_blank\">blogs<\/a>, <a href=\"http:\/\/topsy.com\/tb\/bababillgates.free.fr\/index.php\/googe-caffeine-a-t-il-un-impact-sur-le-seo-et-le-referencement\/\" target=\"_blank\">Twitter<\/a> et autres sources de partage de contenu. M\u00eame le <a href=\"http:\/\/www.journaldunet.com\/solutions\/moteur-referencement\/selection\/caffeine-le-futur-moteur-de-recherche-de-google\/des-changements-en-perspective.shtml\" target=\"_blank\">Journal du Net<\/a> met les pieds dans le plat sans savoir de quoi il s&rsquo;agit v\u00e9ritablement.<\/p>\n<p>Le pire de tous est <a href=\"http:\/\/ezinearticles.com\/?Learn-How-Google-Caffeine-Will-Affect-Your-Website!&amp;id=2777909\" target=\"_blank\">celui l\u00e0<\/a> qui part dans un d\u00e9lire total, voulant sciemment propager une peur parmi ses lecteurs.<\/p>\n<h3>Ce qu&rsquo;il faut retenir \u00e0 propos de Google Caf\u00e9ine<\/h3>\n<p>Google Caf\u00e9ine est un nouvel index h\u00e9berg\u00e9 par une nouvelle infrastructure qui repose sur le Google File System V. 2., dont la structure nous est <a href=\"http:\/\/www.webrankinfo.com\/actualites\/200411-infrastructure-google.htm\" target=\"_blank\">connue<\/a> depuis 2004.\u00a0 La V.2 con\u00e7oit une \u00e9volution majeure du Google File System, permettant d&rsquo;am\u00e9liorer l&rsquo;indexation et la gestion des donn\u00e9es.<\/p>\n<p><strong>Cela entraine\u00a0principalement:<\/strong><\/p>\n<ul>\n<li>Une am\u00e9lioration de vitesse d\u2019indexation<\/li>\n<li>Une plus grande fiabilit\u00e9 sur les r\u00e9sultats de recherche<\/li>\n<li>Des moyens d\u00e9cupl\u00e9s en interne pour le travail des ing\u00e9nieurs Google<\/li>\n<\/ul>\n<p>Les observateurs du r\u00e9f\u00e9rencement ont tellement envie de croire que cette mise \u00e0 jour va provoquer des remous qu\u2019ils brouillent plus ou moins volontairement la compr\u00e9hension g\u00e9n\u00e9rale. Malgr\u00e9 les efforts \u00e9vidents de l&rsquo;inusable Matt Cutts pour signifier qu&rsquo;il s&rsquo;agit d&rsquo;une \u00e9volution d&rsquo;infrastructure, certains font l&rsquo;amalgame entre index et algorithme.<br \/>\nBien entendu, la communication Google n&rsquo;\u00e9tant pas limpide, tout le monde peut croire qu&rsquo;il r\u00e9side un pi\u00e8ge au tournant. Sans doute que l&rsquo;annonce du recul de d\u00e9ploiement global apr\u00e8s les f\u00eates \u00e9voque les remous de Florida au sein de l&rsquo;imaginaire collectif.<\/p>\n<p>Encore une fois, Google Caf\u00e9ine permet \u00e0 Google de reposer sur une infrastructure plus performante, avec l\u2019algorithme n\u2019\u00e9tant pas la principale cible de cette mise \u00e0 jour. Ainsi, le plus gros changement que nous allons observer concerne l\u2019index qui sera rafra\u00eechi.<\/p>\n<h3>Et l&rsquo;algorithme dans tout \u00e7a ?<\/h3>\n<p>Le principe de fonctionnement de Google est un algorithme par couches. Il existe une formule de base sur laquelle sont pos\u00e9s des filtres qui concernent des param\u00e8tres en particulier et\/ou certaines parties de l\u2019index.<\/p>\n<p>Comme expliqu\u00e9 pr\u00e9c\u00e9demment, Google Caf\u00e9ine ne focalise pas sur l\u2019algorithme. Un peu comme si vous changiez de voiture pour passer d\u2019une Twingo \u00e0 une Porsche, mais vous n\u2019\u00eates pas devenu S\u00e9bastien Loeb par l\u2019interm\u00e9diaire de ce changement du v\u00e9hicule.<\/p>\n<p>Bien s\u00fbr, l&rsquo;index et l&rsquo;algorithme sont li\u00e9s, donc j&rsquo;imagine qu&rsquo;il faut accorder le bouzin pour qu&rsquo;il d\u00e9pote \u00e0 merveille. Par ailleurs, il est facile de comprendre que ce n&rsquo;est pas non plus le meilleur moment pour coller des filtres \u00e0 foison qui pourraient mettre \u00e0 mal cette merveilleuse nouvelle machinerie.<\/p>\n<h3>Les effets et cons\u00e9quences de Google Caf\u00e9ine<\/h3>\n<p>Ma plus grande attente concerne l&rsquo;indexation en temps r\u00e9el. Jusque \u00e0 maintenant, Google Search est \u00e0 la ramasse et Google Images est un d\u00e9sastre. Esp\u00e9rons que cette nouvelle infrastructure va permettre \u00e0 Google de pouvoir tacler l\u2019indexation en temps r\u00e9el convenablement.<\/p>\n<p>Les \u00e9ventuelles perturbations observ\u00e9es ressortent l&rsquo;excuse passe partout qui sont les <em>effets de bord<\/em>. Quand on bidouille un index de cette taille, il est \u00e9vident que certains effets inattendus apparaissent pour des cas isol\u00e9s. Bien \u00e9videmment, ceux qui verront leurs sites tomber vont faire un ramdam pas possible, mais ils repr\u00e9senteront une portion microscopique du total de l&rsquo;index.<\/p>\n<p>Si l\u2019algorithme \u00e9tait concern\u00e9 par cette mise \u00e0 jour, cela amplifierait les effets de bords. Essayez de changer une virgule dans une formule math\u00e9matique pour voir un peu les cons\u00e9quences&#8230;<\/p>\n<p>Une autre \u00e9vidence du rafraichissement de l&rsquo;index concerne l&rsquo;affichage du nombre de r\u00e9sultats qui \u00e9tait notoirement farfelu. J&rsquo;ose esp\u00e9rer qu&rsquo;on pourra d\u00e9sormais se fier avec plus d&rsquo;exactitude aux chiffres \u00e9nonc\u00e9s dans les r\u00e9sultats de recherche.<\/p>\n<p>La lutte contre le spam reste au coeur des besoins de Google. Une meilleure manipulation des donn\u00e9es contenues dans l&rsquo;index pourrait aider dans <a href=\"https:\/\/www.laurentbourrelly.com\/blog\/378.php\">cette lutte pour totalement vaine<\/a> (pour l&rsquo;instant).<\/p>\n<p>Le param\u00e8tre dont parlent ceux qui ont compris de quoi il s&rsquo;agit porte sur la vitesse de chargement des sites, dont les plus lents pourraient \u00eatre d\u00e9favoris\u00e9s. Ce nouvel index focalise sur la vitesse, donc il semble viable de demander aux pages affich\u00e9es parmi les meilleurs r\u00e9sultats de suivre cette tendance. Matt Cutts mis le doigt sur ce point dans une <a href=\"http:\/\/www.webpronews.com\/topnews\/2009\/11\/13\/google-page-speed-may-be-a-ranking-factor-in-2010\" target=\"_blank\">interview<\/a> r\u00e9cente, ainsi que <a href=\"http:\/\/searchengineland.com\/site-speed-googles-next-ranking-factor-29793\" target=\"_blank\">SearchEngineLand<\/a> qui abonde dans ce sens. Attention, il ne faut pas faire partir une nouvelle rumeur sugg\u00e9rant qu\u2019un site qui se charge en plus de 4 secondes va perdre 30 positions. Ce param\u00e8tre est \u00e0 inclure parmi les +200 qui composent l\u2019algorithme, n\u00e9cessitant de jauger son importante relative par rapport aux autres.<\/p>\n<p>A propos de la vitesse de chargement des pages Web, je reste perplexe car j\u2019ai test\u00e9 la rapidit\u00e9 de mon site et le facteur le plus ralentissant est \u2026 Google Analytics &#8211; par le biais du code JavaScript install\u00e9 en bas de chaque page.<\/p>\n<h4>Comment faire une analyse convenable\u00a0?<\/h4>\n<p>Le <em>reverse engineerin<\/em>g \u00e0 la petite semaine est une perte de temps. Tout d\u2019abord, il faut bien comprendre que l\u2019affichage des r\u00e9sultats de recherche n\u2019est pas forc\u00e9ment une retranscription exacte de ce qui se trame dans l\u2019index. Sans parler des chiffres farfelus affich\u00e9s comme compteur des r\u00e9sultats, Il existe toute une s\u00e9rie d\u2019op\u00e9rations depuis le moment o\u00f9 GoogleBot crawle une page Web jusqu\u2019au moment o\u00f9 elle ressort sous divers op\u00e9rateurs au sein des r\u00e9sultats de recherche. Nous disposons uniquement de la plus petite lucarne qui sont les r\u00e9sultats de recherche du moteur. Toute la machinerie en amont est invisible et inconnue.<\/p>\n<p><a href=\"http:\/\/bababillgates.free.fr\/index.php\/googe-caffeine-a-t-il-un-impact-sur-le-seo-et-le-referencement\/\" target=\"_blank\">Tirer des conclusions<\/a> \u00e0 partir d\u2019un r\u00e9sultat de recherche pour d\u00e9terminer ce qui se passe en amont est vou\u00e9 \u00e0 pr\u00e9senter une pitoyable interpr\u00e9tation du fonctionnement de Google.<\/p>\n<p>Parmi les mythes du r\u00e9f\u00e9rencement, il demeure un param\u00e8tre que j\u2019ai toujours combattu avec force. Il s&rsquo;agit de la densit\u00e9 des mots cl\u00e9s au sein d\u2019une page. Il suffit de savoir dans les grandes lignes comment Google fonctionne pour se rendre compte que ce crit\u00e8res est totalement farfelu.<\/p>\n<p>Pour analyser le comportement du moteur par rapport aux mots cl\u00e9s, il faudrait \u00e9valuer le nombre d\u2019occurrences sur la page. Jusque l\u00e0 c\u2019est facile\u00a0; il suffit de compter les mots cibles sans prendre en compte le nombre total de mots cl\u00e9s comme le fait le calcul de densit\u00e9. Ensuite, il faut \u00e9valuer ces occurrences par rapport aux occurrences exactes sur le reste du site, puis par rapport aux co-occurrences similaires et compl\u00e9mentaires.<\/p>\n<p>Ce n\u2019est pas fini\u00a0! Maintenant, il faut prendre chaque partie de ces r\u00e9sultats pour les \u00e9valuer en fonction des pages Web concurrentes et le reste du site des pages concurrentes qui sont elles m\u00eame analys\u00e9es comme pr\u00e9c\u00e9demment.<br \/>\nEnsuite, il faut remonter ces donn\u00e9es pour tenter d&rsquo;en sortir une r\u00e8gle de pond\u00e9ration qui sera toujours \u00e0 prendre avec pr\u00e9caution car je rappelle que l&rsquo;index n&rsquo;est pas trait\u00e9 de mani\u00e8re identique sur sa totalit\u00e9.<\/p>\n<p>Et l\u00e0 on dispose d\u2019un petit d\u00e9but de piste concernant la prise en compte des mots cl\u00e9s. Tout cela doit \u00e9videmment se r\u00e9p\u00e9ter sur un nombre suffisant de mots cl\u00e9s pour une seule page, plusieurs pages du m\u00eame site, plusieurs sites sur la m\u00eame requ\u00eate, un seul site sur plusieurs requ\u00eates, plusieurs sites sur plusieurs requ\u00eates, etc.<\/p>\n<p>Ainsi, je peux sereinement r\u00e9futer les r\u00e9sultats de Mashable, ainsi que tous les autres qui se sont inspir\u00e9s de cette analyse bidon.<\/p>\n<h4>Si je comprends bien, je n\u2019ai rien \u00e0 craindre pour mon site\u00a0?<\/h4>\n<p>Pour la vaste majorit\u00e9 des sites Internet, il n\u2019y aura pas ou tr\u00e8s peu de changement. Ceux qui seront touch\u00e9s seront s\u00fbrement affect\u00e9s par un effet temporaire qui sera d\u00e9gag\u00e9 sans rien modifier sur le site. Malheureusement, c\u2019est frustrant et je connais personnellement le ph\u00e9nom\u00e8ne.<\/p>\n<p>Dans tous les cas, il ne faudra pas regarder du c\u00f4t\u00e9 d\u2019une \u00e9ventuelle p\u00e9nalit\u00e9 algorithmique, mais plut\u00f4t par rapport aux param\u00e8tres li\u00e9s \u00e0 l\u2019indexation.<\/p>\n<p>On verra bien en janvier lorsque Google Caf\u00e9ine sera d\u00e9ploy\u00e9 sur tous les DataCenters du moteur de recherche, mais je peux logiquement m\u2019avancer en rejetant en bloc tous ceux qui font l&rsquo;amalgame entre index et algorithme.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Les stigmates des bouleversements caus\u00e9s par certaines mises \u00e0 jour Google, telles que Florida en 2003 restent grav\u00e9s dans la m\u00e9moire collective du r\u00e9f\u00e9rencement. L\u2019annonce d\u2019une mise \u00e0 jour surnomm\u00e9e Caf\u00e9ine (Caffeine en anglais) provoque des remous plus ou moins justifi\u00e9s, au travers de ceux qui s&rsquo;int\u00e9ressent \u00e0 Google et au r\u00e9f\u00e9rencement de site Internet.<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[8],"tags":[202,206,207,302,409,433,444],"class_list":["post-387","post","type-post","status-publish","format-standard","hentry","category-moteurs-de-recherche","tag-google","tag-google-cafeine","tag-google-caffeine","tag-matt-cutts","tag-referenceur","tag-searchengineland","tag-seo"],"_links":{"self":[{"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/posts\/387","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/comments?post=387"}],"version-history":[{"count":0,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/posts\/387\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/media?parent=387"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/categories?post=387"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/tags?post=387"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}