<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Laurent Bourrelly » Vanessa Fox</title>
	<atom:link href="http://www.laurentbourrelly.com/blog/tag/vanessa-fox/feed" rel="self" type="application/rss+xml" />
	<link>http://www.laurentbourrelly.com/blog</link>
	<description>SEO ROCKSTAR</description>
	<lastBuildDate>Wed, 01 Feb 2012 10:02:22 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Google peut-il combattre le spam ?</title>
		<link>http://www.laurentbourrelly.com/blog/378.php</link>
		<comments>http://www.laurentbourrelly.com/blog/378.php#comments</comments>
		<pubDate>Fri, 13 Nov 2009 15:20:30 +0000</pubDate>
		<dc:creator>Laurent</dc:creator>
				<category><![CDATA[Moteurs de recherche]]></category>
		<category><![CDATA[Archive.org]]></category>
		<category><![CDATA[danger]]></category>
		<category><![CDATA[Eric Schmidt]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Internet]]></category>
		<category><![CDATA[Matt Cutts]]></category>
		<category><![CDATA[moteur]]></category>
		<category><![CDATA[nofollow]]></category>
		<category><![CDATA[recherche]]></category>
		<category><![CDATA[RĂ©fĂ©rencement]]></category>
		<category><![CDATA[Robots.txt]]></category>
		<category><![CDATA[site]]></category>
		<category><![CDATA[Vanessa Fox]]></category>
		<category><![CDATA[web]]></category>

		<guid isPermaLink="false">http://www.laurentbourrelly.com/blog/?p=378</guid>
		<description><![CDATA[Hier, je suivais la confĂ©rence PubCon oĂą Matt Cutts et Vanessa Fox auditaient des sites Web en direct. Comme de nombreux autres rĂ©fĂ©renceurs, jâ€™ai fait un bond lorsque Matt Cutts a clamĂ© que lâ€™interdiction de crawl par archives.org remontait une alerte rouge pour forte probabilitĂ© de spam par Google. Ce dĂ©tail ajoute Ă  une perspective [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/archive-org1.png" rel="shadowbox[sbpost-378];player=img;" title="Blocage Archive.org par Robots.txt"><img class="alignleft size-thumbnail wp-image-380" style="border: 0pt none; margin: 0px 10px;" title="Blocage Archive.org par Robots.txt" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/archive-org1-150x150.png" alt="Blocage Archive.org par Robots.txt" width="105" height="105" align="left" /></a>Hier, je suivais la confĂ©rence PubCon oĂą Matt Cutts et Vanessa Fox auditaient des sites Web en direct.</p>
<p>Comme de nombreux autres rĂ©fĂ©renceurs, jâ€™ai fait un bond lorsque Matt Cutts a clamĂ© que lâ€™interdiction de crawl par archives.org remontait une alerte rouge pour forte probabilitĂ© de spam par Google. Ce dĂ©tail ajoute Ă  une perspective plus grande qui concerne la maniĂ¨re dont Google combat le spam et son dictat qui commence sĂ©rieusement Ă  nous chauffer les oreilles.<span id="more-378"></span></p>
<h1>L&#8217;incident Archive.org durant PubCon</h1>
<p>Pour ceux qui ne connaissent pas <a href="http://www.archive.org/" target="_blank">Archive.org</a>, il enregistre les versions dâ€™un site au travers du temps. Les spammeurs ne souhaitent pas y figurer puisque Ă§a pourrait afficher les saloperies quâ€™ils font bouffer aux moteurs de recherche et aux internautes.</p>
<p>Dâ€™un autre cĂ´tĂ©, il existe une multitude de raisons lĂ©gitimes pour bloquer Archive.orgÂ :</p>
<ul>
<li>Protection de mes donnĂ©esÂ car Archive.org est tout simplement un voleur de contenu.</li>
<li>Ne pas montrer des versions prĂ©cĂ©dentes du site car il est parfois embarrassant de voir Ă  quoi ressemblait un site Ă  ses dĂ©buts ou tout simplement parce que le site est en dĂ©veloppement.</li>
<li>Si je change la thĂ©matique d&#8217;un site rattachĂ© Ă  un nom de domaine, il est souhaitable que lâ€™historique ne remonte pas (jâ€™ai personnellement le cas actuellement)</li>
</ul>
<p>En lire plus Ă  propos de lâ€™incident PubCon chez</p>
<ul>
<li><a href="http://www.seo-theory.com/2009/11/12/reblog-why-some-sites-must-block-archive-org/" target="_blank">SEO Theory</a> (bonne explication sur les mythes Google et son dictat)</li>
<li><a href="http://www.pink-seo.com/blog/google-dictateur-des-temps-modernes-269" target="_blank">Pink SEO</a> (focalise sur le blocage Archive.org)</li>
<li><a href="http://www.seomoz.org/blog/new-interesting-insights-into-google-rankings-spam-from-pubcon" target="_blank">SEOMoz</a> couverture PubCon</li>
<li>SeroundtableÂ  <a href="http://www.seroundtable.com/archives/021107.html" target="_blank">Organice Focus</a> (contient lâ€™intervention de Matt Cutts) et <a href="http://www.seroundtable.com/archives/021159.html" target="_blank">couverture Live de PubCon</a></li>
</ul>
<h2>Lâ€™impuissance de Google devant le spam</h2>
<p>Depuis le temps que je&#8217;observe Matt Cutts, alors quâ€™il Ă©tait encore <a href="http://googleguy-fr.blogspot.com/" target="_blank">GoogleGuy</a>, jâ€™ai appris Ă  lire entre les lignes de ses propos. En effet, ce nâ€™est pas ce quâ€™il dit qui importe le plus souvent car câ€™est dâ€™une banalitĂ© affligeante, mais plutĂ´t comment il le dit et ce quâ€™il ne dit pas. En gros, il y a deux solutionsÂ :</p>
<ul>
<li>Matt Cutts nâ€™y connaĂ®t pas grand chose</li>
<li>Matt Cutts cache bien son jeu</li>
</ul>
<h3>Le nofollowÂ : aveu dâ€™impuissance</h3>
<p>Aujourd&#8217;hui, Ă§a devient assez lourd de subir le dictat de ce moteur de recherche. Lâ€™exemple le plus dĂ©sastreux concerne le nofollow qui a tout simplement bousillĂ© le rĂ©fĂ©rencement organique. Vous pouvez crĂ©er le meilleur contenu du monde, mais il ne sera pas plus liĂ© comme avant puisquâ€™il nâ€™y a plus un transfert de popularitĂ© adĂ©quat. En dâ€™autres termes, un internaute va citer spontanĂ©ment votre page Web au sein dâ€™une conversation de forum, blog ou rĂ©seau social, mais ce lien ne vaudra rien au niveau de la popularitĂ©, principalement alliĂ©e au PageRank (sans parler de Twitter qui a achevĂ© d&#8217;enterrer le backlink). La capote du Web ou attribut nofollow est dĂ©sormais partout et surtout lĂ  oĂą il ne faut pas. Par exemple, Ă  la suite dâ€™un concours de rĂ©fĂ©rencement au cours duquel les participants venaient poser leurs liens sur une poignĂ©e de pages Wikipedia, câ€™est lâ€™encyclopĂ©die en ligne complĂ¨te qui s&#8217;est Ă©quipĂ©e de liens sortants nofollowisĂ©s. Autre exemple qui m&#8217;agace est le fabuleux script de blogging WordPress configurant par dĂ©faut les liens dans les commentaires en nofollow. Et on pourrait citer tant dâ€™autres exemples oĂąÂ  le nofollow est prĂ©sent, alors quâ€™il est possible de maĂ®triser le contenu dâ€™une autre maniĂ¨re. Pour rappel, les sites qui utilisent le nofollow prouvent leur incapacitĂ© Ă  maĂ®triser leur propre contenu. Celui qui n&#8217;est pas capable de trier les commentaires de son blog doit fermer les commentaires ou arrĂŞter de bloguer. Ce n&#8217;est pas la peine d&#8217;imposer un nofollow quand on gĂ¨re les commentaires ou alors c&#8217;est par radinerie du <em>Link Juice</em> et c&#8217;est encore plus dĂ©testable.</p>
<p>En juin 2009, Google a avouĂ© son impuissance et son erreur sur le sujet du nofollow par le biais de lâ€™annonce par Matt Cutts Ă  propos de la pseudo <a href="http://www.mattcutts.com/blog/pagerank-sculpting/" target="_blank">fin du PageRank Sculpting</a>. Ils ont lĂ˘chĂ© le nofollow sur le Web pour qu&#8217;un retour de bĂ˘ton ne se fasse pas attendre. Maintenant, il est trop tard car cette verrue est trop rĂ©pandue.</p>
<h2>OĂą en est le combat de Google contre le spam ?</h2>
<p>Le problĂ¨me Ă  propos du blocage de Archive.org par le biais du robots.txt peut paraĂ®tre anodin Ă  certains, mais câ€™est en lisant entre les lignes quâ€™on remarque toute la portĂ©e de cet incident.</p>
<p>DĂ©sormais, tout porte Ă  croire que Google ne maĂ®trise absolument pas le sujet du combat contre le spam. La maniĂ¨re dont Matt Cutts a rĂ©agit Ă  propos de ce paramĂ¨tre lors de PubCon ne suggĂ¨re pas ou ne nâ€™implique pas, mais plutĂ´t dĂ©montre directement que ce paramĂ¨tre amĂ¨ne immĂ©diatement le site dans une zone peu enviable. Ce nâ€™est pas un paramĂ¨tre dâ€™alerte parmi tant dâ€™autres, mais bien une alerte majeure qui va Ă©veiller les plus gros soupĂ§ons. Quand Matt Cutts dit Â«Â <em>itâ€™s a huge Red Flag</em> Â» (câ€™est une Ă©norme alerte rouge), il faut bien comprendre qu&#8217;il s&#8217;agit d&#8217;un paramĂ¨tre majeur, nĂ©cessitant de lire entre les lignes. J&#8217;en dĂ©duis queÂ  câ€™est Ă  ce niveau de dĂ©tection que Google stagne pour dĂ©clencher des alertes majeures. La console de Matt Cutts n&#8217;est finalement peut-ĂŞtre pas si impressionnante que Ă§a?</p>
<p>Un peu plus tard, Matt Cutts a tentĂ© de dĂ©douaner son intervention via Twitter en expliquant que c&#8217;est dans le cadre oĂą un site est suspectĂ© qu&#8217;il va remarquer le blocage archive.org. Sauf que ce n&#8217;est pas du tout ce qui s&#8217;est passĂ© lors de PubCon. Je ne crois pas une seconde que l&#8217;analyse aussi facile d&#8217;un tel paramĂ¨tre est impliquĂ©e dans un deuxiĂ¨me niveau de vĂ©rification. MĂŞme si c&#8217;est le cas, le problĂ¨me reste identique par rapport Ă  l&#8217;opacitĂ© de Google.</p>
<h3>Pourquoi c&#8217;est grave ?</h3>
<p>Câ€™est grave car (en partant du principe que je nâ€™ai rien Ă  me reprocher), il est Ă©vident que je nâ€™ai pas du tout envie que Google vienne fouiner sur mon site pour trouver quelque chose qui ne va pas. Câ€™est exactement comme le principe de la Garde Ă  Vue oĂą je peux ĂŞtre sĂ©questrĂ© simplement parce que je suis tĂ©moin dâ€™un crime. VoilĂ  un sentiment malsain dâ€™impuissance contre une suspicion injuste. Il y a aucun dialogue possible avec Google, mis Ă  part lorsque le mal est dĂ©jĂ  fait avec le site blacklistĂ© c.a.d sorti de lâ€™index. Câ€™est alors quâ€™il faut passer par la fameuse <a href="http://www.google.com/support/webmasters/bin/answer.py?hl=fr&amp;answer=35843" target="_blank">Reinclusion Request</a> et attendre vaillamment une rĂ©ponse automatique, puis insister lourdement pour enfin enchaĂ®ner sur un dialogue de sourds. Pour peu que vous soyez effectivement coupables dâ€™effraction envers les Webmaster Guidelines, le processus peut sâ€™avĂ©rer trĂ¨s long.</p>
<p>Ainsi, il est demandĂ© de suivre des rĂ¨gles inconnues, sachant que des paramĂ¨tres flous peuvent dĂ©clencher une suspicion, alors que lâ€™intention premiĂ¨re nâ€™Ă©tait pas forcĂ©ment de spammer. Nous sommes accusĂ©s par dĂ©faut dâ€™ĂŞtre ignorant de rĂ¨gles qui nous sont inconnues. Car si vous reposez votre stratĂ©gie sur les <a href="http://www.google.com/support/webmasters/bin/answer.py?hl=fr&amp;answer=35769" target="_blank">Google Webmaster Guidelines,</a> il apparaĂ®t que tous les paramĂ¨tres Ă  respecter nâ€™y figurent pas. En tout cas, je vois Archive.org nulle part. Ă‰tonnant de remarquer son absence pour un <em>Ă©norme</em> paramĂ¨tre d&#8217;aprĂ¨s Matt Cutts.</p>
<p>Dans le cadre dâ€™un site pĂ©nalisĂ©; câ€™est Ă  dire relĂ©guĂ© au fin fond de lâ€™index, mais pas exclu, vous pouvez toujours vous atteler Ă  contacter Google afin dâ€™obtenir une explication. Pourtant, jâ€™ai vu des sites pĂ©nalisĂ©s pendant plus dâ€™un an pour quâ€™ils remontent miraculeusement sans avoir effectuĂ© de modifications majeures et surtout sans avoir compris dâ€™oĂą venait la pĂ©nalitĂ©. J&#8217;ai encore une exemple personnel oĂą le site que j&#8217;ai vendu est tombĂ© trois semaines aprĂ¨s le transfert pour remonter dix mois plus tard. Impossible de savoir pourquoi le site est tombĂ© et encore moins pourquoi le site est remontĂ©. Pendant ce temps, le chiffre dâ€™affaire est tombĂ© Ă  zĂ©roâ€¦</p>
<p>Les mythes Ă  propos du rĂ©fĂ©rencement Google sont trop nombreux et flous pour que j&#8217;en parle sur ce billet, mais la vaste majoritĂ© des webmasters ne savent absolument pas Ă  quoi s&#8217;en tenir sur de nombreux sujets. Par exemple: contenu dupliquĂ©, intĂ©rĂŞt du pagerank, notion du trustrank, regoupement d&#8217;IPs, redirections, etc.</p>
<h4>Nous sommes des idiots pataugeant au milieu d&#8217;un moteur idiot</h4>
<p>Maintenant, jâ€™arrive au cĹ“ur de mon propos qui reprend cet exemple du blocage de Archive.org dans le Robots.txt. Nous apprenons par le biais dâ€™une couverture en direct de la confĂ©rence PubCon quâ€™il est totalement dĂ©conseillĂ© dâ€™opĂ©rer une interdiction de crawl d&#8217;Archive.org. Il faut vraiment le vouloir pour ĂŞtre au courant de cette information. A la limite, on s&#8217;en fout complĂ¨tement de archive.org qui n&#8217;a d&#8217;intĂ©rĂŞt que parce que Matt Cutts vient d&#8217;en parler, mais Ă§a dĂ©montre comment les rĂ¨gles de Google sont bien trop opaques pour qu&#8217;on puisse travailler sereinement.</p>
<p>Il est scandaleux de laisser les responsables de sites Web dans lâ€™ignorance totale. Comme je disais dans mon billet prĂ©cĂ©dent, nous jouons au <a href="http://www.pro34.com/" target="_blank">poker</a> sans connaĂ®tre les rĂ¨gles qui sont modifiĂ©es sans nous avertir. Ou alors Google nous averti, mais ne dit pas exactement de quoi il en retourne (par exemple avec la <a href="http://googlewebmastercentral.blogspot.com/2009/08/help-test-some-next-generation.html" target="_blank">mise Ă  jour CafĂ©ine</a> ).<br />
Mon travail consiste Ă  auditer des sites Internet pour optimiser le rĂ©fĂ©rencement. J&#8217;observe donc tous les jours des problĂ¨mes qui pourraient s&#8217;apparenter Ă  de la triche, mais qui ne sont absolument mis en place afin de vouloir biaiser les moteurs.</p>
<p>Sans parler de lâ€™opacitĂ© du programme Adsense ou Adwords dans lequel il est tout de mĂŞme question de sous â€“de gros sous- et sur lesquels nous disposons dâ€™une comprĂ©hension trĂ¨s limitĂ©e.</p>
<p>Tout cela mâ€™amĂ¨ne Ă  la simple conclusion que Google et Matt Cutts en particulier pataugent totalement dans la choucroute Ă  propos du combat contre le spam. Â Il suffit de sâ€™intĂ©resser au rĂ©fĂ©rencement Black Hat pour observer que les nouvelles bidouilles sont ingĂ©nieuses, mais elles reposent sur des bases anciennes. Bien sĂ»r, les principes restent identiques : gĂ©nĂ©rer et cacher du contenu, acquĂ©rir des liens, faire descendre les concurrents. Par contre, les bidouilles Ă©voluent plutĂ´t par rapport au progrĂ¨s technique que par rapport aux Ă©ventuels filtres qui pourraient entraver la route dâ€™un site Black Hat.<br />
Pour parler simplement et clairement: Google ne fait pas peur aux spammeurs et câ€™est bien lĂ  le fond du problĂ¨me.</p>
<p>Ainsi, malgrĂ© le fait que Matt Cutts semble ĂŞtre une personne trĂ¨s sympathique, il est fort possible quâ€™au final, il capte beaucoup moins quâ€™on le pense, Ă©ludant lâ€™option quâ€™il cache habilement son jeu.</p>
<p>Google nous prend pour des idiots, tout en avouant quâ€™il est idiot. Sauf quâ€™il impose des paramĂ¨tres qui sortent de sa juridiction. Sa pseudo communication est un affront plutĂ´t quâ€™un progrĂ¨s.</p>
<h4>Vaut mieux rire</h4>
<p>Pour finir, observez dans la vidĂ©o suivante, la maniĂ¨re dont Eric Schmidt, CEO de Google, rĂ©pond au journaliste Ă  la questionÂ :Â Â«Â <em>comment je sais que Google enlĂ¨ve le contenu que je souhaiteÂ ?</em> Â». Il rĂ©pond Â«Â <em>parce quâ€™on vous dit quâ€™on le fait</em> Â», puis grand Ă©clat de rire.<br />
En plus, montrez moi comment on enlĂ¨ve une information Ă  mon sujet qui me dĂ©plait. Non seulement il ment, mais en plus il se moque de nous. Ou alors, lui non plus ne sait pas de quoi il parle&#8230;</p>
<p><a href="http://www.youtube.com/v/nkiToS5iPAE" rel="shadowbox[sbpost-378];player=swf;width=640;height=385;" title="eric schmidt, le CEO de Google discute de la protection des donnĂ©es"><img class="alignnone size-medium wp-image-381" title="eric schmidt, le CEO de Google discute de la protection des donnĂ©es" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/eric-schmidt-ceo-google-300x181.png" alt="eric schmidt, le CEO de Google discute de la protection des donnĂ©es" width="300" height="181" /></a></p>
<h4>Avertissement aux incrĂ©dules</h4>
<p>Pour ceux qui ne trouvent rien Ă  redire sur les agissements de Google, nâ€™oubliez pas que cette compagnie est en train de dominer la planĂ¨te. Ne pas laisser faire nâ€™importe quoi est notre devoir. Câ€™est encore plus indispensable quand mes revenus dĂ©pendent directement de ce moteur de recherche. Nous avons trop peu de moyens pour surveiller Google car câ€™est une sociĂ©tĂ© privĂ©e, mais laisser le monde Ă  la merci dâ€™une telle entitĂ© est dangereux.</p>
<p><strong>Note</strong> : je suis dĂ©solĂ© si ce billet est un peu dĂ©sorganisĂ©, mais il est possible dâ€™Ă©crire un Ă©pais livre sur ce sujet. Ayant juste posĂ© mes pensĂ©es en vrac, jâ€™ai beaucoup raccourci Ă  la relecture, mais je nâ€™ai pas trouvĂ© comment mieux lâ€™organiser.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.laurentbourrelly.com/blog/378.php/feed</wfw:commentRss>
		<slash:comments>55</slash:comments>
		</item>
	</channel>
</rss>

