<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Laurent Bourrelly » Matt Cutts</title>
	<atom:link href="http://www.laurentbourrelly.com/blog/tag/matt-cutts/feed" rel="self" type="application/rss+xml" />
	<link>http://www.laurentbourrelly.com/blog</link>
	<description>SEO ROCKSTAR</description>
	<lastBuildDate>Wed, 01 Feb 2012 10:02:22 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Le Google Panda transformĂ© en Godzilla</title>
		<link>http://www.laurentbourrelly.com/blog/934.php</link>
		<comments>http://www.laurentbourrelly.com/blog/934.php#comments</comments>
		<pubDate>Thu, 14 Apr 2011 18:29:20 +0000</pubDate>
		<dc:creator>Laurent</dc:creator>
				<category><![CDATA[RĂ©fĂ©rencement]]></category>
		<category><![CDATA[Demand Media]]></category>
		<category><![CDATA[ferme de contenu]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Matt Cutts]]></category>
		<category><![CDATA[update Panda]]></category>

		<guid isPermaLink="false">http://www.laurentbourrelly.com/blog/?p=934</guid>
		<description><![CDATA[Le dernier update dâ€™algorithme Google est au centre des discussions en ce moment.Â SurnommĂ©e &#171;&#160;Panda&#160;&#187; ou &#171;&#160;Farmerâ€™s update&#160;&#187;, cette mise-Ă -jour est censĂ©e cibler les sites de mauvaise Â«Â qualitĂ©Â Â». Maintenant, la seule question que je pose se rapporte Ă  la notion de qualitĂ© pour un site Web. Câ€™est dĂ©jĂ  impossible de rassembler un consensus autour de cette [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2011/04/google_panda.jpg" rel="shadowbox[sbpost-934];player=img;"><img class="size-thumbnail wp-image-935 alignleft" style="margin-top: 0px; margin-bottom: 0px; margin-left: 10px; margin-right: 10px;" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2011/04/google_panda-150x150.jpg" alt="L'update d'algorithme Panda par Google" width="120" height="120" /></a></p>
<p>Le dernier update dâ€™algorithme Google est au centre des discussions en ce moment.Â SurnommĂ©e &laquo;&nbsp;Panda&nbsp;&raquo; ou &laquo;&nbsp;Farmerâ€™s update&nbsp;&raquo;, cette mise-Ă -jour est censĂ©e cibler les sites de mauvaise Â«Â qualitĂ©Â Â».</p>
<p>Maintenant, la seule question que je pose se rapporte Ă  la notion de qualitĂ© pour un site Web. Câ€™est dĂ©jĂ  impossible de rassembler un consensus autour de cette notion pour des humains, alors un algorithme peut-il vraiment juger de la qualitĂ© pour un site WebÂ ?<span id="more-934"></span></p>
<h1>Lâ€™update qui vient du buzz</h1>
<p>Tout a commencĂ© fin 2009 avec des articles sur <a href="http://www.wired.com/magazine/2009/10/ff_demandmedia/all/1">Wired</a> , suivis par le New York Times et bien dâ€™autres pour dĂ©nonĂ§er le modĂ¨le Ă©conomique de <a href="http://www.demandmedia.com/">Demand Media</a>, Ă©diteur amĂ©ricain sites Web qualifiĂ©s de fermes Ă  contenu dont la plus connue est eHow.com. Plus prĂ¨s de nous, il y a lâ€™italien <a href="http://www.populis.com/">Populis</a>, qui dĂ©pote des dizaines de milliers de pages chaque mois, revendiquant un chiffre dâ€™affaires de 58 millions dâ€™euros pour 2010. Ces sites ciblent les demandes des internautes, par le biais de tutoriels basiques et articles informatifs, pour ensuite racoler vers des publicitĂ©s. Les articles sont lâ€™Ĺ“uvre de rĂ©dacteurs payĂ©s une misĂ¨re â€“ genre 5$ la page plus 25% des revenus issus des clics publicitaires. Un exemple parmi tant dâ€™autres avec la page dâ€™eHow qui cible toutes les co-occurrences imaginables autour de la <a href="http://www.ehow.com/apply-card-credit-online/">demande en ligne pour une carte de crĂ©dit</a>.</p>
<p>Tout sâ€™est accĂ©lĂ©rĂ© cet Ă©tĂ© avec lâ€™annonce de lâ€™entrĂ©e en Bourse pour Demand Media. Cela donnait une vision des possibilitĂ©s de revenus en glanant une manne de trafic gratuite par le biais des rĂ©sultats de recherche Google.Â  Bien entendu, Ă§a peut choquer nâ€™importe quel entrepreneur qui trime pour faire tourner sa boutique. Du cĂ´tĂ© des journalistes libĂ©raux et autres blogueurs donneurs de leĂ§ons, câ€™est carrĂ©ment outrageant. Quelle honte de publier du contenu basique qui rĂ©colte du trafic gratuit, pour ensuite gagner des millions de dollars via les pubsÂ !</p>
<p>Maintenant que Larry Page reprend le poste de CEO Ă  Eric Schmidt, tout ce bruit autour des fermes de contenu commenĂ§ait Ă  sĂ©rieusement faire tĂ˘che. Dâ€™autant plus quâ€™un petit moteur alternatif du nom de <a href="http://www.laurentbourrelly.com/blog/888.php">Blekko</a> en a rajoutĂ© une couche sur laÂ  Â«Â pollutionÂ Â» des rĂ©sultats de recherche Google.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2011/04/google-godzilla.jpg" rel="shadowbox[sbpost-934];player=img;"><img class="alignleft size-medium wp-image-936" style="margin-top: 0px; margin-bottom: 0px; margin-left: 10px; margin-right: 10px;" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2011/04/google-godzilla-300x225.jpg" alt="Le Panda de Google s'est mĂ©tamorphosĂ© en Godzilla" width="270" height="203" /></a>Câ€™est ainsi que lâ€™Ă©quipe du Search sâ€™est attelĂ© Ă  dĂ©zinguer les sites clamĂ©s comme Ă©tant de mauvaise qualitĂ©. En premier, les scrapers sont ciblĂ©s par un update plus ou moins boiteux, puis les fermes de contenu sont traĂ®nĂ©es sur lâ€™Ă©chafaud. Aujourdâ€™hui, le Panda est lĂ˘chĂ© dans lâ€™index tel Godzilla dans la ville de Tokyo, Ă©liminant sans sommation des sites qui ont eu le culot dâ€™utiliser les rĂ©sultats de recherche Google comme racoleur pour gagner de lâ€™argent.</p>
<p>Je ne me fais pas trop de soucis pour les Black Hat SEO qui vont certainement rĂ©ussir Ă  Ă©lever suffisamment le niveau des techniques de scraping, spinning et autre manipulation du contenu. Ce qui mâ€™inquiĂ¨te beaucoup plus concerne les critĂ¨res jaugeant de la sacro-sainte qualitĂ© dâ€™un contenu ou dâ€™un site Web de maniĂ¨re gĂ©nĂ©rale. Selon les sources, Ă§a serait en 10 et 40% de sites qui sont touchĂ©s par le Panda vengeur.</p>
<h3>Comment jauger la qualitĂ©Â ?</h3>
<p>Dâ€™aprĂ¨s les premiers retours, les signaux qui permettent de jauger la qualitĂ© dâ€™un site nâ€™ont pas grand-chose Ă  voir avec le niveau Ă©ditorial. Dâ€™ailleurs, comment juger de la qualitĂ© dâ€™un contenuÂ ? Un algorithme pourrait-il dĂ©cider si un texte est au niveau du prix Pulitzer ou GoncourtÂ ? Pourtant, câ€™est bien le contenu roi qui est mis sur la balance.</p>
<p>En plus, si on voulait vraiment dĂ©gager le contenu qui nâ€™est pas digne de figurer au PanthĂ©on Ă©ditorial, il ne resterait pas tripette en ligne.</p>
<p>Dans un certain sens, un tutoriel sur eHow nâ€™a rien Ă  envier Ă  un billet de blog ou Ă  une actualitĂ© Â«Â AFP RewritingÂ Â». Les ayatollah du contenu peuvent bien expliquer dans tous les sens quâ€™un article sur une ferme de contenu nâ€™est pas Â«Â qualitatifÂ Â», il nâ€™en demeure pas moins que sur le plan sĂ©mantique, contenu dupliquĂ©, etc. les publications sont tout Ă  fait valables.</p>
<p>MĂŞme si je nâ€™approuve pas forcĂ©ment le concept des fermes de contenu, je ne vois pas en quoi elles nâ€™ont pas leurs places dans les rĂ©sultats de recherche Google. Puis, qui va rĂ©pondre aux questions triviales qui fleurissaient sur les pages dâ€™eHow, About et compagnieÂ ? Pour extrapoler, la ferme de contenu remplit un rĂ´le social. Sinon, qui dâ€™autre pour savoir comment nouer des lacets ou demander une carte de crĂ©dit en ligneÂ ? MĂŞme Wikipedia contient des pages qui ne sont mĂŞme pas au niveau de eHow et pourtant lâ€™encyclopĂ©die demeure au firmament des rĂ©sultats de recherche. Ah oui, câ€™est vrai quâ€™il nâ€™y a pas de publicitĂ©s sur Wikipediaâ€¦</p>
<p>Câ€™est encore pire pour Yahoo Answers ou dâ€™autres, dont la ligne Ă©ditoriale est plus mince quâ€™un papyrus.</p>
<p>Bien sĂ»r, dans un monde parfait, Google ne serait pas le Grand Ordonnateur du Web et personne ne trĂ©mousserait Ă  lâ€™annonce dâ€™un update.</p>
<p>Sauf que nous ne vivons pas dans un monde parfait et encore moins dans un Web idĂ©al.</p>
<p>Les signaux techniques qui permettent dâ€™identifier un site soi-disant de mauvaise qualitĂ© suggĂ¨rent de grandes possibilitĂ©s pour engendrer des dommages collatĂ©raux.</p>
<p>Le premier signal qui me dĂ©range concerne les publicitĂ©s. Il paraĂ®t quâ€™un site truffĂ© de pubs est de mauvaise qualitĂ©, mais on en revient toujours Ă  ce mĂŞme tabou stupide qui veut que Ă§a soit malsain de gagner du fric sur Internet. Dâ€™autres signaux me laissent encore plus dubitatif comme le taux de rebond Ă©levĂ©, la suroptimisation Â«Â on pageÂ Â», pas de noms dâ€™auteurs, maillage interne renforcĂ©, faible participation des internautes, etc. Bref, pleins dâ€™Ă©lĂ©ments qui nâ€™ont absolument rien Ă  voir avec les critĂ¨res qualitatifs purs.</p>
<p>Plus dâ€™infos sur le dossier spĂ©cial <a href="http://www.webrankinfo.com/dossiers/techniques/detection-fermes-contenu">DĂ©tection des Fermes de Contenu</a> par Olivier Duffez.</p>
<p>Demand Media et dâ€™autres Ă©diteurs dĂ©vergondĂ©s ont vu plonger le trafic Google, mais le petit webmaster malin qui se rĂ©galait des miettes picorĂ©es avec des MFA se retrouve Ă©galement sur la sellette. Ne parlons mĂŞme pas des agrĂ©gateurs, comparateurs et autres sites au contenu unique maigre qui sont dĂ©stabilisĂ©s. Pourtant, il est tout Ă  fait possible de gĂ©nĂ©rer du contenu dupliquĂ© trĂ¨s intĂ©ressant. La qualitĂ© nâ€™est pas forcĂ©ment synonyme de contenu unique.</p>
<h3>Profiteur, mais pas tricheur</h3>
<p>Jâ€™aurais pu faire un billet technique sur lâ€™analyse automatique de contenu, mais le coup de gueule est remontĂ© avant le reste.</p>
<p>Cela dit, le point principal Ă  relever concerne la difficultĂ© pour un algorithme pour dĂ©tecter et trier les sentiments ou mĂŞme remarquer des tendances. A lâ€™Ă©chelle dâ€™un moteur de recherche comme Google, les algorithmes sont sophistiquĂ©s et stupides Ă  la fois. Dans tous les cas, le moteur ne comprend toujours pas ce quâ€™il lit et Ă§a ne risque pas de changer bientĂ´t. La bande Ă  Matt Cutts peut glousser dâ€™avoir effectuĂ© un grand nettoyage dans les rĂ©sultats de recherche, sauf que câ€™est trĂ¨s Ă©loignĂ© du spam ou tout du moins du non respect des guidelines Google. Câ€™est pour cela que Ă§a me dĂ©range vraiment. Les fermes de contenu sont des profiteurs, mais elles ne trichent pas.</p>
<p>AprĂ¨s chaque update, je reĂ§ois une forte augmentation de demandes par des propriĂ©taires de sites Web qui ont brutalement perdu tout leur trafic Google. Nous arrivons toujours Ă  rĂ©tablir la situation, mais une pĂ©nalitĂ©, un filtre ou un blacklistage ne se soignent pas rapidement.</p>
<p>Pour lâ€™instant, câ€™est le calme plat car Panda se dĂ©chaĂ®ne sur les sites anglophones. Le problĂ¨me principal est quâ€™on ne possĂ¨de pas vraiment de visibilitĂ© sur les solutions pour contrer cet update. Jâ€™espĂ¨re quâ€™on y verra plus clair lorsque la torche du mangeur de bambou enflammera le Web francophone, mais la tĂ˘che est ardue lorsquâ€™on est pris dans le Triangle des Bermudes dâ€™un effet de bord ou dommage collatĂ©ral dâ€™update. Le <a href="http://www.google.com/support/forum/p/Webmasters/thread?tid=76830633df82fd8e&amp;hl=en">thread du forum Google Webmaster Central dĂ©diĂ© aux effets de bord du Panda</a> sâ€™allonge comme le nez de Pinocchio au fur est Ă  mesure que les sites, qui pensent nâ€™avoir rien Ă  se reprocher, tombent sur le champ de bataille.</p>
<h4>Le Far West virtuel</h4>
<p>Cette chasse aux Â«Â profiteursÂ Â» qui publient du contenu de Â«Â mauvaise qualitĂ©Â Â»Â  me dĂ©range vraiment. Pour le journaliste du New York Times ou le blogueur geek, le tutoriel pour apprendre Ă  cuire les spaghettis est peut-ĂŞtre de la pollution. Sauf que tout est relatif car ce contenu trouve forcĂ©ment de lâ€™intĂ©rĂŞt quelque part, sinon le modĂ¨le Ă©conomique vantĂ© par les Ă©diteurs ne sera pas valable. Câ€™est toujours le mĂŞme problĂ¨me depuis quâ€™Internet existe et mĂŞme avant lui pour nâ€™importe quel mĂ©dian. En clair, câ€™est pĂŞchĂ© de gagner du fric sur le Web et câ€™est un sacrilĂ¨ge dâ€™abuser du sacro-saint contenu, tout en profitant dâ€™un trafic gratuit.</p>
<p>Fondamentalement, câ€™Ă©tait peut-ĂŞtre un bon concept lorsque jâ€™ai fait mes premiers balbutiements sur Internet au dĂ©but des annĂ©es 90, mais aujourdâ€™hui câ€™est une saloperie dâ€™utopie; voire mĂŞme un raisonnement rĂ©actionnaire qui ne vaut pas mieux que la bouse sortie du cul dâ€™une vache.</p>
<p>La symbolique des fermes de contenu est guillotinĂ©e, entraĂ®nant dans sa chute des wagons de sites qui avaient pour seule prĂ©tention de gagner 3 sous sur le Web. Jâ€™ai bien profitĂ© du Far West virtuel avec Adsense ou lâ€™affiliation, mais je suis rassurĂ© de mâ€™ĂŞtre retirĂ© de ce modĂ¨le Ă©conomique.</p>
<p>La simple vĂ©ritĂ© est que câ€™est pĂŞchĂ© de gagner du fric en ligneÂ !</p>
<p>Ce nâ€™est pas concevable de profiter dâ€™un systĂ¨me simple comme coller des pubs sur des pages de contenu sans prĂ©tention.Â Les mĂŞmes fervents dĂ©nonciateurs du profit malsain des fermes de contenu sont bien entendu dĂ©fenseurs de la libertĂ© dâ€™expression. Il y a juste quand lâ€™argent se colle au milieu que Ă§a pose problĂ¨me.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2011/04/Far-West-virtuel.jpg" rel="shadowbox[sbpost-934];player=img;"><img class="alignleft size-medium wp-image-937" style="margin-top: 0px; margin-bottom: 0px; margin-left: 10px; margin-right: 10px;" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2011/04/Far-West-virtuel-224x300.jpg" alt="Le Far West virtuel ou comment gagner de l'argent sur le Web" width="110" height="147" /></a>Exactement comme au Far West, les premiers Ă  trouver un filon nâ€™ont quâ€™Ă  se baisser pour ramasser les pĂ©pites. Ensuite, il faut creuser plus profond ou partir ailleurs, sur un autre filon. Personnellement, je remercie mon instinct pour faire partie de ceux qui vont voir ailleurs aprĂ¨s avoir bien profitĂ© dâ€™un filon.<br />
AprĂ¨s les premiers chercheurs dâ€™or, câ€™est le tour des grosses sociĂ©tĂ©s de venir exploiter les filons Ă  coups de bulldozers et dynamite pour remplacer la pioche et le tamis.Â Bien entendu, ces grosses compagnies dĂ©gagent les petits chercheurs dâ€™or Ă  coups de Smith et Wesson et expropriation.</p>
<p>Pour terminer, je laisse la parole Ă  notre Texan SEO prĂ©fĂ©rĂ©, qui donne une autre approche sur <a href="http://lemusclereferencement.com/2011/04/14/la-qualite-du-contenu/">la qualitĂ© du contenu</a>.</p>
<p>Merci Ă  Philippe, mon spĂ©cialiste prĂ©fĂ©rĂ© de la <a href="http://www.hiseo.fr/redaction-web/">rĂ©daction Web</a> pour la correction des coquilles.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.laurentbourrelly.com/blog/934.php/feed</wfw:commentRss>
		<slash:comments>84</slash:comments>
		</item>
		<item>
		<title>La recherche dâ€™information sans chercher</title>
		<link>http://www.laurentbourrelly.com/blog/807.php</link>
		<comments>http://www.laurentbourrelly.com/blog/807.php#comments</comments>
		<pubDate>Fri, 23 Jul 2010 09:19:02 +0000</pubDate>
		<dc:creator>Laurent</dc:creator>
				<category><![CDATA[Moteurs de recherche]]></category>
		<category><![CDATA[Ami Singhal]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Matt Cutts]]></category>
		<category><![CDATA[moteur de recherche]]></category>
		<category><![CDATA[Mountain View]]></category>
		<category><![CDATA[recherche d'informatio]]></category>

		<guid isPermaLink="false">http://www.laurentbourrelly.com/blog/?p=807</guid>
		<description><![CDATA[Un dĂ©fi pris trĂ¨s au sĂ©rieux par Google concerne lâ€™acquisition dâ€™information sans avoir Ă  effectuer de recherche. Cette technologie nâ€™est pas encore prĂŞte, mais câ€™est une prĂ©tention quâ€™affiche clairement le moteur de recherche. Encore une fois, entre utilitĂ© de la fonctionnalitĂ© et protection des donnĂ©es, notre cĹ“ur balance. Câ€™est au travers dâ€™une interview trĂ¨s intĂ©ressante [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/07/amit-singhal.jpg" rel="shadowbox[sbpost-807];player=img;"><img class="alignleft size-thumbnail wp-image-808" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/07/amit-singhal-142x150.jpg" alt="Photo de Amit Singhal - chef ingĂ©nieur Google" width="91" height="96" /></a>Un dĂ©fi pris trĂ¨s au sĂ©rieux par Google concerne lâ€™acquisition dâ€™information sans avoir Ă  effectuer de recherche.</p>
<p>Cette technologie nâ€™est pas encore prĂŞte, mais câ€™est une prĂ©tention quâ€™affiche clairement le moteur de recherche. Encore une fois, entre utilitĂ© de la fonctionnalitĂ© et protection des donnĂ©es, notre cĹ“ur balance.<br />
<span id="more-807"></span></p>
<p>Câ€™est au travers dâ€™une <a href="http://www.engadget.com/2010/07/16/googles-amit-singhal-tells-us-about-the-dreams-search-engines-a/">interview</a> trĂ¨s intĂ©ressante de <a href="http://singhal.info/">Amit Singhal</a>, chef ingĂ©nieur de lâ€™algorithme Google, que jâ€™apprends les Ă©volutions prochaines sur lesquelles travaillent les Ă©quipes de Mountain View. Il est toujours important de connaĂ®tre dâ€™autres sons de cloche que ceux du consensuel Matt Cutts. Dâ€™ailleurs, Amit Singhal est beaucoup plus crĂ©dible lorsquâ€™il sâ€™agit de parler dâ€™Ă©volutions dâ€™algorithmes puisque Matt Cutts est cantonnĂ© Ă  la lutte contre le spam.</p>
<p>Les cinq premiers points Ă©voquĂ©s par Amit Singhal ne me surprennent pas : recherche au-delĂ  du texte, recherche au-delĂ  du langage, recherche personnalisĂ©e, recherche en temps rĂ©elle et sĂ©mantique appliquĂ©e Ă  la recherche dâ€™information.</p>
<p>Par contre, je mâ€™arrĂŞte un moment sur le sixiĂ¨me point&#8230;</p>
<h1>La recherche sans chercher</h1>
<p>Le but de lâ€™opĂ©ration consiste Ă  procurer des Ă©lĂ©ments dâ€™information sans avoir Ă  entreprendre des recherches.</p>
<p>Lâ€™exemple pris par Amit explique que vous voulez acheter une batte de cricket (seul un indien pouvait prendre le cricket en exemple) car votre ancienne batte est cassĂ©e et que vous allez avoir une heure de temps libre demain. Votre mobile connaĂ®t votre besoin car il est inscrit dans votre ToDo. Le mobile est Ă©galement au courant de votre agenda. Le reste des informations nĂ©cessaire est aussi maĂ®trisĂ© par le tĂ©lĂ©phone : localisation et autres informations locales. Du coup, le mobile peut vous envoyer une information qui propose un crĂ©neau horaire et un magasin pour acheter la batte et revenir Ă  temps au bureau pour le prochain rendez-vous.</p>
<h3>Bien ou pas ?</h3>
<p>La technologie nous assiste toujours plus. IlÂ  nâ€™y a quâ€™Ă  voir lâ€™App Store dâ€™Apple ou le Android Market de Google. DĂ©sormais, il y a une app quasiment pour tous nos besoins et si Ă§a nâ€™existe pas encore, il est probable quâ€™un dĂ©veloppeur travaille dessus.<br />
Cependant, la vision de Google pousse la technologie vers un domaine encore plus prĂ©cis en proposant des informations en amont de la demande.</p>
<p>Au premier abord, cela peut paraĂ®tre intĂ©ressant. Puis, viennent rapidement les interrogations Ă  propos du respect de la vie privĂ©e et du contrĂ´le.</p>
<p>A mon humble avis, rien nâ€™empĂŞchera Google ou un autre (Apple?) de proposer ce type de fonctionnalitĂ© un jour prochain. Les soucis dĂ©ontologiques seront Ă©crasĂ©s comme ils le sont habituellement, puis nous serons toujours plus profilĂ©s et tracĂ©s.<br />
Tiens, les participants au billet synchronisĂ© sur <a href="http://www.laurentbourrelly.com/blog/531.php">le futur de la recherche dâ€™information</a> n&#8217;avaient pas vu l&#8217;enjeu de la recherche sans chercher.Â  Pour ma part, jâ€™avoue ĂŞtre totalement passĂ© Ă  cĂ´tĂ© de cette vision de lâ€™Ă©volution pour la recherche dâ€™information. Pourtant, Ă§a semble Ă©vident que Google se dirige vers ce type de technologie.</p>
<p>Le choix va vite devenir extrĂŞme : adopter ou repousser la technologie. Lâ€™entre-deux risque dâ€™ĂŞtre de plus en plus difficile.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.laurentbourrelly.com/blog/807.php/feed</wfw:commentRss>
		<slash:comments>29</slash:comments>
		</item>
		<item>
		<title>Les trouvailles de la confĂ©rence SMX East &#8211; octobre 2009</title>
		<link>http://www.laurentbourrelly.com/blog/400.php</link>
		<comments>http://www.laurentbourrelly.com/blog/400.php#comments</comments>
		<pubDate>Tue, 17 Nov 2009 23:21:09 +0000</pubDate>
		<dc:creator>Laurent</dc:creator>
				<category><![CDATA[Moteurs de recherche]]></category>
		<category><![CDATA[301]]></category>
		<category><![CDATA[302]]></category>
		<category><![CDATA[Adam Audette]]></category>
		<category><![CDATA[Bing]]></category>
		<category><![CDATA[confĂ©rence]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[googler]]></category>
		<category><![CDATA[indexation]]></category>
		<category><![CDATA[information]]></category>
		<category><![CDATA[Joachim Kupke]]></category>
		<category><![CDATA[Matt Cutts]]></category>
		<category><![CDATA[moteur de recherche]]></category>
		<category><![CDATA[recherche]]></category>
		<category><![CDATA[redirection]]></category>
		<category><![CDATA[RĂ©fĂ©rencement]]></category>
		<category><![CDATA[SMX]]></category>
		<category><![CDATA[Yahoo]]></category>

		<guid isPermaLink="false">http://www.laurentbourrelly.com/blog/?p=400</guid>
		<description><![CDATA[L&#8217;article suivant est une traduction autorisĂ©e par Adam Audette (@audette) que je remercie pour sa gentillesse et son partage qui nous informe sur quelques Ă©lĂ©ments trĂ¨s intĂ©ressants Ă  propos de l&#8217;indexation sur Google. Les informations suivantes viennent d&#8217;une confĂ©rence de Joachim Kupke, employĂ© chez Google pour la partie indexation du moteur de recherche. Les trĂ©sors [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/seo-confidentiel.jpg" rel="shadowbox[sbpost-400];player=img;" title="seo confidentiel"><img class="alignleft size-thumbnail wp-image-408" style="border: 0pt none; margin: 0px 10px;" title="seo confidentiel" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/seo-confidentiel-150x150.jpg" alt="seo confidentiel" width="135" height="135" align="left" /></a>L&#8217;article suivant est une traduction autorisĂ©e par <a href="http://www.audettemedia.com/" target="_blank">Adam Audette</a> (<a href="http://twitter.com/audette" target="_blank">@audette</a>) que je remercie pour sa gentillesse et son partage qui nous informe sur quelques Ă©lĂ©ments trĂ¨s intĂ©ressants Ă  propos de l&#8217;indexation sur Google.</p>
<p>Les informations suivantes viennent d&#8217;une confĂ©rence de Joachim Kupke, employĂ© chez Google pour la partie indexation du moteur de recherche.<span id="more-400"></span></p>
<h2>Les trĂ©sors distribuĂ©s par Joachim Kupke (Google) lors de la confĂ©rence SMX</h2>
<p>Voici 9 trouvailles sur le rĂ©fĂ©rencement qui ressortent de la confĂ©rence <a href="http://searchmarketingexpo.com/east/2009" target="_blank">SMX East</a> qui sâ€™est dĂ©roulĂ©e Ă  New York en octobre. Globalement, câ€™Ă©tait une confĂ©rence impeccable, mis Ă  part les soucis de Wifi et autres de Javits CenterÂ  le maudit. Danny Sullivan (lâ€™organisateur de la confĂ©rence pour ceux qui vivent sous un rocher) a rĂ©pĂ©tĂ© que Â«Â Javits est pourriÂ Â», Â«Â accusez Javits, ne nous mettez pas Ă§a sur le dosÂ Â». Danny, nous accusons JavitsÂ !</p>
<p>Cette annĂ©e, parmi les absences remarquĂ©es de SMX East, il fallait compter <a href="http://twitter.com/mattcutts" target="_blank">Matt Cutts</a> et <a href="http://twitter.com/nathanbuggia" target="_blank">Nathan Buggia</a>, mais câ€™Ă©tait un plaisir dâ€™Ă©couter des googlers moins connus (Maile Ohye) et des intervenants de Microsoft/Bing (Sasi Parthasarathy).</p>
<p>En tant que rĂ©fĂ©renceur, je suis particuliĂ¨rement intĂ©ressĂ© par ce que les moteurs de recherche vont dire au sujet de paramĂ¨tres techniques spĂ©cifiques comme lâ€™indexation, le contenu dupliquĂ©, le crawl et les redirections. Cette confĂ©rence proposait quelques sessions extraordinaires oĂą un grand nombre dâ€™informations Ă©taient au centre des dĂ©bats.</p>
<p>Il y avait aussi quelques surprises (voir ci-dessous) et une paire de nouveautĂ©s, mais en gĂ©nĂ©ral lâ€™information partagĂ©e par Joachim et les autres reprĂ©sentants des moteurs de recherche portait sur des Ă©lĂ©ments spĂ©cifiques qui pourraient paraĂ®tre obscurs Ă  quiconque en dehors du cercle des Â«Â initiĂ©sÂ Â» du rĂ©fĂ©rencement. Jâ€™adore vraiment tous ces trucs dâ€™initiĂ©sÂ !</p>
<p>Allons-y pour les 9 trouvailles utiles pour le rĂ©fĂ©rencement qui sont extraites de la contribution de Joachim Kupke lors de SMX East</p>
<p><strong>PrĂ©sentation de Joachim Kupke sur le contenu dupliquĂ©</strong></p>
<p style="text-align: center;"><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/google-content-duplique.png" rel="shadowbox[sbpost-400];player=img;" title="Google et le contenu dupliquĂ©"><img class="size-full wp-image-401 aligncenter" title="Google et le contenu dupliquĂ©" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/google-content-duplique.png" alt="google-content-duplique" width="302" height="74" /></a></p>
<p>Joachim fait partie de lâ€™Ă©quipe qui sâ€™occupe de lâ€™indexation chez Google. Il a partagĂ© des bribes dâ€™informations assez primordiales au sujet de la gestion du contenu dupliquĂ© par Google. Joachim a Ă©galement partagĂ© quelques vues depuis lâ€™intĂ©rieur du moteur et sa faĂ§on de voir le Web et indexer les URLs. Voici les points essentiels que jâ€™ai retenus.</p>
<h3>1. Impressions et Clics</h3>
<p>Joachim a rĂ©pĂ©tĂ© les termes Â«Â impressionsÂ Â» et Â«Â clicsÂ Â» dans le contexte dâ€™une URL incluse dans lâ€™index de Google. Il a mentionnĂ© quâ€™une URL qui reĂ§oit peu ou pas dâ€™impressions sera plausiblement plus longue Ă  mettre Ă  jour dans lâ€™index (pas de surprise jusque lĂ ). Cependant, une URL recevant un grand nombre dâ€™impressions et clics (ou provenant de domaines importants et crawlĂ©s frĂ©quemment) sera mise Ă  jour rapidement. Câ€™est logique et connu de tous, mais il Ă©tait intĂ©ressant dâ€™avoir une confirmation sortie de la bouche dâ€™un ingĂ©nieur de chez Google. Ainsi, ces redirections 301 et tags noindex sur certaines pages qui ne sont pas crawlĂ©s Ă  nouveau et mis Ă  jour viennent dĂ©finitivement du fait quâ€™elles ne figurent pas sur la liste prioritaire du moteur de recherche (encore une raison pour laquelle <a href="http://www.seobook.com/google-branding" target="_blank">les grandes marques lâ€™ont facile en rĂ©fĂ©rencement</a>)</p>
<h3>2. Infrastructure de gestion du contenu dupliquĂ©</h3>
<p>Google est censĂ© avoir Â«Â une tonne dâ€™infrastructure pour Ă©liminer le contenu dupliquĂ©Â Â», parmi laquelle il faut citerÂ :</p>
<ul>
<li>Redirection</li>
<li>DĂ©tection de structure rĂ©currente dâ€™URLs</li>
<li>Le contenu de la page</li>
<li>Le tag de lien canonical (si tout le reste Ă©choue)</li>
</ul>
<p>A noter que Google reconnaĂ®t les structures des URLS, Ă©liminant certains paramĂ¨tres comme cause de duplication (bien sĂ»r, ils ont Ă©galement parlĂ© de <a href="http://googlewebmastercentral.blogspot.com/2009/10/reunifying-duplicate-content-on-your.html" target="_blank">lâ€™outil dâ€™Ă©limination de paramĂ¨tre dans les Outils Webmaster Google</a>).</p>
<p>Que veux-tu dire par Â«Â le contenu de la pageÂ Â»Â ? Ceci Ă©tant la partie la plus intĂ©ressante selon moi, voici la suiteâ€¦</p>
<h3>3. Enregistrement de lâ€™historique des URLs</h3>
<p>Google garde une sorte de archive.org du Web avec des versions plus anciennes du contenu (pas exactement comme cela, mais vous voyez ce que je veux direÂ : un enregistrement de lâ€™historique des pages Web). Cela permet de comparer la version fraichement crawlĂ©e avec une version plus ancienne. Le contenu qui change peut ĂŞtre soustrait des Ă©lĂ©ments qui restent invariables au sein du site. Cela peut Ă©galement donner Ă  Google la facultĂ© de sâ€™assurer que les Ă©lĂ©ments globaux, zones et morceaux de contenu apparaissent Ă  lâ€™intĂ©rieur dâ€™un site sĂ©parĂ©ment du contenu dĂ©finitivement unique et mis Ă  jour.</p>
<h3>4 . Google + rel=canonical = Amour</h3>
<p>Google adore le tag Â«Â canonicalÂ Â» des liens. Selon Joachim, câ€™est une grande rĂ©ussite qui a vu un rythme de dĂ©ploiement exponentiel sur Internet. Chez Google, on traite ce tag avec le plus grand sĂ©rieux, en suggĂ©rant son importance comme <a href="http://www.seomoz.org/blog/whiteboard-friday-interview-with-googles-maile-ohye" target="_blank">Maile Ohye</a> nous a expliquĂ© Ă  lâ€™occasion de <a href="http://searchmarketingexpo.com/advanced/2009/full_agenda#222" target="_blank">SMX Advanced en juin</a>.Â  Lâ€™intĂ©rĂŞt de ce paramĂ¨tre est donc renforcĂ© par les propos de Maile et Joachim. Cela engendre un Â«Â Ă©norme impactÂ Â» Ă  propos des dĂ©cisions de Google sur la canonicalisationÂ : 2 fois sur 3, rel=canonical altĂ¨re la dĂ©cision organique. Câ€™est assez Ă©norme comme chiffreÂ !</p>
<h3>5. Les 302 suffisent comme cibles canoniques</h3>
<p>Les redirections font des cibles canoniques correctes. Ce paramĂ¨tre a Ă©tĂ© expliquĂ© par Joachim Ă  deux reprises. Cela comporte deux partiesÂ :</p>
<ul>
<li>A cause dâ€™une mĂ©thode interne pour gĂ©rer les slashs de fermeture des URLs, Google avait besoin (et recommande Ă  tous les dĂ©veloppeurs dâ€™agir de la sorte) dâ€™un slash de fermeture sur les cibles canoniques et les liens internes. Sans le slash de fermeture, Google va ajouter un slash et mettre Ă  jour lâ€™URL dans lâ€™index.<br />
Maintenant, jâ€™ai trouvĂ© de multiples exemples de pages oĂą cela ne se dĂ©roule pas de la sorte, mais Joachim Ă©tait assez ferme sur le fait que câ€™est un problĂ¨me du Web en gĂ©nĂ©ral que Google est obligĂ© de contourner.</li>
</ul>
<ul>
<li>La trouvaille en la matiĂ¨re est que vous devriez toujours ajouter un slash de fermeture Ă  lâ€™URL absolue de la cible canonique. Sans le faire, Google va lâ€™ajouter automatiquement, mais en anticipant cette action, vous allez certainement accĂ©lĂ©rer la vitesse de rĂ©ponse du serveur (qui aurait un impact pour les sites de taille importante).</li>
</ul>
<h3>6. Comment les cibles canoniques en 302 peuvent ĂŞtre dĂ©tournĂ©es</h3>
<p>Les redirections 302 sont donc des cibles canoniques adĂ©quates. Oui je sais que je me rĂ©pĂ¨teÂ ! Voici la partie intĂ©ressante pour le rĂ©fĂ©rencementÂ : si les 302 sont OK Ă  utiliser dans ce cadre, je pense Ă  une mĂ©thode pour utiliser le tag Â«Â canonicalÂ Â» du lien Ă  des fins dâ€™optimisation du rĂ©fĂ©rencement sans avoir Ă  amĂ©liorer Ă©normĂ©ment la structure de lâ€™URL. Comment celaÂ ? Voici un exemple thĂ©oriqueÂ :</p>
<p>Prenons, un site qui prĂ©sente une structure dâ€™URL Ă  amĂ©liorer (voir <a href="http://www.cabelas.com/" target="_blank">cet exemple</a> ) pour le rĂ©fĂ©rencement et des raisons dâ€™usabilitĂ© Ă©videntes. Cependant, les dĂ©veloppeurs sont dans le jus, la plateforme technique est branlante, il nâ€™y a pas assez dâ€™argent pour un budget rĂ©fĂ©rencement de qualitĂ©, ou simplement les modifications ne valent peut-ĂŞtre pas la peine.</p>
<p>Un rĂ©fĂ©renceur arrive avec la proposition suivanteÂ :</p>
<ol>
<li>CrĂ©er un tableau avec une version optimisĂ©e pour le rĂ©fĂ©rencement de chaque URL Ă  amĂ©liorer.</li>
<li>Ajouter ces URLs amies des moteurs dans le code source avec le tag Â«Â rel=canonicalÂ Â»</li>
<li>Effectuer une redirection 302 depuis les URLs canoniques vers les URLs dĂ©gueulasses existantes sur le site.</li>
<li>Bingo! Des jolies URLs au sein des rĂ©sultats de recherche</li>
</ol>
<p>Le tag Â«Â canonicalÂ Â» agit comme une redirection 301 et met Ă  jour les indicateurs dans les rĂ©sultats de recherche (comme câ€™est le cas). Puis la cible canonique redirige vers une 302 qui ne force pas la mise Ă  jour (comme câ€™est le cas). Alors la jolie (et pseudo) URL dans le lien cible canonique va rester comme indicateur dans les rĂ©sultats de recherche, pendant que la non-pseudo URL bien dĂ©goutante va agir en tant que page temporaire aux yeux des moteurs. PigĂ©Â ? Avouez que câ€™est intĂ©ressant (voir le graphique basique ci-dessous pour un visuel de ce concept).</p>
<p style="text-align: center;"><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/rel-canonical1.png" rel="shadowbox[sbpost-400];player=img;" title="rel-canonical"><img class="aligncenter size-medium wp-image-403" title="rel-canonical" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/rel-canonical1-300x200.png" alt="rel=canonical" width="300" height="200" /></a></p>
<p>Non, je nâ€™ai pas planifiĂ© de mettre en Ĺ“uvre ceci incessamment sous peu, mais je connais au moins un site majeur dâ€™e-commerce qui agit de la sorte (certainement de maniĂ¨re involontaire) et Ă§a fonctionne parfaitement depuis le mois de juin.</p>
<h3>7. Ne pas interdire votre contenu dupliquĂ© (Â ?)</h3>
<p>Google dit Â«Â sâ€™il vous plait, nâ€™utilisez pas la directive Â«Â DisallowÂ :Â Â» dans le Robots.txt afin dâ€™Ă©radiquer le contenu dupliquĂ©Â Â». Le contenu qui nâ€™est pas disponible pour Google ne peut donc pas ĂŞtre visitĂ© et le moteur de recherche nâ€™aime pas du tout cela. La prĂ©fĂ©rence semble aller vers Â«Â mettez tout en ligneÂ Â» et laissez nous dĂ©cider ce quâ€™il y a de mieux Ă  faire. Chaque fois quâ€™un contenu nâ€™est pas disponible au crawl, les moteurs perdent la facultĂ© de faire ce choix dĂ©cisionnaire.</p>
<p>Ma prĂ©fĂ©rence personnelle est de garder le contrĂ´le complet, mais je comprends Ă©galement leur raisonnement et la raison qui pousse Ă  promouvoir cette mĂ©thode.</p>
<h3>8. Lâ€™indexation peut prendre longtemps pour des URLs Â«Â impopulairesÂ Â»</h3>
<p>Joachim a expliquĂ© quâ€™indexer peut prendre du temps (comme mentionnĂ© prĂ©cĂ©demment), mais câ€™est encore plus vrai pour des URLs obscures et peu populaires. Il faut savoir que la phase dâ€™indexation prend du temps, mais que le nettoyage des parties existantes de lâ€™index prend encore plus de temps. Bien entendu, il existe <a href="http://sebastians-pamphlets.com/pubsubhubbub-googlebot-invitations/" target="_blank">des maniĂ¨res dâ€™initier le crawl de Google</a> (phase sĂ©parĂ©e de la mise Ă  jour dans lâ€™index), mais il est indĂ©niable que les sites moins connus ne reĂ§oivent pas la mĂŞme attention que les bons gros sites populaires.</p>
<h3>9. Support du lien canonique au travers de diffĂ©rents domaines</h3>
<p>Google va bientĂ´t accepter le tag Â«Â canonicalÂ Â» sur diffĂ©rents noms de domaine. Câ€™est une grande nouvelleÂ ! YahooÂ ! et Bing ont annoncĂ© quâ€™ils travaillent sur la base qui est de comprendre rel=canonical.</p>
<p><strong>Les autres trucs supers Ă  SMX East</strong></p>
<p>Il y avait Ă©normĂ©ment dâ€™autres sessions extraordinaires comme <a href="http://www.getlisted.org/" target="_blank">David Mihm</a>, <a href="http://www.searchinfluence.com/" target="_blank">Will Scott</a>, <a href="http://www.localseoguide.com/" target="_blank">Andrew Shotland</a>, <a href="http://blumenthals.com/blog/" target="_blank">Mike Blumenthal</a> et <a href="http://www.marybowling.com/" target="_blank">Mary Bowling</a> qui ont traitĂ© des paramĂ¨tres locaux liĂ©s au rĂ©fĂ©rencement. La rĂ©gionalisation est un secteur vraiment excitant en ce moment pour les rĂ©fĂ©renceurs. Cette Ă©quipe a proposĂ© une session vraiment gĂ©niale. Tout cela mâ€™a tellement motivĂ© que je suis revenu avec lâ€™intention de creuser encore plus au niveau Â«Â localÂ Â».</p>
<p><a href="http://www.audettemedia.com/blog/9-seo-takeaways-smx-east/">Article original</a> (en anglais)</p>
<p>Remerciements : <a href="http://www.taggle.org/">Taggle</a> &amp; <a href="http://www.altiref.com/">Altiref</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.laurentbourrelly.com/blog/400.php/feed</wfw:commentRss>
		<slash:comments>40</slash:comments>
		</item>
		<item>
		<title>Faut-il avoir peur de la mise Ă  jour Google CafĂ©ine ?</title>
		<link>http://www.laurentbourrelly.com/blog/387.php</link>
		<comments>http://www.laurentbourrelly.com/blog/387.php#comments</comments>
		<pubDate>Sat, 14 Nov 2009 21:49:22 +0000</pubDate>
		<dc:creator>Laurent</dc:creator>
				<category><![CDATA[Moteurs de recherche]]></category>
		<category><![CDATA[algorithme]]></category>
		<category><![CDATA[DataCenter]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Google CafĂ©ine]]></category>
		<category><![CDATA[Google Caffeine]]></category>
		<category><![CDATA[indexation]]></category>
		<category><![CDATA[Internet]]></category>
		<category><![CDATA[Mashable]]></category>
		<category><![CDATA[Matt Cutts]]></category>
		<category><![CDATA[moteur de recherche]]></category>
		<category><![CDATA[mythe]]></category>
		<category><![CDATA[page Web]]></category>
		<category><![CDATA[pĂ©nalitĂ©]]></category>
		<category><![CDATA[RĂ©fĂ©rencement]]></category>
		<category><![CDATA[rĂ©sultat de recheche]]></category>
		<category><![CDATA[rumeur]]></category>
		<category><![CDATA[SearchEngineLand]]></category>
		<category><![CDATA[secret]]></category>
		<category><![CDATA[web]]></category>

		<guid isPermaLink="false">http://www.laurentbourrelly.com/blog/?p=387</guid>
		<description><![CDATA[Les stigmates des bouleversements causĂ©s par certaines mises Ă  jour Google, telles que Florida en 2003 restent gravĂ©s dans la mĂ©moire collective du rĂ©fĂ©rencement. Lâ€™annonce dâ€™une mise Ă  jour surnommĂ©e CafĂ©ine (Caffeine en anglais) provoque des remous plus ou moins justifiĂ©s, au travers de ceux qui s&#8217;intĂ©ressent Ă  Google et au rĂ©fĂ©rencement de site Internet. [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/google-cafeine.png" rel="shadowbox[sbpost-387];player=img;" title="La mise Ă  jour de Google Cafeine"><img class="alignleft size-thumbnail wp-image-388" style="border: 0pt none; margin: 0px 10px;" title="La mise Ă  jour de Google Cafeine" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/google-cafeine-150x150.png" alt="La mise Ă  jour de Google Cafeine" width="135" height="135" align="left" /></a>Les stigmates des bouleversements causĂ©s par certaines mises Ă  jour Google, telles que Florida en 2003 restent gravĂ©s dans la mĂ©moire collective du rĂ©fĂ©rencement.</p>
<p>Lâ€™annonce dâ€™une mise Ă  jour surnommĂ©e CafĂ©ine (Caffeine en anglais) provoque des remous plus ou moins justifiĂ©s, au travers de ceux qui s&#8217;intĂ©ressent Ă  Google et au rĂ©fĂ©rencement de site Internet.<span id="more-387"></span></p>
<p>Faut-il que ceux, qui possĂ¨dent des sites positionnĂ©s convenablement parmi les rĂ©sultats de recherche Google,Â  redoutent la mise Ă  jour CafĂ©ine?</p>
<p>Comme dâ€™habitude, les pseudo analyses, suppositions et autres interprĂ©tations fleurissent au travers des blogs et forums Ă  propos de la mise Ă  jour CafĂ©ine. Câ€™est comme cela que naissent les mythes du rĂ©fĂ©rencement, habilement alimentĂ©s par Google causĂ© par un manque de transparence rĂ©curent.</p>
<h1>Qu&#8217;est ce que Google CafĂ©ine?</h1>
<p>Il Ă©tait Ă©vident que certains allaient sortir des thĂ©ories alimentant la pompe Ă  <a href="http://www.laurentbourrelly.com/blog/369.php" target="_blank">mythes et secrets du rĂ©fĂ©rencement</a>.<br />
En guise d&#8217;avertissement, nous avons reĂ§u une <a href="http://googlewebmastercentral.blogspot.com/2009/08/help-test-some-next-generation.html" target="_blank">annonce</a> officielle de Google, plusieurs interviews de Matt Cutts, ainsi qu&#8217;un <a href="http://www.mattcutts.com/blog/google-caffeine-update/" target="_blank">post</a> sur son blog se voulant rassurant. Sur le Web, la discussion est bien lancĂ©e sur <a href="http://blogsearch.google.com/blogsearch?q=google+caffeine" target="_blank">blogs</a>, <a href="http://www.webmasterworld.com/google/3999055.htm" target="_blank">forums</a>, <a href="http://search.twitter.com/search?q=google+caffeine" target="_blank">Twitter</a>, etc.<br />
Une <a href="http://www2.sandbox.google.com/" target="_blank">URL</a> mettait Ă  disposition lâ€™accĂ¨s Ă  un aperĂ§u de l&#8217;index Google CafĂ©ine. Cet accĂ¨s est fermĂ© depuis le 10 novembre 2009.</p>
<h4>Interview de Matt Cutts Ă  propos de Google Caffeine</h4>
<p><a href="http://www.youtube.com/v/NU5cKDryjy0" rel="shadowbox[sbpost-387];player=swf;width=640;height=385;" title="Interview de Matt Cutts parlant de Google CafĂ©ine"><img class="alignnone size-medium wp-image-389" title="Interview de Matt Cutts parlant de Google CafĂ©ine" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/Matt-Cutts-Google-Caffeine-300x193.png" alt="Interview de Matt Cutts parlant de Google CafĂ©ine" width="300" height="193" /></a></p>
<h2>Propagation de la rumeur et mise en route dâ€™un mythe</h2>
<p>Au dĂ©part, <a href="http://mashable.com/2009/08/10/google-caffeine/" target="_blank">Mashable</a> sort une analyse que je qualifie de tout Ă  fait superficielle. Le point subjectif concerne une soi-disant pondĂ©ration supĂ©rieure des mots clĂ©s sur Google CafĂ©ine.</p>
<p>Un blogueur franĂ§ais orientĂ© rĂ©fĂ©rencementÂ  <a href="http://bababillgates.free.fr/index.php/googe-caffeine-a-t-il-un-impact-sur-le-seo-et-le-referencement/" target="_blank">reprend</a> la teneur de lâ€™analyse Mashable Ă  son propre compte (sans citer la source dâ€™origine qui l&#8217;a inspirĂ©) et dâ€™<a href="http://www.global-referencement.fr/SEO/google/tests-sur-impact-google-caffeine-seo.html" target="_blank">autres</a> vont citer ce billet sur leurs <a href="http://www.concepteur-redacteur-blog.com/2009/11/12/rank-tracker-google-caffeine/" target="_blank">blogs</a>, <a href="http://topsy.com/tb/bababillgates.free.fr/index.php/googe-caffeine-a-t-il-un-impact-sur-le-seo-et-le-referencement/" target="_blank">Twitter</a> et autres sources de partage de contenu. MĂŞme le <a href="http://www.journaldunet.com/solutions/moteur-referencement/selection/caffeine-le-futur-moteur-de-recherche-de-google/des-changements-en-perspective.shtml" target="_blank">Journal du Net</a> met les pieds dans le plat sans savoir de quoi il s&#8217;agit vĂ©ritablement.</p>
<p>Le pire de tous est <a href="http://ezinearticles.com/?Learn-How-Google-Caffeine-Will-Affect-Your-Website!&amp;id=2777909" target="_blank">celui lĂ </a> qui part dans un dĂ©lire total, voulant sciemment propager une peur parmi ses lecteurs.</p>
<h3>Ce qu&#8217;il faut retenir Ă  propos de Google CafĂ©ine</h3>
<p>Google CafĂ©ine est un nouvel index hĂ©bergĂ© par une nouvelle infrastructure qui repose sur le Google File System V. 2., dont la structure nous est <a href="http://www.webrankinfo.com/actualites/200411-infrastructure-google.htm" target="_blank">connue</a> depuis 2004.Â  La V.2 conĂ§oit une Ă©volution majeure du Google File System, permettant d&#8217;amĂ©liorer l&#8217;indexation et la gestion des donnĂ©es.</p>
<p><strong>Cela entraineÂ principalement:</strong></p>
<ul>
<li>Une amĂ©lioration de vitesse dâ€™indexation</li>
<li>Une plus grande fiabilitĂ© sur les rĂ©sultats de recherche</li>
<li>Des moyens dĂ©cuplĂ©s en interne pour le travail des ingĂ©nieurs Google</li>
</ul>
<p>Les observateurs du rĂ©fĂ©rencement ont tellement envie de croire que cette mise Ă  jour va provoquer des remous quâ€™ils brouillent plus ou moins volontairement la comprĂ©hension gĂ©nĂ©rale. MalgrĂ© les efforts Ă©vidents de l&#8217;inusable Matt Cutts pour signifier qu&#8217;il s&#8217;agit d&#8217;une Ă©volution d&#8217;infrastructure, certains font l&#8217;amalgame entre index et algorithme.<br />
Bien entendu, la communication Google n&#8217;Ă©tant pas limpide, tout le monde peut croire qu&#8217;il rĂ©side un piĂ¨ge au tournant. Sans doute que l&#8217;annonce du recul de dĂ©ploiement global aprĂ¨s les fĂŞtes Ă©voque les remous de Florida au sein de l&#8217;imaginaire collectif.</p>
<p>Encore une fois, Google CafĂ©ine permet Ă  Google de reposer sur une infrastructure plus performante, avec lâ€™algorithme nâ€™Ă©tant pas la principale cible de cette mise Ă  jour. Ainsi, le plus gros changement que nous allons observer concerne lâ€™index qui sera rafraĂ®chi.</p>
<h3>Et l&#8217;algorithme dans tout Ă§a ?</h3>
<p>Le principe de fonctionnement de Google est un algorithme par couches. Il existe une formule de base sur laquelle sont posĂ©s des filtres qui concernent des paramĂ¨tres en particulier et/ou certaines parties de lâ€™index.</p>
<p>Comme expliquĂ© prĂ©cĂ©demment, Google CafĂ©ine ne focalise pas sur lâ€™algorithme. Un peu comme si vous changiez de voiture pour passer dâ€™une Twingo Ă  une Porsche, mais vous nâ€™ĂŞtes pas devenu SĂ©bastien Loeb par lâ€™intermĂ©diaire de ce changement du vĂ©hicule.</p>
<p>Bien sĂ»r, l&#8217;index et l&#8217;algorithme sont liĂ©s, donc j&#8217;imagine qu&#8217;il faut accorder le bouzin pour qu&#8217;il dĂ©pote Ă  merveille. Par ailleurs, il est facile de comprendre que ce n&#8217;est pas non plus le meilleur moment pour coller des filtres Ă  foison qui pourraient mettre Ă  mal cette merveilleuse nouvelle machinerie.</p>
<h3>Les effets et consĂ©quences de Google CafĂ©ine</h3>
<p>Ma plus grande attente concerne l&#8217;indexation en temps rĂ©el. Jusque Ă  maintenant, Google Search est Ă  la ramasse et Google Images est un dĂ©sastre. EspĂ©rons que cette nouvelle infrastructure va permettre Ă  Google de pouvoir tacler lâ€™indexation en temps rĂ©el convenablement.</p>
<p>Les Ă©ventuelles perturbations observĂ©es ressortent l&#8217;excuse passe partout qui sont les <em>effets de bord</em>. Quand on bidouille un index de cette taille, il est Ă©vident que certains effets inattendus apparaissent pour des cas isolĂ©s. Bien Ă©videmment, ceux qui verront leurs sites tomber vont faire un ramdam pas possible, mais ils reprĂ©senteront une portion microscopique du total de l&#8217;index.</p>
<p>Si lâ€™algorithme Ă©tait concernĂ© par cette mise Ă  jour, cela amplifierait les effets de bords. Essayez de changer une virgule dans une formule mathĂ©matique pour voir un peu les consĂ©quences&#8230;</p>
<p>Une autre Ă©vidence du rafraichissement de l&#8217;index concerne l&#8217;affichage du nombre de rĂ©sultats qui Ă©tait notoirement farfelu. J&#8217;ose espĂ©rer qu&#8217;on pourra dĂ©sormais se fier avec plus d&#8217;exactitude aux chiffres Ă©noncĂ©s dans les rĂ©sultats de recherche.</p>
<p>La lutte contre le spam reste au coeur des besoins de Google. Une meilleure manipulation des donnĂ©es contenues dans l&#8217;index pourrait aider dans <a href="http://www.laurentbourrelly.com/blog/378.php">cette lutte pour totalement vaine</a> (pour l&#8217;instant).</p>
<p>Le paramĂ¨tre dont parlent ceux qui ont compris de quoi il s&#8217;agit porte sur la vitesse de chargement des sites, dont les plus lents pourraient ĂŞtre dĂ©favorisĂ©s. Ce nouvel index focalise sur la vitesse, donc il semble viable de demander aux pages affichĂ©es parmi les meilleurs rĂ©sultats de suivre cette tendance. Matt Cutts mis le doigt sur ce point dans une <a href="http://www.webpronews.com/topnews/2009/11/13/google-page-speed-may-be-a-ranking-factor-in-2010" target="_blank">interview</a> rĂ©cente, ainsi que <a href="http://searchengineland.com/site-speed-googles-next-ranking-factor-29793" target="_blank">SearchEngineLand</a> qui abonde dans ce sens. Attention, il ne faut pas faire partir une nouvelle rumeur suggĂ©rant quâ€™un site qui se charge en plus de 4 secondes va perdre 30 positions. Ce paramĂ¨tre est Ă  inclure parmi les +200 qui composent lâ€™algorithme, nĂ©cessitant de jauger son importante relative par rapport aux autres.</p>
<p>A propos de la vitesse de chargement des pages Web, je reste perplexe car jâ€™ai testĂ© la rapiditĂ© de mon site et le facteur le plus ralentissant est â€¦ Google Analytics &#8211; par le biais du code JavaScript installĂ© en bas de chaque page.</p>
<h4>Comment faire une analyse convenableÂ ?</h4>
<p>Le <em>reverse engineerin</em>g Ă  la petite semaine est une perte de temps. Tout dâ€™abord, il faut bien comprendre que lâ€™affichage des rĂ©sultats de recherche nâ€™est pas forcĂ©ment une retranscription exacte de ce qui se trame dans lâ€™index. Sans parler des chiffres farfelus affichĂ©s comme compteur des rĂ©sultats, Il existe toute une sĂ©rie dâ€™opĂ©rations depuis le moment oĂą GoogleBot crawle une page Web jusquâ€™au moment oĂą elle ressort sous divers opĂ©rateurs au sein des rĂ©sultats de recherche. Nous disposons uniquement de la plus petite lucarne qui sont les rĂ©sultats de recherche du moteur. Toute la machinerie en amont est invisible et inconnue.</p>
<p><a href="http://bababillgates.free.fr/index.php/googe-caffeine-a-t-il-un-impact-sur-le-seo-et-le-referencement/" target="_blank">Tirer des conclusions</a> Ă  partir dâ€™un rĂ©sultat de recherche pour dĂ©terminer ce qui se passe en amont est vouĂ© Ă  prĂ©senter une pitoyable interprĂ©tation du fonctionnement de Google.</p>
<p>Parmi les mythes du rĂ©fĂ©rencement, il demeure un paramĂ¨tre que jâ€™ai toujours combattu avec force. Il s&#8217;agit de la densitĂ© des mots clĂ©s au sein dâ€™une page. Il suffit de savoir dans les grandes lignes comment Google fonctionne pour se rendre compte que ce critĂ¨res est totalement farfelu.</p>
<p>Pour analyser le comportement du moteur par rapport aux mots clĂ©s, il faudrait Ă©valuer le nombre dâ€™occurrences sur la page. Jusque lĂ  câ€™est facileÂ ; il suffit de compter les mots cibles sans prendre en compte le nombre total de mots clĂ©s comme le fait le calcul de densitĂ©. Ensuite, il faut Ă©valuer ces occurrences par rapport aux occurrences exactes sur le reste du site, puis par rapport aux co-occurrences similaires et complĂ©mentaires.</p>
<p>Ce nâ€™est pas finiÂ ! Maintenant, il faut prendre chaque partie de ces rĂ©sultats pour les Ă©valuer en fonction des pages Web concurrentes et le reste du site des pages concurrentes qui sont elles mĂŞme analysĂ©es comme prĂ©cĂ©demment.<br />
Ensuite, il faut remonter ces donnĂ©es pour tenter d&#8217;en sortir une rĂ¨gle de pondĂ©ration qui sera toujours Ă  prendre avec prĂ©caution car je rappelle que l&#8217;index n&#8217;est pas traitĂ© de maniĂ¨re identique sur sa totalitĂ©.</p>
<p>Et lĂ  on dispose dâ€™un petit dĂ©but de piste concernant la prise en compte des mots clĂ©s. Tout cela doit Ă©videmment se rĂ©pĂ©ter sur un nombre suffisant de mots clĂ©s pour une seule page, plusieurs pages du mĂŞme site, plusieurs sites sur la mĂŞme requĂŞte, un seul site sur plusieurs requĂŞtes, plusieurs sites sur plusieurs requĂŞtes, etc.</p>
<p>Ainsi, je peux sereinement rĂ©futer les rĂ©sultats de Mashable, ainsi que tous les autres qui se sont inspirĂ©s de cette analyse bidon.</p>
<h4>Si je comprends bien, je nâ€™ai rien Ă  craindre pour mon siteÂ ?</h4>
<p>Pour la vaste majoritĂ© des sites Internet, il nâ€™y aura pas ou trĂ¨s peu de changement. Ceux qui seront touchĂ©s seront sĂ»rement affectĂ©s par un effet temporaire qui sera dĂ©gagĂ© sans rien modifier sur le site. Malheureusement, câ€™est frustrant et je connais personnellement le phĂ©nomĂ¨ne.</p>
<p>Dans tous les cas, il ne faudra pas regarder du cĂ´tĂ© dâ€™une Ă©ventuelle pĂ©nalitĂ© algorithmique, mais plutĂ´t par rapport aux paramĂ¨tres liĂ©s Ă  lâ€™indexation.</p>
<p>On verra bien en janvier lorsque Google CafĂ©ine sera dĂ©ployĂ© sur tous les DataCenters du moteur de recherche, mais je peux logiquement mâ€™avancer en rejetant en bloc tous ceux qui font l&#8217;amalgame entre index et algorithme.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.laurentbourrelly.com/blog/387.php/feed</wfw:commentRss>
		<slash:comments>40</slash:comments>
		</item>
		<item>
		<title>Google peut-il combattre le spam ?</title>
		<link>http://www.laurentbourrelly.com/blog/378.php</link>
		<comments>http://www.laurentbourrelly.com/blog/378.php#comments</comments>
		<pubDate>Fri, 13 Nov 2009 15:20:30 +0000</pubDate>
		<dc:creator>Laurent</dc:creator>
				<category><![CDATA[Moteurs de recherche]]></category>
		<category><![CDATA[Archive.org]]></category>
		<category><![CDATA[danger]]></category>
		<category><![CDATA[Eric Schmidt]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Internet]]></category>
		<category><![CDATA[Matt Cutts]]></category>
		<category><![CDATA[moteur]]></category>
		<category><![CDATA[nofollow]]></category>
		<category><![CDATA[recherche]]></category>
		<category><![CDATA[RĂ©fĂ©rencement]]></category>
		<category><![CDATA[Robots.txt]]></category>
		<category><![CDATA[site]]></category>
		<category><![CDATA[Vanessa Fox]]></category>
		<category><![CDATA[web]]></category>

		<guid isPermaLink="false">http://www.laurentbourrelly.com/blog/?p=378</guid>
		<description><![CDATA[Hier, je suivais la confĂ©rence PubCon oĂą Matt Cutts et Vanessa Fox auditaient des sites Web en direct. Comme de nombreux autres rĂ©fĂ©renceurs, jâ€™ai fait un bond lorsque Matt Cutts a clamĂ© que lâ€™interdiction de crawl par archives.org remontait une alerte rouge pour forte probabilitĂ© de spam par Google. Ce dĂ©tail ajoute Ă  une perspective [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/archive-org1.png" rel="shadowbox[sbpost-378];player=img;" title="Blocage Archive.org par Robots.txt"><img class="alignleft size-thumbnail wp-image-380" style="border: 0pt none; margin: 0px 10px;" title="Blocage Archive.org par Robots.txt" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/archive-org1-150x150.png" alt="Blocage Archive.org par Robots.txt" width="105" height="105" align="left" /></a>Hier, je suivais la confĂ©rence PubCon oĂą Matt Cutts et Vanessa Fox auditaient des sites Web en direct.</p>
<p>Comme de nombreux autres rĂ©fĂ©renceurs, jâ€™ai fait un bond lorsque Matt Cutts a clamĂ© que lâ€™interdiction de crawl par archives.org remontait une alerte rouge pour forte probabilitĂ© de spam par Google. Ce dĂ©tail ajoute Ă  une perspective plus grande qui concerne la maniĂ¨re dont Google combat le spam et son dictat qui commence sĂ©rieusement Ă  nous chauffer les oreilles.<span id="more-378"></span></p>
<h1>L&#8217;incident Archive.org durant PubCon</h1>
<p>Pour ceux qui ne connaissent pas <a href="http://www.archive.org/" target="_blank">Archive.org</a>, il enregistre les versions dâ€™un site au travers du temps. Les spammeurs ne souhaitent pas y figurer puisque Ă§a pourrait afficher les saloperies quâ€™ils font bouffer aux moteurs de recherche et aux internautes.</p>
<p>Dâ€™un autre cĂ´tĂ©, il existe une multitude de raisons lĂ©gitimes pour bloquer Archive.orgÂ :</p>
<ul>
<li>Protection de mes donnĂ©esÂ car Archive.org est tout simplement un voleur de contenu.</li>
<li>Ne pas montrer des versions prĂ©cĂ©dentes du site car il est parfois embarrassant de voir Ă  quoi ressemblait un site Ă  ses dĂ©buts ou tout simplement parce que le site est en dĂ©veloppement.</li>
<li>Si je change la thĂ©matique d&#8217;un site rattachĂ© Ă  un nom de domaine, il est souhaitable que lâ€™historique ne remonte pas (jâ€™ai personnellement le cas actuellement)</li>
</ul>
<p>En lire plus Ă  propos de lâ€™incident PubCon chez</p>
<ul>
<li><a href="http://www.seo-theory.com/2009/11/12/reblog-why-some-sites-must-block-archive-org/" target="_blank">SEO Theory</a> (bonne explication sur les mythes Google et son dictat)</li>
<li><a href="http://www.pink-seo.com/blog/google-dictateur-des-temps-modernes-269" target="_blank">Pink SEO</a> (focalise sur le blocage Archive.org)</li>
<li><a href="http://www.seomoz.org/blog/new-interesting-insights-into-google-rankings-spam-from-pubcon" target="_blank">SEOMoz</a> couverture PubCon</li>
<li>SeroundtableÂ  <a href="http://www.seroundtable.com/archives/021107.html" target="_blank">Organice Focus</a> (contient lâ€™intervention de Matt Cutts) et <a href="http://www.seroundtable.com/archives/021159.html" target="_blank">couverture Live de PubCon</a></li>
</ul>
<h2>Lâ€™impuissance de Google devant le spam</h2>
<p>Depuis le temps que je&#8217;observe Matt Cutts, alors quâ€™il Ă©tait encore <a href="http://googleguy-fr.blogspot.com/" target="_blank">GoogleGuy</a>, jâ€™ai appris Ă  lire entre les lignes de ses propos. En effet, ce nâ€™est pas ce quâ€™il dit qui importe le plus souvent car câ€™est dâ€™une banalitĂ© affligeante, mais plutĂ´t comment il le dit et ce quâ€™il ne dit pas. En gros, il y a deux solutionsÂ :</p>
<ul>
<li>Matt Cutts nâ€™y connaĂ®t pas grand chose</li>
<li>Matt Cutts cache bien son jeu</li>
</ul>
<h3>Le nofollowÂ : aveu dâ€™impuissance</h3>
<p>Aujourd&#8217;hui, Ă§a devient assez lourd de subir le dictat de ce moteur de recherche. Lâ€™exemple le plus dĂ©sastreux concerne le nofollow qui a tout simplement bousillĂ© le rĂ©fĂ©rencement organique. Vous pouvez crĂ©er le meilleur contenu du monde, mais il ne sera pas plus liĂ© comme avant puisquâ€™il nâ€™y a plus un transfert de popularitĂ© adĂ©quat. En dâ€™autres termes, un internaute va citer spontanĂ©ment votre page Web au sein dâ€™une conversation de forum, blog ou rĂ©seau social, mais ce lien ne vaudra rien au niveau de la popularitĂ©, principalement alliĂ©e au PageRank (sans parler de Twitter qui a achevĂ© d&#8217;enterrer le backlink). La capote du Web ou attribut nofollow est dĂ©sormais partout et surtout lĂ  oĂą il ne faut pas. Par exemple, Ă  la suite dâ€™un concours de rĂ©fĂ©rencement au cours duquel les participants venaient poser leurs liens sur une poignĂ©e de pages Wikipedia, câ€™est lâ€™encyclopĂ©die en ligne complĂ¨te qui s&#8217;est Ă©quipĂ©e de liens sortants nofollowisĂ©s. Autre exemple qui m&#8217;agace est le fabuleux script de blogging WordPress configurant par dĂ©faut les liens dans les commentaires en nofollow. Et on pourrait citer tant dâ€™autres exemples oĂąÂ  le nofollow est prĂ©sent, alors quâ€™il est possible de maĂ®triser le contenu dâ€™une autre maniĂ¨re. Pour rappel, les sites qui utilisent le nofollow prouvent leur incapacitĂ© Ă  maĂ®triser leur propre contenu. Celui qui n&#8217;est pas capable de trier les commentaires de son blog doit fermer les commentaires ou arrĂŞter de bloguer. Ce n&#8217;est pas la peine d&#8217;imposer un nofollow quand on gĂ¨re les commentaires ou alors c&#8217;est par radinerie du <em>Link Juice</em> et c&#8217;est encore plus dĂ©testable.</p>
<p>En juin 2009, Google a avouĂ© son impuissance et son erreur sur le sujet du nofollow par le biais de lâ€™annonce par Matt Cutts Ă  propos de la pseudo <a href="http://www.mattcutts.com/blog/pagerank-sculpting/" target="_blank">fin du PageRank Sculpting</a>. Ils ont lĂ˘chĂ© le nofollow sur le Web pour qu&#8217;un retour de bĂ˘ton ne se fasse pas attendre. Maintenant, il est trop tard car cette verrue est trop rĂ©pandue.</p>
<h2>OĂą en est le combat de Google contre le spam ?</h2>
<p>Le problĂ¨me Ă  propos du blocage de Archive.org par le biais du robots.txt peut paraĂ®tre anodin Ă  certains, mais câ€™est en lisant entre les lignes quâ€™on remarque toute la portĂ©e de cet incident.</p>
<p>DĂ©sormais, tout porte Ă  croire que Google ne maĂ®trise absolument pas le sujet du combat contre le spam. La maniĂ¨re dont Matt Cutts a rĂ©agit Ă  propos de ce paramĂ¨tre lors de PubCon ne suggĂ¨re pas ou ne nâ€™implique pas, mais plutĂ´t dĂ©montre directement que ce paramĂ¨tre amĂ¨ne immĂ©diatement le site dans une zone peu enviable. Ce nâ€™est pas un paramĂ¨tre dâ€™alerte parmi tant dâ€™autres, mais bien une alerte majeure qui va Ă©veiller les plus gros soupĂ§ons. Quand Matt Cutts dit Â«Â <em>itâ€™s a huge Red Flag</em> Â» (câ€™est une Ă©norme alerte rouge), il faut bien comprendre qu&#8217;il s&#8217;agit d&#8217;un paramĂ¨tre majeur, nĂ©cessitant de lire entre les lignes. J&#8217;en dĂ©duis queÂ  câ€™est Ă  ce niveau de dĂ©tection que Google stagne pour dĂ©clencher des alertes majeures. La console de Matt Cutts n&#8217;est finalement peut-ĂŞtre pas si impressionnante que Ă§a?</p>
<p>Un peu plus tard, Matt Cutts a tentĂ© de dĂ©douaner son intervention via Twitter en expliquant que c&#8217;est dans le cadre oĂą un site est suspectĂ© qu&#8217;il va remarquer le blocage archive.org. Sauf que ce n&#8217;est pas du tout ce qui s&#8217;est passĂ© lors de PubCon. Je ne crois pas une seconde que l&#8217;analyse aussi facile d&#8217;un tel paramĂ¨tre est impliquĂ©e dans un deuxiĂ¨me niveau de vĂ©rification. MĂŞme si c&#8217;est le cas, le problĂ¨me reste identique par rapport Ă  l&#8217;opacitĂ© de Google.</p>
<h3>Pourquoi c&#8217;est grave ?</h3>
<p>Câ€™est grave car (en partant du principe que je nâ€™ai rien Ă  me reprocher), il est Ă©vident que je nâ€™ai pas du tout envie que Google vienne fouiner sur mon site pour trouver quelque chose qui ne va pas. Câ€™est exactement comme le principe de la Garde Ă  Vue oĂą je peux ĂŞtre sĂ©questrĂ© simplement parce que je suis tĂ©moin dâ€™un crime. VoilĂ  un sentiment malsain dâ€™impuissance contre une suspicion injuste. Il y a aucun dialogue possible avec Google, mis Ă  part lorsque le mal est dĂ©jĂ  fait avec le site blacklistĂ© c.a.d sorti de lâ€™index. Câ€™est alors quâ€™il faut passer par la fameuse <a href="http://www.google.com/support/webmasters/bin/answer.py?hl=fr&amp;answer=35843" target="_blank">Reinclusion Request</a> et attendre vaillamment une rĂ©ponse automatique, puis insister lourdement pour enfin enchaĂ®ner sur un dialogue de sourds. Pour peu que vous soyez effectivement coupables dâ€™effraction envers les Webmaster Guidelines, le processus peut sâ€™avĂ©rer trĂ¨s long.</p>
<p>Ainsi, il est demandĂ© de suivre des rĂ¨gles inconnues, sachant que des paramĂ¨tres flous peuvent dĂ©clencher une suspicion, alors que lâ€™intention premiĂ¨re nâ€™Ă©tait pas forcĂ©ment de spammer. Nous sommes accusĂ©s par dĂ©faut dâ€™ĂŞtre ignorant de rĂ¨gles qui nous sont inconnues. Car si vous reposez votre stratĂ©gie sur les <a href="http://www.google.com/support/webmasters/bin/answer.py?hl=fr&amp;answer=35769" target="_blank">Google Webmaster Guidelines,</a> il apparaĂ®t que tous les paramĂ¨tres Ă  respecter nâ€™y figurent pas. En tout cas, je vois Archive.org nulle part. Ă‰tonnant de remarquer son absence pour un <em>Ă©norme</em> paramĂ¨tre d&#8217;aprĂ¨s Matt Cutts.</p>
<p>Dans le cadre dâ€™un site pĂ©nalisĂ©; câ€™est Ă  dire relĂ©guĂ© au fin fond de lâ€™index, mais pas exclu, vous pouvez toujours vous atteler Ă  contacter Google afin dâ€™obtenir une explication. Pourtant, jâ€™ai vu des sites pĂ©nalisĂ©s pendant plus dâ€™un an pour quâ€™ils remontent miraculeusement sans avoir effectuĂ© de modifications majeures et surtout sans avoir compris dâ€™oĂą venait la pĂ©nalitĂ©. J&#8217;ai encore une exemple personnel oĂą le site que j&#8217;ai vendu est tombĂ© trois semaines aprĂ¨s le transfert pour remonter dix mois plus tard. Impossible de savoir pourquoi le site est tombĂ© et encore moins pourquoi le site est remontĂ©. Pendant ce temps, le chiffre dâ€™affaire est tombĂ© Ă  zĂ©roâ€¦</p>
<p>Les mythes Ă  propos du rĂ©fĂ©rencement Google sont trop nombreux et flous pour que j&#8217;en parle sur ce billet, mais la vaste majoritĂ© des webmasters ne savent absolument pas Ă  quoi s&#8217;en tenir sur de nombreux sujets. Par exemple: contenu dupliquĂ©, intĂ©rĂŞt du pagerank, notion du trustrank, regoupement d&#8217;IPs, redirections, etc.</p>
<h4>Nous sommes des idiots pataugeant au milieu d&#8217;un moteur idiot</h4>
<p>Maintenant, jâ€™arrive au cĹ“ur de mon propos qui reprend cet exemple du blocage de Archive.org dans le Robots.txt. Nous apprenons par le biais dâ€™une couverture en direct de la confĂ©rence PubCon quâ€™il est totalement dĂ©conseillĂ© dâ€™opĂ©rer une interdiction de crawl d&#8217;Archive.org. Il faut vraiment le vouloir pour ĂŞtre au courant de cette information. A la limite, on s&#8217;en fout complĂ¨tement de archive.org qui n&#8217;a d&#8217;intĂ©rĂŞt que parce que Matt Cutts vient d&#8217;en parler, mais Ă§a dĂ©montre comment les rĂ¨gles de Google sont bien trop opaques pour qu&#8217;on puisse travailler sereinement.</p>
<p>Il est scandaleux de laisser les responsables de sites Web dans lâ€™ignorance totale. Comme je disais dans mon billet prĂ©cĂ©dent, nous jouons au <a href="http://www.pro34.com/" target="_blank">poker</a> sans connaĂ®tre les rĂ¨gles qui sont modifiĂ©es sans nous avertir. Ou alors Google nous averti, mais ne dit pas exactement de quoi il en retourne (par exemple avec la <a href="http://googlewebmastercentral.blogspot.com/2009/08/help-test-some-next-generation.html" target="_blank">mise Ă  jour CafĂ©ine</a> ).<br />
Mon travail consiste Ă  auditer des sites Internet pour optimiser le rĂ©fĂ©rencement. J&#8217;observe donc tous les jours des problĂ¨mes qui pourraient s&#8217;apparenter Ă  de la triche, mais qui ne sont absolument mis en place afin de vouloir biaiser les moteurs.</p>
<p>Sans parler de lâ€™opacitĂ© du programme Adsense ou Adwords dans lequel il est tout de mĂŞme question de sous â€“de gros sous- et sur lesquels nous disposons dâ€™une comprĂ©hension trĂ¨s limitĂ©e.</p>
<p>Tout cela mâ€™amĂ¨ne Ă  la simple conclusion que Google et Matt Cutts en particulier pataugent totalement dans la choucroute Ă  propos du combat contre le spam. Â Il suffit de sâ€™intĂ©resser au rĂ©fĂ©rencement Black Hat pour observer que les nouvelles bidouilles sont ingĂ©nieuses, mais elles reposent sur des bases anciennes. Bien sĂ»r, les principes restent identiques : gĂ©nĂ©rer et cacher du contenu, acquĂ©rir des liens, faire descendre les concurrents. Par contre, les bidouilles Ă©voluent plutĂ´t par rapport au progrĂ¨s technique que par rapport aux Ă©ventuels filtres qui pourraient entraver la route dâ€™un site Black Hat.<br />
Pour parler simplement et clairement: Google ne fait pas peur aux spammeurs et câ€™est bien lĂ  le fond du problĂ¨me.</p>
<p>Ainsi, malgrĂ© le fait que Matt Cutts semble ĂŞtre une personne trĂ¨s sympathique, il est fort possible quâ€™au final, il capte beaucoup moins quâ€™on le pense, Ă©ludant lâ€™option quâ€™il cache habilement son jeu.</p>
<p>Google nous prend pour des idiots, tout en avouant quâ€™il est idiot. Sauf quâ€™il impose des paramĂ¨tres qui sortent de sa juridiction. Sa pseudo communication est un affront plutĂ´t quâ€™un progrĂ¨s.</p>
<h4>Vaut mieux rire</h4>
<p>Pour finir, observez dans la vidĂ©o suivante, la maniĂ¨re dont Eric Schmidt, CEO de Google, rĂ©pond au journaliste Ă  la questionÂ :Â Â«Â <em>comment je sais que Google enlĂ¨ve le contenu que je souhaiteÂ ?</em> Â». Il rĂ©pond Â«Â <em>parce quâ€™on vous dit quâ€™on le fait</em> Â», puis grand Ă©clat de rire.<br />
En plus, montrez moi comment on enlĂ¨ve une information Ă  mon sujet qui me dĂ©plait. Non seulement il ment, mais en plus il se moque de nous. Ou alors, lui non plus ne sait pas de quoi il parle&#8230;</p>
<p><a href="http://www.youtube.com/v/nkiToS5iPAE" rel="shadowbox[sbpost-378];player=swf;width=640;height=385;" title="eric schmidt, le CEO de Google discute de la protection des donnĂ©es"><img class="alignnone size-medium wp-image-381" title="eric schmidt, le CEO de Google discute de la protection des donnĂ©es" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/eric-schmidt-ceo-google-300x181.png" alt="eric schmidt, le CEO de Google discute de la protection des donnĂ©es" width="300" height="181" /></a></p>
<h4>Avertissement aux incrĂ©dules</h4>
<p>Pour ceux qui ne trouvent rien Ă  redire sur les agissements de Google, nâ€™oubliez pas que cette compagnie est en train de dominer la planĂ¨te. Ne pas laisser faire nâ€™importe quoi est notre devoir. Câ€™est encore plus indispensable quand mes revenus dĂ©pendent directement de ce moteur de recherche. Nous avons trop peu de moyens pour surveiller Google car câ€™est une sociĂ©tĂ© privĂ©e, mais laisser le monde Ă  la merci dâ€™une telle entitĂ© est dangereux.</p>
<p><strong>Note</strong> : je suis dĂ©solĂ© si ce billet est un peu dĂ©sorganisĂ©, mais il est possible dâ€™Ă©crire un Ă©pais livre sur ce sujet. Ayant juste posĂ© mes pensĂ©es en vrac, jâ€™ai beaucoup raccourci Ă  la relecture, mais je nâ€™ai pas trouvĂ© comment mieux lâ€™organiser.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.laurentbourrelly.com/blog/378.php/feed</wfw:commentRss>
		<slash:comments>55</slash:comments>
		</item>
		<item>
		<title>Le TrustRank est mort! Naissance du PersonRank &#8230;</title>
		<link>http://www.laurentbourrelly.com/blog/321.php</link>
		<comments>http://www.laurentbourrelly.com/blog/321.php#comments</comments>
		<pubDate>Fri, 23 Oct 2009 02:12:22 +0000</pubDate>
		<dc:creator>Laurent</dc:creator>
				<category><![CDATA[Moteurs de recherche]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Google Wave]]></category>
		<category><![CDATA[Larry Page]]></category>
		<category><![CDATA[Matt Cutts]]></category>
		<category><![CDATA[pagerank]]></category>
		<category><![CDATA[rank]]></category>
		<category><![CDATA[Sidewiki]]></category>
		<category><![CDATA[SMO]]></category>
		<category><![CDATA[Social Media Optimization]]></category>
		<category><![CDATA[trust]]></category>
		<category><![CDATA[TrustRank]]></category>
		<category><![CDATA[Twitter]]></category>

		<guid isPermaLink="false">http://www.laurentbourrelly.com/blog/?p=321</guid>
		<description><![CDATA[Le 29 fĂ©vrier 2009, Google abandonne la marque dĂ©posĂ©e TrustRank, mais vient de dĂ©poser un brevet le 13 octobre 2009 qui sâ€™intitule Â« Search Result Ranking Based On Trust Â». Cette nouvelle notion s&#8217;Ă©loigne encore plus du mythe vĂ©hiculĂ© sur Internet Ă  propos d&#8217;un TrustRank pour les sites de confiance. Soudain, nous sommes en face [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/10/trustrank-google.jpg" rel="shadowbox[sbpost-321];player=img;" title="trust rank google"><img class="alignleft size-thumbnail wp-image-322" style="border: 0pt none; margin: 0px 10px;" title="trust rank google" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/10/trustrank-google-150x150.jpg" alt="trust rank google" width="90" height="90" align="left" /></a>Le 29 fĂ©vrier 2009, Google abandonne la marque dĂ©posĂ©e TrustRank, mais vient de dĂ©poser un brevet le 13 octobre 2009 qui sâ€™intitule Â« Search Result Ranking Based On Trust Â».</p>
<p>Cette nouvelle notion s&#8217;Ă©loigne encore plus du mythe vĂ©hiculĂ© sur Internet Ă  propos d&#8217;un TrustRank pour les sites de confiance. Soudain, nous sommes en face de la rĂ©alitĂ© d&#8217;un PersonRank qui Ă©value le profil d&#8217;un utilisateur et prend en compte ses annotations Ă  propos des pages Web.<span id="more-321"></span></p>
<p>Câ€™est en lisant lâ€™<a href="http://www.seobythesea.com/?p=3015" target="_blank">article</a> de lâ€™excellent Bill Slawski que je prends connaissance de ce nouveau dĂ©veloppement, mais tout dâ€™abord un bref Ă©tat des lieux s&#8217;impose pour poser des bases saines Ă  propos du TrustRank.</p>
<p>Comme jâ€™expliquais il y a peu dans mon article sur le <a href="http://www.laurentbourrelly.com/blog/40.php">mythe du TrustRank</a>, la plupart des gens font rĂ©fĂ©rence Ă  cette notion par rapport Ă  une <a href="http://www.cs.toronto.edu/vldb04/protected/eProceedings/contents/pdf/RS15P3.PDF" target="_blank">Ă©tude</a> qui nâ€™a rien Ă  voir avec Google puisqu&#8217;elle est associĂ©e avec Yahoo!. Par ailleurs, Matt Cutts confirmait que le TrustRank Ă©tait seulement un filtre antiphising qui nâ€™Ă©tait pas liĂ© Ă  lâ€™Ă©tude en question. Explication par l&#8217;intĂ©ressĂ©  dans la vidĂ©o suivante.</p>
<p><a rel="shadowbox" href="http://www.youtube.com/v/p8mUXQzwEvs" title="Le mythe du TrustRank dĂ©menti par Matt Cutts"><img class="alignnone size-medium wp-image-324" title="Le mythe du TrustRank dĂ©menti par Matt Cutts" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/10/mythe-trustrank-300x242.png" alt="Le mythe du TrustRank dĂ©menti par Matt Cutts" width="300" height="242" /></a></p>
<p><strong>Abandon de la marque TrustRank</strong></p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/10/abandon-google-trustrank.jpg" rel="shadowbox[sbpost-321];player=img;" title="abandon du trustrank par google"><img class="alignleft size-medium wp-image-323" style="border: 0pt none; margin: 10px;" title="abandon du trustrank par google" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/10/abandon-google-trustrank-300x244.jpg" alt="abandon du trustrank par google" width="168" height="137" align="left" /></a>Le 29 fĂ©vrier 2009, Google abandonne le dĂ©pĂ´t de marque TrustRank comme dĂ©montre l&#8217;aperĂ§u de gauche, mais un dĂ©pĂ´t de brevet au 13 octobre 2009 indique une Ă©volution intĂ©ressante pour la recherche d&#8217;information, tout en s&#8217;Ă©loignant encore plus du mythe qui reste bien profondĂ©ment marquĂ© chez les webmasters et rĂ©fĂ©renceurs.</p>
<p>Google met au point un systĂ¨me innovant de classement des pages qui prend en compte les annotations des utilisateurs en tant que vote de confiance. Bien entendu, on pense tout de suite Ă  <a href="http://www.google.com/sidewiki/intl/fr/" target="_blank">SideWiki</a> qui vient dâ€™ĂŞtre lancĂ© et qui permet effectivement de poser des commentaires Ă  propos dâ€™une page Web. Ce qui est intriguant est quâ€™il nâ€™y a pas de rĂ©fĂ©rence Ă  Sidewiki dans le brevet dĂ©posĂ© par Google, mais par contre Slawski note une ressemblance avec lâ€™<a href="http://bakara.eng.tau.ac.il/~semcomm/GKRT.pdf" target="_blank">Ă©tude</a> Ă©laborĂ©e par l&#8217;ingĂ©nieur Google, Ramanathan Guha, alors quâ€™il Ă©tait chez IBM. Puisque c&nbsp;&raquo;est Guah qui a dĂ©posĂ© le brevet au nom de Google, il est clair que son travail actuel est une prolongation du travail effectuĂ© chez IBM dont l&#8217;Ă©tude en question peut nous indiquer des pistes pour mieux comprendre ce qui se trame chez Google.</p>
<h1>Le brevet du Trust Rank</h1>
<p><a href="http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&amp;Sect2=HITOFF&amp;u=%2Fnetahtml%2FPTO%2Fsearch-adv.htm&amp;r=1&amp;p=1&amp;f=G&amp;l=50&amp;d=PTXT&amp;S1=7,603,350.PN.&amp;OS=pn/7,603,350&amp;RS=PN/7,603,350">Search result ranking based on trust</a><br />
Invented by Ramanathan Guha<br />
Assigned to Google<br />
US Patent 7,603,350<br />
Granted October 13, 2009<br />
Filed: 	May 9, 2006</p>
<p>Lâ€™extrait du brevet se traduit comme suit :</p>
<p><em>Un moteur de recherche procure des rĂ©sultats qui sont classĂ©s en fonction dâ€™une mesure de confiance associĂ©e avec des entitĂ©s prĂ©sentĂ©es sous forme de notes au sein des rĂ©sultats de recherche. Un moteur de recherche reĂ§oit une requĂŞte et sĂ©lectionne les documents pertinents pour cette requĂŞte.<br />
Le moteur de recherche dĂ©termine Ă©galement les notes associĂ©es avec les documents sĂ©lectionnĂ©s, ainsi que les niveaux de confiance des entitĂ©s qui procurent les notes. Les niveaux de confiance sont utilisĂ©s pour dĂ©terminer le facteur de confiance des documents respectifs. Les facteurs de confiance sont Ă©galement utilisĂ©s pour ajuster le score de rĂ©cupĂ©ration de lâ€™information des documents. Les rĂ©sultats de recherche sont ainsi classĂ©s sur la base dâ€™information du score ajustĂ©.</em></p>
<p>C&#8217;est donc la notion de pertinence des notes posĂ©es par des utilisateurs qualifiĂ©s qui ressort. Le challenge consiste Ă  rĂ©cupĂ©rer et analyser ces notes, mais surtout de cerner qui sont les utilisateurs dont les commentaires portent un certain poids.</p>
<p>Au-delĂ  de SideWiki, il est possible dâ€™annoter des pages lorsque nous sommes connectĂ©s Ă  notre compte Google, ainsi que les discussions Google Wave, mais il existe Ă©galement de nombreux supports possibles pour dĂ©nicher des notes dâ€™utilisateurs. Pour cela, il faut que Google sorte de son carcan pour explorer les commentaires de blogs, discussions Wiki, etc.</p>
<p>Mais d&#8217;abord, il faut s&#8217;attacher Ă  savoir comment cerner le profil d&#8217;un internaute&#8230;</p>
<h2>Ă‰valuer lâ€™utilisateur humain, le PersonRank</h2>
<p>Recentrer le classement des rĂ©sultats de recherche autour de lâ€™utilisateur a toujours Ă©tĂ© quelque chose que je dĂ©fends. Selon moi, Google nâ€™a pas attendu ce brevet pour Ă©valuer le profil dâ€™un utilisateur et sâ€™en servir pour mieux classer les pages. Lâ€™Ă©lĂ©ment clef pour agir de la sorte est la Google Toolbar qui dĂ©termine facilement un profil dâ€™internaute puisqu&#8217;elle analyse la navigation et l&#8217;utilisation des pages Web. Maintenant, grĂ˘ce Ă  dâ€™autres supports comme SideWiki et <a href="http://wave.google.com/" target="_blank">Google Wave</a>, le moteur de recherche dispose en interne de puissants outils pour Ă©valuer encore plus prĂ©cisĂ©ment le profil dâ€™un internaute.<br />
Ainsi, pendant que les webmasters focalisaient sur le <a href="http://www.webmaster-hub.com/publication/L-algorithme-du-PageRank-explique.html" target="_blank">PageRank</a>, vote dâ€™une page Web vers une autre, Google travaillait pour recentrer sa maniĂ¨re de classement sur le vote de lâ€™internaute. Câ€™est dâ€™ailleurs assez fascinant dâ€™observer les implications du partenariat avec Twitter, notamment pour mieux cerner le Web sĂ©mantique.</p>
<p>La prochaine rumeur qui va parcourir le milieu du rĂ©fĂ©rencement sera le <strong>PersonRank</strong>. Vous voulez qu&#8217;on lance un buzz ?</p>
<h3>Halte au mythe du TrustRank. Vive le nouveau mythe du PersonRank</h3>
<p>La lĂ©gende urbaine du TrustRank semble bien Ă©tablie au sein de la communautĂ© du rĂ©fĂ©rencement et au-delĂ . Pour les croyants en ce mythe, Google applique un classement en fonction du niveau dâ€™autoritĂ© du site et consĂ©quemment sur le vote quâ€™il va envoyer au travers dâ€™un lien (backlink). Cette notion existe Ă©videmment dans lâ€™algo, mais ce nâ€™est pas du tout liĂ© au TrustRank comme expliquĂ© prĂ©cĂ©demment et ce nouveau dĂ©veloppement nous Ă©loigne encore plus de ce fantasme Ă  moitiĂ© abouti.<br />
Il existe bien un Trust Rank ou classement de confiance, mais il est centrĂ© autour de lâ€™internaute ( PersonRank ), plutĂ´t que sur les sites Web.  Câ€™est dâ€™ailleurs logique puisque Google est toujours aussi incapable de combattre efficacement le spam. Se tourner vers la pertinence du vote humain est bien plus fiable que laisser lâ€™algorithme s&#8217;embourber avec ce classement des pages Web qui reste perfectible.</p>
<p>Je ne crois pas que Google trafique manuellement les rĂ©sultats de recherche. Les suspicions liĂ©es Ă  un dĂ©classement des rĂ©sultats naturels aprĂ¨s avoir arrĂŞtĂ© de payer des liens sponsorisĂ©s Adwords ne tient pas debout et nâ€™a jamais Ă©tĂ© formellement prouvĂ©. Mis Ă  part le blacklistage d&#8217;un site qui est effectuĂ© manuellement, c&#8217;est bien sur une base d&#8217;algorithmes par couches que le moteur fonctionne. La subtilitĂ© actuelle consiste Ă  rĂ©cupĂ©rer un Ă©lĂ©ment humain (vote de confiance) pour l&#8217;intĂ©grer dans ce classement automatique.<br />
Google souhaite rendre ses rĂ©sultats de recherche meilleurs grĂ˘ce au vote de confiance par lâ€™utilisateur qualifiĂ©. Nous entrons dans lâ€™Ă¨re du <a href="http://www.laurentbourrelly.com/blog/185.php">Social Media Optimization</a> (SMO) avec un enjeu majeur pour les sociĂ©tĂ©s qui peinent vĂ©ritablement Ă  trouver la maniĂ¨re de pĂ©nĂ©trer le Web communautaire. Seulement, le <a href="http://www.laurentbourrelly.com/blog/316.php">partenariat annoncĂ© avec Twitter</a> marque Ă©videmment une dĂ©marche dans ce sens, mais je ne sais pas si l&#8217;outil de micro-blogging est vraiment le bon choix pour amĂ©liorer la pertinence.</p>
<p>Pour terminer, certains sont outrĂ©s de ma rĂ©action par rapport au rejet de <a href="http://www.laurentbourrelly.com/blog/302.php">Google Wave</a>, mais il faut comprendre que je sais depuis longtemps que Google a enregistrĂ© mon profil en tant quâ€™utilisateur et certainement aussi en tant que rĂ©fĂ©renceur. On joue sur une tendance dangereuse car je suis jugĂ© par un moteur de recherche et toute ma vie en ligne peut ĂŞtre impactĂ©e par cette Ă©valuation. Chaque outil Google que jâ€™utilise entre des donnĂ©es sur mon profil et il nâ€™y a pas besoin dâ€™ĂŞtre paranoĂŻaque pour comprendre que câ€™est un sentiment extrĂŞmement dĂ©sagrĂ©able d&#8217;avoir un PersonRank, surtout qu&#8217;il est impossible d&#8217;y Ă©chapper. Il ne faut pas oublier que le rĂŞve de Larry Page, fondateur de Google, est d&#8217;implanter une puce dans notre cerveau qui permettrait de penser Ă  une requĂŞte et d&#8217;obtenir instantanĂ©ment la rĂ©ponse sur son mobile. Depuis que Page a Ă©mis cette idĂ©e, les ingĂ©nieurs Google ont entendu le message, mais bien extrapolĂ©!</p>
]]></content:encoded>
			<wfw:commentRss>http://www.laurentbourrelly.com/blog/321.php/feed</wfw:commentRss>
		<slash:comments>93</slash:comments>
		</item>
	</channel>
</rss>

