<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Laurent Bourrelly » moteur de recherche</title>
	<atom:link href="http://www.laurentbourrelly.com/blog/tag/moteur-de-recherche/feed" rel="self" type="application/rss+xml" />
	<link>http://www.laurentbourrelly.com/blog</link>
	<description>SEO ROCKSTAR</description>
	<lastBuildDate>Wed, 01 Feb 2012 10:02:22 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Briser lâ€™hĂ©gĂ©monie de Google</title>
		<link>http://www.laurentbourrelly.com/blog/1005.php</link>
		<comments>http://www.laurentbourrelly.com/blog/1005.php#comments</comments>
		<pubDate>Mon, 21 Nov 2011 05:29:08 +0000</pubDate>
		<dc:creator>Laurent</dc:creator>
				<category><![CDATA[Moteurs de recherche]]></category>
		<category><![CDATA[Baidu]]></category>
		<category><![CDATA[Bing]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Microsoft]]></category>
		<category><![CDATA[moteur de recherche]]></category>
		<category><![CDATA[Wolfram Alpha]]></category>

		<guid isPermaLink="false">http://www.laurentbourrelly.com/blog/?p=1005</guid>
		<description><![CDATA[Dâ€™aprĂ¨s certains analystes, le marchĂ© de la recherche dâ€™information est fortement dominĂ© par Google, mais nâ€™est pas forcĂ©ment impĂ©nĂ©trable. Cependant, le plan pour descendre le gĂ©ant de son piĂ©destal requiert une stratĂ©gie pointue et des ressources Ă  la mesure de lâ€™enjeu. Ne plus croire en Dieu Fondamentalement, les utilisateurs des moteurs poursuivent seulement des habitudes [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2011/11/google-bing-facebook.jpg" rel="shadowbox[sbpost-1005];player=img;"><img class="size-full wp-image-1006 alignleft" style="border-style: initial; border-color: initial; margin-top: 0px; margin-bottom: 0px; margin-left: 10px; margin-right: 10px; border-width: 0px;" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2011/11/google-bing-facebook.jpg" alt="Bataille Bing contre Google" width="108" height="66" /></a>Dâ€™aprĂ¨s certains analystes, le marchĂ© de la recherche dâ€™information est fortement dominĂ© par Google, mais nâ€™est pas forcĂ©ment impĂ©nĂ©trable.</p>
<p>Cependant, le plan pour descendre le gĂ©ant de son piĂ©destal requiert une stratĂ©gie pointue et des ressources Ă  la mesure de lâ€™enjeu.</p>
<p><span id="more-1005"></span></p>
<h1>Ne plus croire en Dieu</h1>
<p>Fondamentalement, les utilisateurs des moteurs poursuivent seulement des habitudes car ils ne comprennent pas comment Ă§a marche. Le dĂ©bat sur la technologie nâ€™est plus vraiment le cĹ“ur du problĂ¨me, mais convaincre quâ€™un autre moteur soit Â«Â meilleurÂ Â» que Google soulĂ¨ve un enjeu difficile qui nâ€™est pas pour autant impossible.</p>
<p>Aujourdâ€™hui, on peut lĂ©gitimement se demander si câ€™est possible de diverger lâ€™utilisateur du confort de son habitude dâ€™utilisation avec Google.</p>
<p><a href="http://www.zdnetasia.com/googles-search-lead-entrenched-but-not-unbeatable-62302932.htm">ZDNet Asia</a> a compilĂ© les avis de plusieurs spĂ©cialistes qui donnent des recommandations sur la situation.</p>
<p>La stratĂ©gie la plus Ă©vidente semble focaliser sur un pays en particulier comme <a href="http://www.baidu.com/">Baidu</a>Â en Chine ou une spĂ©cialitĂ© commeÂ <a href="http://www.wolframalpha.com/">Wolfram Alpha</a>Â pour la science.</p>
<p>La mĂ©thode est intelligente, mais ne va pas renverser Google pour autant. Ă‰tendre ce stratagĂ¨me sur une Ă©chelle suffisante devrait nĂ©cessiter tellement de ressources (du cashâ€¦) que câ€™est mĂŞme difficile Ă  estimer.</p>
<h3>Le cas de Bing</h3>
<p>Je nâ€™ai jamais cachĂ© mon affection pour Bing, en tant quâ€™alternative viable pour grignoter une part de marchĂ© non nĂ©gligeable.</p>
<p>Aujourdâ€™hui, le produit est prĂŞt, malgrĂ© les pointilleux qui iront comparer de prĂ¨s pour tourner lâ€™avantage vers celui quâ€™ils prĂ©fĂ¨rent. Bing mâ€™a mĂŞme surpris sur des terrains oĂą je ne lâ€™attendais pas comme lâ€™<a href="http://itunes.apple.com/us/app/bing-for-ipad/id418435837">application iPad</a> qui est absolument merveilleuse.</p>
<p>Le problĂ¨me de Bing nâ€™est plus technologique, mais tient Ă  son appartenance Ă  Microsoft. Le gĂ©ant de lâ€™informatique possĂ¨de des avantages Ă©vidents comme un compte en banque Ă©pais Ă  souhait, mais son immobilisme ou mĂŞme sa bĂŞtise sont des tares perpĂ©tuelles.</p>
<p>En lâ€™Ă©tat, Microsoft dĂ©pense une infime partie des ressources nĂ©cessaires Ă  la bataille. Pourtant, lâ€™argent est disponible, mais ce foutu immobilisme et mauvais jugement des dirigeants rendent les efforts vains. Le grignotage par micro pourcentage nâ€™est pas la bonne solution; les partenariats avec Yahoo!, Facebook, Apple, RIM et Firefox sont bĂ©nĂ©fiques, mais clairement insuffisants. En passant, Facebook n&#8217;est pas une option vaine, mais cet Ă©co-systĂ¨me Ă  l&#8217;intĂ©rieur du Web devrait sortir de son recoin et cela ne semble pas Ă  l&#8217;ordre du jour.</p>
<p>Un des gros points faibles identifiĂ©s chez Google est finalement sa plus grande forceÂ : la publicitĂ©. Les annonceurs sont dĂ©sespĂ©rĂ©s de trouver une alternative viable Ă  Adwords car le systĂ¨me dâ€™enchĂ¨res est devenu carrĂ©ment dĂ©ment sur certains secteurs.</p>
<p>Bing devrait lancer une stratĂ©gie marketing massive et globale afin de draguer lâ€™utilisateur, puis ensuite focaliser sur la rĂ©gie publicitaire afin de proposer cette alternative salvatrice au gouffre Ă  budgets publicitaires qui sâ€™appelle Adwords &#8211; plus simple Ă  dire qu&#8217;Ă  faire apparemment.</p>
<p>Le souci tient dans le fait que Microsoft souffre dâ€™un complexe dâ€™infĂ©rioritĂ© vis-Ă -vis de GoogleÂ ; exactement le mĂŞme que celui qui impliquait Apple. Avant de crĂ©er une situation favorable, la mentalitĂ© doit changer au plus haut niveau de la direction chez Microsoft.</p>
<p>Les erreurs marketing, notamment les lancements dispersĂ©s dans le monde, sâ€™amoncellent par-dessus le complexe dâ€™infĂ©rioritĂ© et le manque de budget pour diminuer drastiquement les chances de Bing. Mettre les moyens n&#8217;est pas un problĂ¨me, donc reste Ă  trouver la bonne solution qui n&#8217;est pas au-dessus des capacitĂ©s de Microsoft.</p>
<p>Pourtant, je continue de croire que Bing puisse se rĂ©veiller un jour. Jâ€™aimerai vraiment que ma prĂ©diction soit une nouvelle fois vĂ©ridique, mais les bĂŞtises rĂ©guliĂ¨res de Microsoft me permettent de douter.</p>
<p><a href="http://www.fastcompany.com/1694805/five-things-you-should-know-about-the-new-bing-facebook-features">Source image intro</a>.</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.laurentbourrelly.com/blog/1005.php/feed</wfw:commentRss>
		<slash:comments>41</slash:comments>
		</item>
		<item>
		<title>Blekko, le moteur de recherche intelligent</title>
		<link>http://www.laurentbourrelly.com/blog/888.php</link>
		<comments>http://www.laurentbourrelly.com/blog/888.php#comments</comments>
		<pubDate>Mon, 03 Jan 2011 16:30:40 +0000</pubDate>
		<dc:creator>Laurent</dc:creator>
				<category><![CDATA[Moteurs de recherche]]></category>
		<category><![CDATA[Bing]]></category>
		<category><![CDATA[Blekko]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[moteur de recherche]]></category>
		<category><![CDATA[Yahoo]]></category>

		<guid isPermaLink="false">http://www.laurentbourrelly.com/blog/?p=888</guid>
		<description><![CDATA[Jâ€™ai un brouillon datĂ© de septembre 2010 intitulĂ© Blekko quâ€™il est grand temps de sortir des cartons. Ce moteur de recherche qui fonctionne sur le concept du slashtag permettant de customizer les rĂ©sultats est une alternative non nĂ©gligeable Ă  Google qui est toujours plus dominĂ© par les spammeurs, rĂ©fĂ©renceurs et autres web marketeurs. Pour faire [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2011/01/blekko-logo.jpg" rel="shadowbox[sbpost-888];player=img;"><img class="alignleft size-thumbnail wp-image-893" style="border: 0pt none; margin: 0px 10px;" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2011/01/blekko-logo-150x150.jpg" alt="Logo du moteur Blekko" width="120" height="120" /></a>Jâ€™ai un brouillon datĂ© de septembre 2010 intitulĂ© <a href="http://blekko.com/">Blekko</a> quâ€™il est grand temps de sortir des cartons.</p>
<p>Ce moteur de recherche qui fonctionne sur le concept du slashtag permettant de customizer les rĂ©sultats est une alternative non nĂ©gligeable Ă  Google qui est toujours plus dominĂ© par les spammeurs, rĂ©fĂ©renceurs et autres web marketeurs.  <span id="more-888"></span></p>
<p>Pour faire connaissance avec <a href="http://blekko.com/">Blekko</a>, lâ€™inĂ©vitable Scobleizer nous gratifie dâ€™une longue interview vidĂ©o.</p>
<p><a href="http://www.youtube.com/v/tlESXiyyA5M " rel="shadowbox[sbpost-888];player=swf;width=640;height=385;"><img class="alignnone size-full wp-image-890" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2011/01/video-blekko.png" alt="PrĂ©sentation vidĂ©o de Blekko" width="451" height="276" /></a></p>
<p>Ayant eu le privilĂ¨ge de faire partie desÂ  premiers invitĂ©s Ă  la Beta de Blekko (<a href="http://blekko.com/user/laurentbourrelly">lien vers mon profil</a>), jâ€™ai commencĂ© par crĂ©er le <a href="http://blekko.com/ws/+/view+/laurentbourrelly/referencement">slashtag rĂ©fĂ©rencement</a> en nettoyant la requĂŞte des offres commerciales, laissant uniquement les sources dâ€™info Ă  disposition.<br />
On <em>slash in</em> les bons rĂ©sultats et on <em>slash out</em> les indĂ©sirables. Le concept est dâ€™obtenir le Web quâ€™on veut.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2011/01/blekko-referencement.png" rel="shadowbox[sbpost-888];player=img;"><img class="alignnone size-medium wp-image-892" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2011/01/blekko-referencement-143x300.png" alt="Slashtage referencement sur Blekko" width="143" height="300" /></a></p>
<h1>Spam toujours</h1>
<p>Lâ€™emprise des professionnels de la visibilitĂ© Web est totale sur Google. Pour garder un semblant de naturel, le moteur de recherche a trouvĂ© comme palliatif de valoriser Wikipedia qui squatteÂ  un rĂ©sultat quasiment sur toutes les premiĂ¨res pages de Google.<br />
Autrement, dur de se faire une place au soleil sans prendre en compte le rĂ©fĂ©rencement &#8211; que Ă§a soit du cĂ´tĂ© obscur de La Force ou Mr Propre.</p>
<p>A partir de ce constat, Blekko propose une alternative assez intĂ©ressante.<br />
Le principe de base se base sur le concept du slashtag ou rĂ©sultat de recherche sur-mesure qui est Ă©ditĂ© manuellement par les utilisateurs et modĂ©rĂ© par lâ€™Ă©quipe de Blekko.</p>
<p>Au fait, les amis <a href="http://www.apocalx.com/">ApocalX</a> et <a href="http://www.referenceurdulundi.blogue.fr/">Jeffer</a> avait lancĂ© <a href="http://www.google-filter.com/">Google Filter</a> en 2004 qui avait aussi pour concept de ne plus voir certains sites dans les rĂ©sultats de recherche Google.</p>
<p>Wikipedia avait aussi lancĂ© un moteur basĂ© sur la participation des internautes, mais le projet Wikia fĂ»t avortĂ© en 2009 pour le transformer en un <a href="http://answers.wikia.com/">Yahoo! Answers like</a>.</p>
<p>Google me permet de vivre confortablement depuis 2004 et jâ€™ai bien profitĂ© des belles heures du MFA (MadeForAdsense) ou de lâ€™affiliation. Aujourdâ€™hui, je me tourne vers dâ€™autres modĂ¨les car jâ€™ai toujours dans lâ€™esprit que les filons sont rapidement saturĂ©s sur Internet. En fait, jâ€™ai tort car fourguer des pages au moteur dans lâ€™espoir de racoler un clic publicitaire, un formulaire ou une commission de vente marche toujours aussi bien.<br />
La concurrence est plus rude, mais le moteur est toujours aussi faiblard Ă  lutter contre toutes les formes plus ou moins agressives de spam. Certains comme <a href="http://www.kryter.com/">Kryter</a> ont mĂŞme fait de belles pirouettes commerciales sous prĂ©texte de cibler la <em>Longue TraĂ®ne</em>. Le gavage du Google va perdurer tout autant que pour les canards et les oies dont nous avons dĂ©gustĂ© le foie Ă  NoĂ«l.<br />
En passant, Matt Cutts mâ€™a fait sourire en lanĂ§ant un tweet solennel pour annoncer que <a href="http://twitter.com/mattcutts/status/19152836789014528#">le cloaking sera en ligne de mire</a>.Â  Brrr la planĂ¨te Black Hat SEO doit ĂŞtre verte de trouille.<br />
Câ€™est bien beau de compter sur des effets dâ€™annonce, mais reste Ă  prouver une vĂ©ritable efficacitĂ©.</p>
<p>Aujourdâ€™hui, jâ€™ai bien lâ€™impression que le momentum est en faveur de Blekko car il y a le spam et les rĂ©fĂ©renceurs qui sont omniprĂ©sents, mais les fermes de contenu sont aussi des rĂ©sultats quâ€™on ne souhaite pas forcĂ©ment consulter. Les <a href="http://www.ehow.com/">eHow</a>, <a href="http://www.about.com/">About</a> et autres champions du contenu de (trĂ¨s) basse qualitĂ© ayant pour seul but de racoler vers un clic publicitaire sont bien valorisĂ© par le moteur, mais commencent sĂ©rieusement Ă  gaver lâ€™utilisateur avancĂ©.</p>
<p>Que Ă§a soit <a href="http://battellemedia.com/archives/2011/01/maybe_i_was_right.php">John Battelle</a>, <a href="http://www.seomoz.org/blog/im-getting-more-worried-about-the-effectiveness-of-webspam">Rand Fishkin</a>, <a href="http://www.keeg.fr/2010/07/13/le-spam-cest-le-business-de-google/">Keeg</a> ou <a href="http://www.laurentbourrelly.com/blog/378.php">moi-mĂŞme</a> (juste quelques liens parmi tant d&#8217;autres), certains professionnels mettent maintenant sĂ©rieusement en doute la capacitĂ© de Google Ă  endiguer le spam.<br />
MĂŞme <a href="http://techcrunch.com/2011/01/01/why-we-desperately-need-a-new-and-better-google-2/">TechCrunch</a> ou <a href="http://www.slate.fr/lien/32255/google-spam-pub">Slate</a> s&#8217;y mettent en citant Ă©galement Blekko comme une alternative Ă  noter.</p>
<h3>Outil pour le rĂ©fĂ©renceur</h3>
<p>La grosse surprise de Blekko arrive en cliquant sur le bouton SEO qui est proposĂ© Ă  cĂ´tĂ© dâ€™un rĂ©sultat.  Contrairement Ă  la console <em>Google Webmaster Tools</em> ou celles de Bing et Yahoo!, les informations divulguĂ©es par Blekko sont transparentes. Je rappelle quâ€™il existe parfois un fossĂ© entre ce qui se trame rĂ©ellement dans lâ€™index dâ€™un moteur tel que Google et se quâ€™il retourne dans un interface comme les rĂ©sultats de recherche ou la console webmaster. Ne prenez jamais rien pour argent comptant!</p>
<p>Plusieurs onglets sont Ă  disposition : liens entrants, statistiques de crawl, pages indexĂ©es, comparaison entre deux sites et contenu dupliquĂ©. Il nâ€™y a que les rĂ©sultats du contenu dupliquĂ© qui mâ€™ont laissĂ© dubitatif. Cette partie doit ĂŞtre amĂ©liorĂ©e car câ€™est loin de mâ€™avoir convaincu pour lâ€™instant. Sinon, tout le reste est intĂ©ressant, mĂŞme si câ€™est trop expĂ©rimental pour ĂŞtre utilisĂ© sur le plan opĂ©rationnel, notamment dans le cadre dâ€™un audit rĂ©fĂ©rencement.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2011/01/laurentbourrelly-vs-webrankinfo.png" rel="shadowbox[sbpost-888];player=img;"><img class="alignnone size-medium wp-image-891" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2011/01/laurentbourrelly-vs-webrankinfo-300x297.png" alt="Comparaison entre Webrankinfo.com et LaurentBourrelly.com par Blekko" width="300" height="297" /></a></p>
<p>Le moteur met aussi Ă  disposition le flux RSS de chaque slashtag ou divers widgets Ă  utiliser sur son propre site, ainsi qu&#8217;une toolbar.</p>
<p>Une autre fonctionnalitĂ© intĂ©ressante que je viens de dĂ©couvrir sur Blekko concerne le bouton Adsense qui apparait lorsqu&#8217;on entre le slashtag /adsense=XXX (XXX Ă©tant le numĂ©ro d&#8217;ID Ă  rechercher).<br />
Il y a aussi un onglet Adsense qui apparaĂ®t si vous cherchez un nom de domaine qui contient les publicitĂ©s Google. En cliquant dessus, vous avez tous les autres sites du compte Adsense.</p>
<p>Certains grognent par rapport Ă  cette fonctionnalitĂ© ou le non-respect du tag noarchive, mais je trouve que la transparence est salvatrice.</p>
<h3>Blekko Techno</h3>
<p>Le moteur Blekko se base sur la technologie <a href="http://www.scoutjet.com/">ScoutJet</a> pour indexer le contenu sur le Web. DĂ¨s son apparition en 2008, Scoutjet Ă©tait pris pour un robot spammeur, mais sa crĂ©dibilitĂ© est remontĂ©e grĂ˘ce au partenariat avec Blekko.</p>
<p>Pour lâ€™instant, lâ€™index est minimaliste comparĂ© Ă  celui de Google, mais ce moteur se place en alternative plutĂ´t qu&#8217;en <em>Google Killer</em>. D&#8217;ailleurs, en partant du principe que plus de 90% des pages indexĂ©es par Google ne sont pas vraiment intĂ©ressantes, l&#8217;index du trublion ne devrait jamais devenir massif.</p>
<p>Le <em>HostRank</em> chez Blekko est plutĂ´t nĂ©buleux. Je ne sais pas comment il est gĂ©nĂ©rĂ©, mais comme pour tout indice, c&#8217;est celui qui a la plus grosse qui gagne.</p>
<p>Comme d&#8217;habitude, le franĂ§ais est une langue difficile Ă  apprĂ©hender pour un moteur de recherche et les accents sont zappĂ©s des slashtags.</p>
<p>Pour tester un moteur de recherche, le truc bien connu consiste Ă  entrer une <a href="http://blekko.com/ws/laurent+bourrelly">requĂŞte correspondant Ă  sa propre identitĂ©</a> &#8211; en admettant ĂŞtre bien visible sur le Web. Câ€™est une requĂŞte quâ€™on connait bien et qui est maĂ®trisĂ©e pour les plus prĂ©cautionneux en e-rĂ©putation.</p>
<p>A ce niveau, câ€™est vraiment pas mal pour Blekko car j&#8217;ai seulement 2 rĂ©sultats qui me semblaient inintĂ©ressants ou inadĂ©quats, mais par contre il en manque quelques uns quâ€™il faudra que je mâ€™empresse dâ€™ajouter. C&#8217;est Ă§a aussi le truc magique car je peux proposer des nouvelles ressources au moteur. Nous sommes aux antipodes d&#8217;un moteur fermĂ© tel que Google.<br />
En cherchant des personnalitĂ©s bien plus connues et intĂ©ressantes que ma petite personne, je suis tout aussi ravi des rĂ©sultats. En clair, l&#8217;information retournĂ©e est beaucoup plus limpide sur tous les secteurs que j&#8217;ai testĂ©. Chercher des blogs se rĂ©vĂ¨le aussi particuliĂ¨rement intĂ©ressant.</p>
<p>Maintenant, pour compliquer un peu la recherche, je vais taper <a href="http://blekko.com/ws/dishwasher">Dishwasher</a> (lave-vaisselle en anglais) qui avait rendu <a href="http://paul.kedrosky.com/archives/2009/12/dishwashers_dem.html">Paul KedroskyÂ  en colĂ¨re</a>.<br />
MĂŞme si ce nâ€™est pas parfait (un domaineur en prems), les rĂ©sultats de recherche nâ€™ont rien Ă  voir avec ceux de Google qui sont juste pitoyables.<br />
Ce qui est remarquable se dĂ©roule lorsque jâ€™ajoute lâ€™Ă©lĂ©ment Â«<a href="http://blekko.com/ws/buy+dishwasher"><em>buy</em></a>Â». Maintenant, les rĂ©sultats de recherche sont largement diffĂ©rents du prĂ©cĂ©dent. Câ€™est un mix dâ€™information pour mieux acheter, en opposition totale avec les gros racoleurs quâ€™on retrouve sur Google.</p>
<h4>Alternative viable ?</h4>
<p>En tout cas, je ne sais pas si câ€™est Blekko qui est tellement gĂ©nial ou Google qui devient ennuyeux, mais cela serait salvateur de voir apparaĂ®tre une alternative diffĂ©rente qui prenne de lâ€™ampleur. Le seul autre survivant, Bing, reste en deĂ§Ă  du leader du point de vue technologique.<br />
Fondamentalement, un moteur 100% basĂ© sur des algorithmes restera idiot puisquâ€™il ne comprend pas ce quâ€™il lit.<br />
MalgrĂ© tous les efforts des hordes de talentueux ingĂ©nieurs, le constat est implacable car Google est toujours aussi pourri.</p>
<p>Maintenant, reste Ă  voir comment cette alternative saura passer le point critique aprĂ¨s que les early-adopters et autres<a href="http://www.wordstream.com/blog/ws/2010/11/05/blekko-search-engine-for-seos"> leaders dâ€™opinion</a> auront plaidĂ© en sa faveur. Câ€™est sans doute un peu trop geek pour le commun des utilisateurs qui nâ€™a mĂŞme pas encore compris que Goolge comprenait des dizaines dâ€™<a href="http://www.laurentbourrelly.com/blog/886.php">opĂ©rateurs fantastiques</a>.<br />
Peut-ĂŞtre que Google correspond mieux Ă  lâ€™utilisateur lambda, mais celui qui peut se considĂ©rer dâ€™un niveau avancĂ© devrait se dĂ©lecter sur Blekko.</p>
<p>En fait, le secteur de la recherche dâ€™information nâ€™est pas pĂ©nĂ©trĂ© par de nombreuses entreprises. MalgrĂ© lâ€™enjeu gigantesque et la cagnotte gargantuesque, peu se risquent Ă  attaquer frontalement le monstre Google. Peut-ĂŞtre que les pets foireux du passĂ© tels que <a href="http://www.quaero.org/">Quaero</a> (annoncĂ© comme <em>Google Killer</em> pour devenir un projet expĂ©rimental ignorĂ©), lâ€™Ă©chec cuisant de Wikia, la descente aux enfers de Yahoo! ou lâ€™incapacitĂ© de Microsoft Ă  contrer le leader sont des facteurs dĂ©courageants pour les entrepreneurs ? En plus, c&#8217;est vraiment amusant et passionnant de s&#8217;intĂ©resser Ă  la recherche d&#8217;information en ligne.</p>
<p>Bref, dĂ©couvrez par vous-mĂŞme lâ€™intĂ©rĂŞt de Blekko qui fera peut-ĂŞtre partie des prĂ©dictions intĂ©ressantes pour 2011. Parfaite transition pour souhaiter pleins de bonnes choses Ă  tous mes lecteurs.<br />
<span style="text-decoration: line-through;">Ayant une centaine d&#8217;invitations Ă  disposition, <a href="mailto:contact@laurenbourrelly.com?subject=Invitation Blekko">contactez-moi</a> pour ĂŞtre invitĂ© sur Blekko.<br />
</span>Plus besoin d&#8217;invitation. Passez directement par la <a href="https://blekko.com/join?d=http%3A%2F%2Fblekko.com">page d&#8217;inscription</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.laurentbourrelly.com/blog/888.php/feed</wfw:commentRss>
		<slash:comments>33</slash:comments>
		</item>
		<item>
		<title>La recherche dâ€™information sans chercher</title>
		<link>http://www.laurentbourrelly.com/blog/807.php</link>
		<comments>http://www.laurentbourrelly.com/blog/807.php#comments</comments>
		<pubDate>Fri, 23 Jul 2010 09:19:02 +0000</pubDate>
		<dc:creator>Laurent</dc:creator>
				<category><![CDATA[Moteurs de recherche]]></category>
		<category><![CDATA[Ami Singhal]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Matt Cutts]]></category>
		<category><![CDATA[moteur de recherche]]></category>
		<category><![CDATA[Mountain View]]></category>
		<category><![CDATA[recherche d'informatio]]></category>

		<guid isPermaLink="false">http://www.laurentbourrelly.com/blog/?p=807</guid>
		<description><![CDATA[Un dĂ©fi pris trĂ¨s au sĂ©rieux par Google concerne lâ€™acquisition dâ€™information sans avoir Ă  effectuer de recherche. Cette technologie nâ€™est pas encore prĂŞte, mais câ€™est une prĂ©tention quâ€™affiche clairement le moteur de recherche. Encore une fois, entre utilitĂ© de la fonctionnalitĂ© et protection des donnĂ©es, notre cĹ“ur balance. Câ€™est au travers dâ€™une interview trĂ¨s intĂ©ressante [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/07/amit-singhal.jpg" rel="shadowbox[sbpost-807];player=img;"><img class="alignleft size-thumbnail wp-image-808" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/07/amit-singhal-142x150.jpg" alt="Photo de Amit Singhal - chef ingĂ©nieur Google" width="91" height="96" /></a>Un dĂ©fi pris trĂ¨s au sĂ©rieux par Google concerne lâ€™acquisition dâ€™information sans avoir Ă  effectuer de recherche.</p>
<p>Cette technologie nâ€™est pas encore prĂŞte, mais câ€™est une prĂ©tention quâ€™affiche clairement le moteur de recherche. Encore une fois, entre utilitĂ© de la fonctionnalitĂ© et protection des donnĂ©es, notre cĹ“ur balance.<br />
<span id="more-807"></span></p>
<p>Câ€™est au travers dâ€™une <a href="http://www.engadget.com/2010/07/16/googles-amit-singhal-tells-us-about-the-dreams-search-engines-a/">interview</a> trĂ¨s intĂ©ressante de <a href="http://singhal.info/">Amit Singhal</a>, chef ingĂ©nieur de lâ€™algorithme Google, que jâ€™apprends les Ă©volutions prochaines sur lesquelles travaillent les Ă©quipes de Mountain View. Il est toujours important de connaĂ®tre dâ€™autres sons de cloche que ceux du consensuel Matt Cutts. Dâ€™ailleurs, Amit Singhal est beaucoup plus crĂ©dible lorsquâ€™il sâ€™agit de parler dâ€™Ă©volutions dâ€™algorithmes puisque Matt Cutts est cantonnĂ© Ă  la lutte contre le spam.</p>
<p>Les cinq premiers points Ă©voquĂ©s par Amit Singhal ne me surprennent pas : recherche au-delĂ  du texte, recherche au-delĂ  du langage, recherche personnalisĂ©e, recherche en temps rĂ©elle et sĂ©mantique appliquĂ©e Ă  la recherche dâ€™information.</p>
<p>Par contre, je mâ€™arrĂŞte un moment sur le sixiĂ¨me point&#8230;</p>
<h1>La recherche sans chercher</h1>
<p>Le but de lâ€™opĂ©ration consiste Ă  procurer des Ă©lĂ©ments dâ€™information sans avoir Ă  entreprendre des recherches.</p>
<p>Lâ€™exemple pris par Amit explique que vous voulez acheter une batte de cricket (seul un indien pouvait prendre le cricket en exemple) car votre ancienne batte est cassĂ©e et que vous allez avoir une heure de temps libre demain. Votre mobile connaĂ®t votre besoin car il est inscrit dans votre ToDo. Le mobile est Ă©galement au courant de votre agenda. Le reste des informations nĂ©cessaire est aussi maĂ®trisĂ© par le tĂ©lĂ©phone : localisation et autres informations locales. Du coup, le mobile peut vous envoyer une information qui propose un crĂ©neau horaire et un magasin pour acheter la batte et revenir Ă  temps au bureau pour le prochain rendez-vous.</p>
<h3>Bien ou pas ?</h3>
<p>La technologie nous assiste toujours plus. IlÂ  nâ€™y a quâ€™Ă  voir lâ€™App Store dâ€™Apple ou le Android Market de Google. DĂ©sormais, il y a une app quasiment pour tous nos besoins et si Ă§a nâ€™existe pas encore, il est probable quâ€™un dĂ©veloppeur travaille dessus.<br />
Cependant, la vision de Google pousse la technologie vers un domaine encore plus prĂ©cis en proposant des informations en amont de la demande.</p>
<p>Au premier abord, cela peut paraĂ®tre intĂ©ressant. Puis, viennent rapidement les interrogations Ă  propos du respect de la vie privĂ©e et du contrĂ´le.</p>
<p>A mon humble avis, rien nâ€™empĂŞchera Google ou un autre (Apple?) de proposer ce type de fonctionnalitĂ© un jour prochain. Les soucis dĂ©ontologiques seront Ă©crasĂ©s comme ils le sont habituellement, puis nous serons toujours plus profilĂ©s et tracĂ©s.<br />
Tiens, les participants au billet synchronisĂ© sur <a href="http://www.laurentbourrelly.com/blog/531.php">le futur de la recherche dâ€™information</a> n&#8217;avaient pas vu l&#8217;enjeu de la recherche sans chercher.Â  Pour ma part, jâ€™avoue ĂŞtre totalement passĂ© Ă  cĂ´tĂ© de cette vision de lâ€™Ă©volution pour la recherche dâ€™information. Pourtant, Ă§a semble Ă©vident que Google se dirige vers ce type de technologie.</p>
<p>Le choix va vite devenir extrĂŞme : adopter ou repousser la technologie. Lâ€™entre-deux risque dâ€™ĂŞtre de plus en plus difficile.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.laurentbourrelly.com/blog/807.php/feed</wfw:commentRss>
		<slash:comments>29</slash:comments>
		</item>
		<item>
		<title>Et si on parlait dâ€™Exalead ?</title>
		<link>http://www.laurentbourrelly.com/blog/748.php</link>
		<comments>http://www.laurentbourrelly.com/blog/748.php#comments</comments>
		<pubDate>Wed, 09 Jun 2010 09:55:24 +0000</pubDate>
		<dc:creator>Laurent</dc:creator>
				<category><![CDATA[Moteurs de recherche]]></category>
		<category><![CDATA[Exalead]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Microsoft]]></category>
		<category><![CDATA[moteur de recherche]]></category>
		<category><![CDATA[Quaero]]></category>
		<category><![CDATA[RĂ©fĂ©rencement]]></category>
		<category><![CDATA[rĂ©fĂ©renceur]]></category>

		<guid isPermaLink="false">http://www.laurentbourrelly.com/blog/?p=748</guid>
		<description><![CDATA[Parmi les fleurons de la haute technologie franĂ§aise, on peut citer Exalead en bonne place. Les solutions proposĂ©es par lâ€™Ă©diteur de logiciels sont pointues et elles paraissent performantes. Dâ€™un point de vue rĂ©fĂ©renceur, jâ€™aime bien suivre les Ă©volutions du moteur de recherche Exalead puisqu&#8217;il a toujours focalisĂ© sur la sĂ©mantique. Câ€™est par le biais dâ€™un [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/moteur-recherche.png" rel="shadowbox[sbpost-748];player=img;"><img class="alignleft size-thumbnail wp-image-749" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/moteur-recherche-150x150.png" alt="Le moteur de recherche" width="120" height="120" /></a>Parmi les fleurons de la haute technologie franĂ§aise, on peut citer <a href="http://www.exalead.com/">Exalead</a> en bonne place. Les solutions proposĂ©es par lâ€™Ă©diteur de logiciels sont pointues et elles paraissent performantes.<br />
Dâ€™un point de vue rĂ©fĂ©renceur, jâ€™aime bien suivre les Ă©volutions du moteur de recherche Exalead puisqu&#8217;il a toujours focalisĂ© sur la sĂ©mantique.</p>
<p>Câ€™est par le biais dâ€™un article prĂ©sentant le bilan de <a href="http://www.quaero.org/">Quaero</a>, le soi-disant moteur de recherche europĂ©en, que je suis retombĂ© sur Exalead puisquâ€™il fait partie des principaux partenaires.<br />
<span id="more-748"></span></p>
<h1>Exalead</h1>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/Exalead.png" rel="shadowbox[sbpost-748];player=img;"><img class="alignnone size-full wp-image-750" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/Exalead.png" alt="Le moteur de recherche Exalead" width="294" height="112" /></a><br />
Pour rappel, Exalead Ă©dite des logiciels B2B basĂ© sur une technologie de recherche qui essaye de se dĂ©marquer des tĂ©nors du marchĂ©. Depuis le dĂ©but, on sentait que le moteur franĂ§ais sâ€™embarquait sur une tangente intĂ©ressante en prenant une approche sĂ©mantique. A la base, il sâ€™agit dâ€™extraire des mots clĂ©s associĂ©s Ă  un document, permettant de dĂ©terminer au mieux le vĂ©ritable sens dâ€™un texte. Aujourdâ€™hui, je reste dubitatif sur le rĂ©el succĂ¨s; mĂŞme si personne ne peut nier que câ€™est trĂ¨s intĂ©ressant. Au niveau des chiffres, lâ€™index contient 16 milliards de pages Web et 1 milliard dâ€™images.<br />
Le mieux est dâ€™essayer par soi-mĂŞme en regardant ce que ressort le moteur pour les Termes associĂ©s. Parfois câ€™est pertinent, mais souvent câ€™est totalement Ă  cĂ´tĂ© de la plaque.</p>
<p>A vrai dire, le <a href="http://www.exalead.com/search/">moteur de recherche d&#8217;Exalead</a> est toujours restĂ© plutĂ´t confidentiel. Je ne sais pas si vous le voyez passer comme referer dans vos stats, mais ce nâ€™est pas courant.<br />
Quoi que la vĂ©ritable concurrence sâ€™est toujours situĂ©e au niveau des autres Ă©diteurs de logiciels similaires, plutĂ´t quâ€™au niveau des principaux moteurs qui ont des modĂ¨les Ă©conomiques bien diffĂ©rents.</p>
<h2>Les progrĂ¨s de la recherche dâ€™information</h2>
<p>MalgrĂ© les avancĂ©es Ă©videntes dans le domaine de la recherche dâ€™information, dont celles de Google sont les plus en vues, il demeure un gros souci sur le plan fondamental : le moteur de recherche est idiot.</p>
<p>Je veux dire par lĂ  quâ€™il ne comprend toujours pas bien le contenu quâ€™il indexe.</p>
<p>Il est possible de disserter pendant longtemps sur les progrĂ¨s et le futur de la recherche d&#8217;information comme nous Ă©tions plusieurs Ă  discuter lors du <a href="http://www.laurentbourrelly.com/blog/531.php">billet synchronisĂ©</a>. Certains thĂ©orĂ¨mes sont vraiment intĂ©ressants avec le Latent Semantic Indexing (LSI) en tĂŞte, puisquâ€™il fait toujours couler beaucoup dâ€™encre numĂ©rique parmi les rĂ©fĂ©renceurs et autres observateurs du secteur de la recherche dâ€™information. Le dernier article que jâ€™ai lu sur le <a href="http://bravenewworld.fr/referencement-seo/latent-semantic-indexing-lsi-637/">LSI</a> par lâ€™ami Didier Sampaolo est trĂ¨s intĂ©ressant; on sent bien que câ€™est trĂ¨s tentant dâ€™y succomber de maniĂ¨re applicative. Pour ma part, je lâ€™utilise seulement pour la thĂ©orie, mais un prochain article viendra expliquer tout cela en dĂ©tails.</p>
<p>Donc, pour lâ€™instant nous avons droit Ă  aux prĂ©liminaires de la sĂ©mantique appliquĂ©e Ă  la recherche dâ€™information, mais les principaux moteurs ne sont pas aussi sophistiquĂ©s quâ€™on voudrait bien le croire si on sâ€™interroge sur la comprĂ©hension du sens des documents quâ€™ils indexent.</p>
<h3>Quaero</h3>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/quaero.jpg" rel="shadowbox[sbpost-748];player=img;"><img class="alignnone size-full wp-image-751" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/quaero.jpg" alt="Le moteur de recherche Quaero" width="456" height="139" /></a><br />
Les observateurs du secteur de la recherche dâ€™information se rappellent sans doute lâ€™annonce de lancement du projet Quaero par Jacques Chirac. A lâ€™Ă©poque, il sâ€™agissait de sâ€™attaquer frontalement Ă  l&#8217;hĂ©gĂ©monie de Google par le biais dâ€™un moteur de recherche europĂ©en.</p>
<p>Depuis plus rien jusquâ€™Ă  lâ€™annonce du <a href="http://blog.exalead.fr/2010/05/31/quaero-le-resultat-de-2-ans-de-collaboration/">bilan des deux ans</a>.</p>
<p>Au premier abord, tout cela paraĂ®t prometteur : 300 millions dâ€™euros de budget sur cinq ans pour 300 chercheurs qui ont publiĂ© 230 publications scientifiques et 20 demandes de brevets. Jâ€™en sais fichtre rien si câ€™est beaucoup ou peu avec tous ces sous et ces savants, mais 20 brevets semble dĂ©jĂ  ĂŞtre un bilan intĂ©ressant. Cela aboutirait sur un moteur de recherche qui analyse automatiquement les contenus vidĂ©o. Le programme inclut Ă©galement la traduction instantanĂ©e, une tĂ©lĂ©vision personnalisable et dâ€™autres petites choses comme la recherche par similaritĂ©/caractĂ©ristique colorimĂ©trique et le rĂ©sumĂ© automatique de morceaux de musique. Bref, on sent bien que lâ€™accent est mis sur lâ€™indexation du contenu multimĂ©dia, mais silence radio sur une Ă©ventuelle concurrence avec Google.</p>
<p>Le rĂ©sultat est assez sympathique lorsquâ€™on regarde lâ€™indexation des <a href="http://www.elysee.fr/president/mediatheque/videos/videotheque.10.html">vidĂ©os sur le site Elysee.fr</a> avec tout le contenu audio qui est transformĂ© en texte.</p>
<p>AprĂ¨s, je me perds dans qui fait quoi dans ce projet car les <a href="http://www.quaero.org/modules/movie/scenes/home/index.php?fuseAction=article&amp;rubric=presentation&amp;article=partenaires">partenaires de Quaero</a> prĂ©servent apparemment la primeur et la propriĂ©tĂ© de leurs dĂ©couvertes, donc pas Ă©vident de savoir si câ€™est Quaero ou Exalead qui a installĂ© le moteur sur le site de lâ€™ElysĂ©e ou ailleurs, Ă©tant donnĂ© que les deux ont lâ€™air de se fĂ©liciter des rĂ©sultats.</p>
<h4>Conclusion</h4>
<p>Au travers de lâ€™exemple Exalead et Quaero, on peut sentir que les choses bougent. Bien entendu, ils ne sont pas les seuls Ă  bosser sur le futur de la recherche dâ€™information. Les moyens de sociĂ©tĂ©s privĂ©es comme Google et Microsoft sont gigantesques et dâ€™autres sont Ă©galement sur les rails pour nous sortir le moteur du futur.<br />
Mon propos nâ€™Ă©tait pas de faire un Ă©tat des lieux complet ou partir dans des explications pseudo techniques, mais plutĂ´t de montrer quâ€™il se passe des choses en France. Hormis Exalead et Quaero, il y a des recherches intĂ©ressantes dans plusieurs universitĂ©s franĂ§aises, mais on dirait tout de mĂŞme que lâ€™essentiel reste la garde des chercheurs de la Sillicon Valley.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.laurentbourrelly.com/blog/748.php/feed</wfw:commentRss>
		<slash:comments>10</slash:comments>
		</item>
		<item>
		<title>Des jolis graphes et des maths pour expliquer (un bout de) lâ€™algorithme Google</title>
		<link>http://www.laurentbourrelly.com/blog/702.php</link>
		<comments>http://www.laurentbourrelly.com/blog/702.php#comments</comments>
		<pubDate>Wed, 02 Jun 2010 15:45:36 +0000</pubDate>
		<dc:creator>Laurent</dc:creator>
				<category><![CDATA[Moteurs de recherche]]></category>
		<category><![CDATA[algorithme]]></category>
		<category><![CDATA[analyse]]></category>
		<category><![CDATA[Ben Hendrickson]]></category>
		<category><![CDATA[classement]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[graphique]]></category>
		<category><![CDATA[Linkscape]]></category>
		<category><![CDATA[modĂ©lisation]]></category>
		<category><![CDATA[moteur de recherche]]></category>
		<category><![CDATA[positionnement]]></category>
		<category><![CDATA[Rand Fishkin]]></category>
		<category><![CDATA[RĂ©fĂ©rencement]]></category>
		<category><![CDATA[rĂ©fĂ©renceur]]></category>
		<category><![CDATA[rĂ©sultats de recherche]]></category>
		<category><![CDATA[SEOMoz]]></category>

		<guid isPermaLink="false">http://www.laurentbourrelly.com/blog/?p=702</guid>
		<description><![CDATA[Cela faisait un moment que j&#8217;avais entamĂ© la traduction (autorisĂ©e) de l&#8217;article suivant. Il Ă©tait oubliĂ© au fond d&#8217;un rĂ©pertoire, puis je suis retombĂ© par hasard sur l&#8217;article original de SEOmoz rĂ©digĂ© par Rand Fishkin et Ben Hendrickson. AprĂ¨s une nouvelle lecture, j&#8217;ai pensĂ© qu&#8217;il serait vraiment intĂ©ressant de terminer la traduction pour partager cette [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/google-logo.jpg" rel="shadowbox[sbpost-702];player=img;" title="google logo"><img class="size-full wp-image-721 alignleft" style="border: 0pt none; margin: 0px 10px;" title="google logo" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/google-logo.jpg" alt="algorithme de Google" width="163" height="116" /></a></p>
<p>Cela faisait un moment que j&#8217;avais entamĂ© la traduction (autorisĂ©e) de l&#8217;article suivant. Il Ă©tait oubliĂ© au fond d&#8217;un rĂ©pertoire, puis je suis retombĂ© par hasard sur <a href="http://www.seomoz.org/blog/googles-algorithm-pretty-charts-math-stuff">l&#8217;article original de SEOmoz</a> rĂ©digĂ© par <a href="http://www.seomoz.org/users/view/63">Rand Fishkin</a> et <a href="http://www.seomoz.org/team/ben">Ben Hendrickson</a>.<br />
AprĂ¨s une nouvelle lecture, j&#8217;ai pensĂ© qu&#8217;il serait vraiment intĂ©ressant de terminer la traduction pour partager cette analyse passionnante avec ceux qui sont en dĂ©licatesse avec la langue de Shakespeare.<br />
Le but de cette analyse est de comprendre un peu mieux l&#8217;algorithme de Google en effectuant une corrĂ©lation de donnĂ©es sur la base de l&#8217;index Linkscape.<br />
<span id="more-702"></span></p>
<h1>CorrĂ©lation de donnĂ©es</h1>
<p><a href="http://www.seomoz.org/linkscape">Linkscape</a> est lâ€™index Web de <a href="http://www.seomoz.org/">SEOmoz</a>. En plus du travail habituel sur les statistiques, nous effectuons des recherches poussĂ©es qui sont partagĂ©es dans cet article. â€¨Cependant, la lecture requiert de lâ€™attention car la corrĂ©lation de donnĂ©es ne donne pas forcĂ©ment toutes les rĂ©ponses. Il nâ€™en demeure pas moins que câ€™est extrĂŞmement intĂ©ressant, donnant une vue de lâ€™intĂ©rieur grĂ˘ce Ă  la modĂ©lisation des classements; tout en sachant quâ€™il ne faut pas simplement regarder les graphes, mais bien lire le commentaire associĂ©. Donc, faites attention Ă  la lecture des donnĂ©es brutes qui peuvent ĂŞtre sujettes Ă  une mauvaise interprĂ©tation.</p>
<h3>Quelques stats Linkscape (au 22/09/09)</h3>
<ul>
<li>Date de sortie :Â  6 octobre 2009</li>
<li>Domaines : 57 millions</li>
<li>Sous-domaines : 215 millions</li>
<li>URLs : 40,5 milliards</li>
<li>Liens : 456 milliards</li>
<li>Attributs de lien :
<ul>
<li>Liens nofollow internes : 7 milliards (1,51% du total)</li>
<li> Liens nofollow externes : 2,8 milliards (0,60% du total)</li>
<li>Liens nofollow au total : 9,7 milliards (2,11% du total)</li>
<li>URLs en 301 : 384 millions (0,08% du total)</li>
<li>URLs en 302 : 3 milliards (0,59% du total)</li>
<li>URLs employant rel= Â«canonicalÂ» 52 millions (0,01% du total)</li>
</ul>
</li>
</ul>
<ul>
<li> CorrĂ©lation moyenne entre PageRank et mozRank
<ul>
<li>Erreur absolue moyenne : 0,54</li>
</ul>
</li>
</ul>
<ul>
<li> CorrĂ©lation moyenne entre mozRank du domaine (DmR) et PageRank de la homepage
<ul>
<li>Erreur absolue moyenne : 0,37</li>
</ul>
</li>
</ul>
<p>Maintenant, entrons dans la recherche autour de la corrĂ©lation des donnĂ©es pour savoir comment utiliser Linkscape pour obtenir des statistiques intĂ©ressantes. Les premiers graphes utilisent la corrĂ©lation brute et pas seulement la relation entre les classements et les paramĂ¨tres individuels. Encore une fois, il faut bien lire les descriptions et surtout ne pas faire de conclusions hĂ˘tives. Il ne faut pas croire quâ€™on peut forcĂ©ment obtenir un meilleur classement en suivant les recommandations. Le but est de montrer quels paramĂ¨tres sont appliquĂ©s aux pages qui sont positionnĂ©es parmi les meilleures positions des rĂ©sultats de recherche.</p>
<h2>Comprendre les graphes</h2>
<ul>
<li>Mean Index By Value (index moyen par valeur) : c&#8217;est utilisĂ© pour l&#8217;axe y de plusieurs graphes. Au lieu de faire la moyenne des valeurs brutes, nous effectuons le calcul sur son index relatif dans les rĂ©sultats de recherche &#8211; si ordonnĂ©s par cette valeur. Prenons 3 rĂ©sultats de recherche oĂą la page en premiĂ¨re position est la quatriĂ¨me en terme de liens, la deuxiĂ¨me est la premiĂ¨re pour les backlinks, puis la troisiĂ¨me est en dixiĂ¨me position pour les liens. L&#8217;index moyen par nombre de liens pour la premiĂ¨re position sera (4+1+10)/3=5.</li>
<li>Mean Count Numbers (moyenne des nombres) : ces nombres apparaissent sur l&#8217;axe y du premier graphe, montrant la moyenne du nombre de liens.</li>
<li>Position : c&#8217;est utilisĂ© sur certains axes x. Pour les graphes concernĂ©s, spĂ©cifiques Ă  la position organique dans Google.com, les rĂ©sultats de recherche non traditionnels sont exclus (local, vidĂ©o, news, images, etc.).</li>
<li>Error Bars (Barres d&#8217;erreur) : ces barres qui relient les courbes dans nos graphes montrent l&#8217;intervalle entre deux Ă©lĂ©ments diffĂ©rents. Sur certains graphes, elles montrent les 95% des intervalles de la moyenne potentielle si nous avions une infinitĂ© de donnĂ©es Ă  traiter.</li>
</ul>
<h3>Les backlinks sont-ils en corrĂ©lation adĂ©quate avec le positionnement ?</h3>
<p>Une logique rĂ©currente dans le rĂ©fĂ©rencement prĂ©tend que le nombre de liens qui pointent vers un rĂ©sultat permet une bonne prĂ©diction du positionnement. Cependant, on remarque que Yahoo! Site Explorer (et mĂŞme Google dans ses Webmaster Tools) inclut un grand nombre de liens inutiles (nofollow, format exotique, internes, etc.), tandis qu&#8217;il exclut des Ă©lĂ©ments intĂ©ressants (comme les redirections 301).â€¨ En utilisant les donnĂ©es Linkscape, nous pouvons Ă©liminer ce bruit afin d&#8217;extraire seulement les liens qualifiĂ©s et les 301.<br />
<a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/liens-classement2.gif" rel="shadowbox[sbpost-702];player=img;"><img class="size-full wp-image-723 alignnone" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/liens-classement2.gif" alt="CorrĂ©lation entre backlinks et positionnement" width="500" height="375" /></a></p>
<p>Ce premier graphe suggĂ¨re qu&#8217;une corrĂ©lation existe entre nombre de liens et positionnement. Sauf que les pics sont frustrants. Au travers d&#8217;une analyse plus profonde, nous avons Ă©tabli qu&#8217;ilÂ  Ă©tait Ă©videmment causĂ© par un dĂ©sĂ©quilibre de liens parmi certains rĂ©sultats.â€¨ Du coup, il s&#8217;est avĂ©rĂ© pertinent de produire le graphe suivant :</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/liens-positionnement.gif" rel="shadowbox[sbpost-702];player=img;"><img class="alignnone size-full wp-image-705" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/liens-positionnement.gif" alt="Valeur moyenne du positionnement par nombre de liens" width="500" height="375" /></a></p>
<p>Ici, nous pouvons voir ce qui pourrait se passer si nous manipulions les rĂ©sultats par nombre de liens. Dans ce cas, chaque paquet de rĂ©sultats ont Ă©tĂ© assignĂ© un chiffre (1, 2, 3, etc.) qui correspond Ă  la quantitĂ© de liens en comparaison avec les autres pages (la page avec le plus de liens est assignĂ©e le &laquo;&nbsp;1&#8243;, la deuxiĂ¨me qui reĂ§oit le plus de liens porte le &laquo;&nbsp;2&#8243;, etc.).â€¨ On voit que la courbe est devenue rĂ©guliĂ¨re, mais nous pouvons assurer de sa prĂ©cision.</p>
<p>Les barres sur la courbe ci-dessous montre l&#8217;intervalle permise pour estimer la ligne mĂ©diane.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/erreur-classement-liens.gif" rel="shadowbox[sbpost-702];player=img;"><img class="alignnone size-full wp-image-706" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/erreur-classement-liens.gif" alt="Zone d'erreur pour la corrĂ©lation entre liens externes et positionnement" width="500" height="375" /></a></p>
<p>La corrĂ©lation est forte, suggĂ©rant que le nombre de liens externes est important. Le standard relevĂ© pour l&#8217;erreur est si bas que nous sommes confiants Ă  propos de la vĂ©racitĂ© de cette analyse. â€¨Clairement, les liens sont trĂ¨s importants, mais ils ne reprĂ©sentent pas la totalitĂ© de la solution. Amasser le plus de liens possible est un excellent objectif, mais cela ne peut pas ĂŞtre votre seul but.</p>
<p>Le dernier morceau Ă  observer pour cette partie concerne la dĂ©viation standard. Cela dĂ©montre la latitude de variation d&#8217;une page par rapport aux moyennes.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/variation-lien-position.gif" rel="shadowbox[sbpost-702];player=img;"><img class="alignnone size-full wp-image-707" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/variation-lien-position.gif" alt="Variation de la corrĂ©lation pour les liens et le positionnement" width="500" height="375" /></a></p>
<p>Ce graphe nous montre que la variation pour un paquet individuel de rĂ©sultats peut ĂŞtre trĂ¨s large. AcquĂ©rir plus de liens n&#8217;est pas forcĂ©ment un moyen infaillible. La dĂ©viation standard est Ă©loignĂ©e de la ligne mĂ©diane (1,97). Au niveau global, il importe de prendre en compte le nombre de liens externes qui sont correctement suivis, mais nous allons dĂ©velopper nos modĂ¨les et Ă©largir notre champ de rĂ©flexion pour d&#8217;obtenir des informations actionnables au niveau granulaire.</p>
<h3>Une seule mesure peut-elle prĂ©dire le positionnement ?</h3>
<p>Franchement, Ă§a serait excellent&#8230;<br />
Nous avons regardĂ© des indices comme le PageRank, le nombre de liens dans Yahoo! Site Explorer, Alexa Rank, etc. Pour ĂŞtre clair, ces indices sont aussi fiables que piocher au hasard. Le score du PageRank de Google Ă©tait approximativement 16% plus performant (donnĂ©e datĂ©e de fĂ©vrier 2009) qu&#8217;une prĂ©diction basĂ©e sur le hasard pur pour dĂ©terminer le positionnement d&#8217;une page Web (N+10 ou la page positionnĂ© NÂ°1 contre la page 2). Le PageRank Ă©tait Ă©galement 5% meilleur que le hasard pour prĂ©dire le positionnement (N+1 ou la position 1 contre position 2).<br />
Le graphique ci-dessous montre des corrĂ©lations pour un certain nombre d&#8217;indices liĂ©s au rĂ©fĂ©rencement.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/correlation-google.gif" rel="shadowbox[sbpost-702];player=img;"><img class="alignnone size-full wp-image-708" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/correlation-google.gif" alt="corrĂ©lation des donnĂ©es avec le positionnement sur Google" width="600" height="436" /></a></p>
<p>Nick, Ben et Chas ont travaillĂ© dur afin d&#8217;amĂ©liorer la valeur et la qualitĂ© de l&#8217;index Linkscape, ainsi que l&#8217;utilitĂ© des mesures.<br />
Le graphe suivant montre nos progrĂ¨s.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/valeur-linkscape.png" rel="shadowbox[sbpost-702];player=img;"><img class="alignnone size-full wp-image-709" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/valeur-linkscape.png" alt="ProgrĂ¨s de la valeur et qualitĂ© de l'index Linkscape" width="448" height="336" /></a></p>
<p>Les corrĂ©lations du graphe ci-dessus sont 35-50% plus satisfaisantes que les rĂ©sultats piochĂ©s au hasard (il ne s&#8217;agit pas d&#8217;une comparaison 1 pour 1 avec les nombres ci-dessus &#8211; cela viendra dans un prochain post). L&#8217;observation de ce graphe suggĂ¨re que le mozRank externe (reprĂ©sentant la quantitĂ© de &laquo;&nbsp;link juice&nbsp;&raquo; vers un page depuis les liens externes) et les liens externes suivis correspondent bien au positionnement actuel, apportant des Ă©lĂ©ments d&#8217;information intĂ©ressants pour les chasseurs de backlinks. Cette ligne de corrĂ©lation peut suggĂ©rer, dans un scĂ©nario classique du positionnement, l&#8217;importance de l&#8217;apport de liens Ă©manant de pages Ă  fort mozRank/PageRank qui contiennent peu de liens externes (ainsi les liens passent plus de &laquo;&nbsp;link juice&nbsp;&raquo;), ainsi qu&#8217;une grande quantitĂ© brute de liens externes suivis. De plus, ce graphe supporte l&#8217;idĂ©e que l&#8217;apport de liens depuis un domaine unique est pertinent.</p>
<p>La partie frustrante Ă  propos de ces donnĂ©s est que Ă§a ne raconte pas l&#8217;ensemble de l&#8217;histoire, ni que Ă§a soit directement actionnable pour une requĂŞte spĂ©cifique. Comme vous pouvez voir ci-dessous, la dĂ©viation standard des nombres montre que pour n&#8217;importe quelle recherche, l&#8217;Ă©tendu varie drastiquement.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/variation-recherche.png" rel="shadowbox[sbpost-702];player=img;"><img class="alignnone size-full wp-image-710" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/variation-recherche.png" alt="Variation standard en fonction des rĂ©sultats de recherche" width="512" height="384" /></a></p>
<p>Lorsque nous observons cet effet, exactement comme dans le cas ci-dessus, l&#8217;application pour un travail de rĂ©fĂ©rencement d&#8217;un projet client, dont l&#8217;objectif est d&#8217;obtenir un positionnement spĂ©cifique, n&#8217;est pas clair. Employer ces mesures comme KPI et moyens d&#8217;Ă©valuer les liens potentiels est probablement utile. Construire des analyses de concurrence avec ces points de donnĂ©es sera certainement plus efficace qu&#8217;utiliser des mesures extĂ©rieures, mais cela ne dit pas &laquo;&nbsp;fais ceci pour mieux te positionner,&nbsp;&raquo; tout comme ce n&#8217;est pas le &laquo;&nbsp;Saint Graal&nbsp;&raquo; que nous pourchassons.</p>
<h3>Comment les facteurs &laquo;&nbsp;On Page&nbsp;&raquo; coĂŻncident avec le positionnement ?</h3>
<p>Pour l&#8217;instant, nous avons peu Ă©valuĂ© les facteurs &laquo;&nbsp;On Page&nbsp;&raquo; et leur corrĂ©lation avec le positionnement. C&#8217;est ce que nous allons voir maintenant.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/facteurs-positionnement.gif" rel="shadowbox[sbpost-702];player=img;"><img class="alignnone size-full wp-image-711" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/facteurs-positionnement.gif" alt="CorrĂ©lation meta keywords avec le positionnement" width="500" height="375" /></a></p>
<p>Google a rĂ©cemment annoncĂ© que la meta keywords Ă©tait ignorĂ©e. Ces donnĂ©es montrent une courbe trĂ¨s irrĂ©guliĂ¨re et des barres d&#8217;erreurs dans la limite du 13, supportant cette affirmation. Employer la requĂŞte/phrase dans la meta keywords est un des signaux les moins significatifs que nous avons Ă©tudiĂ©.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/titre-position.gif" rel="shadowbox[sbpost-702];player=img;"><img class="alignnone size-full wp-image-712" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/titre-position.gif" alt="CorrĂ©lation entre le titre - balise Title - et le positionnement" width="512" height="384" /></a></p>
<p>La balise Title qui contient le terme de la requĂŞte semble avoir une rĂ©elle corrĂ©lation avec le classement. Ils ne sont pas en parfaite corrĂ©lation, mais ce graphe nous montre que Google a une claire prĂ©fĂ©rence, en moyenne, pour les pages qui emploient le terme de la requĂŞte dans la balise Title.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/Hx-position.gif" rel="shadowbox[sbpost-702];player=img;"><img class="alignnone size-full wp-image-713" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/Hx-position.gif" alt="CorrĂ©lation entre les balises d'en-tĂŞtes Hx et le positionnement" width="500" height="375" /></a></p>
<p>Nous avions examinĂ© auparavant les balises dâ€™en-tĂŞtes H1/H2/Hx pour arriver Ă  la conclusion quâ€™elles avaient un impact faible sur le positionnement. Ce graphe suggĂ¨re que câ€™est toujours le cas. Il y a une corrĂ©lation plus grande lorsque les termes sont utilisĂ©s dans dâ€™autres zones Â«on pageÂ» du body ou dans lâ€™ancre des liens (internes ou externes).â€¨ Bien que le graphe montre une courbe horizontale, suggĂ©rant que les en-tĂŞtes H1 Ă  H4 nâ€™ont pas trop de bĂ©nĂ©fice Ă  lâ€™utilisation, ce nâ€™est pas aussi vilain que lâ€™effet hasardeux observĂ© avec la meta Â«keywordsÂ» (les courbes dĂ©marrent en-dessous de 13 et se terminent juste au-dessus). En tout cas, la corrĂ©lation positive est basse avec la ligne horizontale qui se tient entre les barres dâ€™erreur.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/url-position.gif" rel="shadowbox[sbpost-702];player=img;"><img class="alignnone size-full wp-image-714" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/url-position.gif" alt="CorrĂ©lation entre mots clĂ©s dans l'url et le positionnement" width="500" height="375" /></a></p>
<p>Le graphe est lâ€™illustration la plus claire du fait quâ€™il faille construire des systĂ¨mes plus avancĂ©s quâ€™une simple et directe corrĂ©lation. Selon ce graphe, lâ€™utilisation du terme de recherche dans le nom de fichier ou chemin dâ€™URL est lĂ©gĂ¨rement nĂ©gatif en corrĂ©lation avec un bon classement. Le sous-domaine apparaĂ®t largement inutile, tandis que le domaine racine Ă  une forte corrĂ©lation. Bien que toutes les courbes (sauf le domaine racine) soient sur une bande Ă©troite de lâ€™axe x, les bonnes pratiques du rĂ©fĂ©rencement nous dictent dâ€™utiliser les mots clĂ©s dans ces Ă©lĂ©ments. Du coup, lorsque nous analysons ce graphe, il convient dâ€™Ă©mettre quelques hypothĂ¨ses. Par exemple, les termes de recherche de lâ€™URL seraient Ă©liminĂ©s lorsque ils apparaissent dans le domaine racine et ailleurs dans l&#8217;URL. Les moteurs de recherche peuvent voir ceux qui rĂ©pĂ¨tent les termes du domaine racine dans lâ€™URL comme des pratiquants du &laquo;&nbsp;keyword stuffing&nbsp;&raquo;. Cela peut aussi impliquer que la corrĂ©lation brute perĂ§oit un grand nombre de pages qui optimisent moins lâ€™URL, mais qui sont performantes grĂ˘ce Ă  dâ€™autres facteurs (liens, autoritĂ©, etc.). Câ€™est aussi vrai que la plupart des sites qui emploient le mot clef dans lâ€™URL ne lâ€™utilisent pas forcĂ©ment dans le domaine racine. Du coup, le nĂ©gatif de lâ€™un peut ĂŞtre mĂ©langĂ© au positif de lâ€™autre pour tenter d&#8217;y voir plus clair.</p>
<p>Cet exemple est la parfaite illustration des problĂ¨mes dâ€™interprĂ©tation sur la corrĂ©lation de donnĂ©es brutes, nĂ©cessitant une modĂ©lisation toujours plus sophistiquĂ©e.</p>
<h3>Pouvons-nous construire une modĂ©lisation utilisable du positionnement?</h3>
<p>Nous avons besoin dâ€™un modĂ¨le qui imite Google du mieux possible pour obtenir une reprĂ©sentation de la valeur potentielle pour les actions de rĂ©fĂ©rencement. Sauf que ce nâ€™est pas facile car Google possĂ¨de plus de 200 paramĂ¨tres dans son algorithme de classement des pages Web. Bien que nous possĂ©dons de nombreux points dâ€™analyse, il nâ€™en demeure pas moins que c&#8217;est un challenge complexe.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/uber.png" rel="shadowbox[sbpost-702];player=img;"><img class="alignnone size-full wp-image-715" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/uber.png" alt="Score gĂ©nĂ©ral de la modĂ©lisation SEOmoz" width="512" height="384" /></a></p>
<p>La courbe Â«ĂśberÂ» en rouge dans le graphe ci-dessus est construite en prenant tous les points dâ€™analyse que nous possĂ©dons.Â  Les donnĂ©es sont moulinĂ©es pour Ă©tablir une corrĂ©lation avec les rĂ©sultats de recherche. La courbe rouge fait clairement apparaĂ®tre que notre modĂ¨le est le plus efficace pour prĂ©dire le classement. En plus, la courbe est carrĂ©ment excellente pour le Top 10 des rĂ©sultats de recherche.<br />
Cette modĂ©lisation peut aussi sâ€™affiner pour obtenir un impact Ă  propos de lâ€™utilisation du mot clef dans une zone spĂ©cifique.</p>
<p>Regardons comme exemple la corrĂ©lation nĂ©gative des mots clĂ©s dans lâ€™URL.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/mots-cles-url.gif" rel="shadowbox[sbpost-702];player=img;"><img class="alignnone size-full wp-image-716" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/mots-cles-url.gif" alt="CorrĂ©lation affinĂ©e entre les mots clĂ©s dans l'url et le rĂ©fĂ©rencement" width="500" height="375" /></a></p>
<p>Encore une fois, le graphe montre clairement lâ€™inefficacitĂ© latente des mots clĂ©s dans le sous-domaine, mais que c&#8217;est extrĂŞmement efficace dans le domaine racine. Sinon, les courbes peuvent suggĂ©rer un faible effet positif tout en observant une descente en dessous du 0 de lâ€™axe x pour les positions 20-25, indiquant que lâ€™utilisation du mot clef peut aussi avoir un effet nĂ©gatif. Ainsi, lâ€™utilisation du mot clef au sein de multiples endroits peut ĂŞtre nĂ©faste; ce qui dirait Ă  certains quâ€™une utilisation moins agressive des mots clĂ©s serait bĂ©nĂ©fique.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/url-erreur.gif" rel="shadowbox[sbpost-702];player=img;"><img class="alignnone size-full wp-image-717" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/url-erreur.gif" alt="DĂ©viation standard pour l'analyse de corrĂ©lation mots clĂ©s dans l'URL et le positionnement" width="500" height="375" /></a></p>
<p>Dans ce graphe, les barres dâ€™erreurs de dĂ©viation standard sont mises en Ă©vidence. Ainsi, nous pouvons dire que lâ€™utilisation des mots clĂ©s dans lâ€™URL nâ€™a pas dâ€™impact nĂ©gatif pour les meilleurs rĂ©sultats, tandis que ce constat est moins serein pour la derniĂ¨re portion de rĂ©sultats.<br />
Tournons notre attention vers ces satanĂ©s Hx encore une fois pour voir si notre modĂ©lisation a dâ€™autres choses Ă  dire.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/en-tetes.gif" rel="shadowbox[sbpost-702];player=img;"><img class="alignnone size-full wp-image-718" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/en-tetes.gif" alt="CorrĂ©lation entre positionnement et mots clĂ©s dans les balises d'en-tĂŞtes Hx" width="500" height="375" /></a></p>
<p>Nous obtenons des rĂ©sultats similaires qui perĂ§oivent les tags H1-H4 comme peu intĂ©ressants pour y placer des mots clĂ©s. Les Hx semblent aider un peu, mais peuvent aussi avoir un lĂ©ger impact nĂ©gatifÂ  pour la derniĂ¨re portion des rĂ©sultats. Cette analyse est une Ă©vidence plutĂ´t efficace pour dĂ©clarer que les tags Hx nâ€™ont pas une grosse importance pour le rĂ©fĂ©rencement (mĂŞme en prenant en compte les barres dâ€™erreur). Evidemment, il faut continuer dâ€™utiliser les en-tĂŞtes, mais ce ne sont pas les endroits les plus stratĂ©giques Ă  incorporer Ă  propos de lâ€™optimisation pour le rĂ©fĂ©rencement.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/mesure-lien.gif" rel="shadowbox[sbpost-702];player=img;"><img class="alignnone size-full wp-image-719" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/mesure-lien.gif" alt="Sophistication de la mesure des liens" width="500" height="375" /></a></p>
<p>Notre mesure pour les liens a aussi Ă©tĂ© lâ€™objet dâ€™amĂ©liorations qui donne un constat plus nuancĂ©. Vous pouvez voir ci-dessus que notre mozRank amĂ©liorĂ© apparaĂ®t plus important pour les premiers rĂ©sultats de recherche; tout en observant que le nombre brut de liens nâ€™a pas une grande valeur. Plus profond dans les rĂ©sultats, certaines pages semblent utiliser Ă  outrance lâ€™acquisition de liens et du mozRank &#8211; probablement Ă  cause de liens qui proviennent de sites Ă  faible autoritĂ© ou mĂŞme spammy.â€¨ Ce graphe ne contient pas un grand nombre de donnĂ©es actionnables, mais cela confirme plutĂ´t bien ce quâ€™on sait du rĂ©fĂ©rencement (ex: peu de bons liens est mieux que beaucoup de mauvais liens).</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/page-web.gif" rel="shadowbox[sbpost-702];player=img;"><img class="alignnone size-full wp-image-720" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/06/page-web.gif" alt="Facteurs influent pour le rĂ©fĂ©rencement de pages Web" width="500" height="375" /></a></p>
<p>Ce dernier graphe montre quelques donnĂ©es intĂ©ressantes de nos tests sur les Ă©lĂ©ments Â«on pageÂ». Le gros paramĂ¨tre aperĂ§u concerne lâ€™utilisation dâ€™images avec un attribut Â«altÂ» adĂ©quat incorporant les mots clĂ©s. La ligne verte est une des plus fortes corrĂ©lations pour lâ€™utilisation Â«on pageÂ» des mots clĂ©s. Mettre les mots clĂ©s en gras, dans le corpus et mĂŞme dans les ancres a le mĂŞme type dâ€™impact positif Ă©tudiĂ© prĂ©cĂ©demment, ainsi quâ€™un lĂ©ger impact nĂ©gatif dans la zone 20-25.</p>
<h4>Conclusions</h4>
<p>Je sais que cela reprĂ©sente beaucoup de donnĂ©es Ă  ingurgiter, mais il est aussi trĂ¨s important de comprendre que la crĂ©dibilitĂ© du travail de rĂ©fĂ©rencement passe aussi par lâ€™appui sur ce type dâ€™analyse. SEOmoz nâ€™est certainement pas la seule compagnie Ă  travailler de la sorte (quoi que certainement la seule Ă  rendre les rĂ©sultats publics). Tout cela peut apporter des supports intĂ©ressants pour des projets clients ou en interne avec des donnĂ©es qui montrent lâ€™importance et la valeur prĂ©vue pour les changements effectuĂ©s en tant que rĂ©fĂ©renceur. Nombreux sont ceux qui critiquent le mĂ©tier parce que l&#8217;expertise se base Ă©normĂ©ment sur lâ€™intuition et le bon sens. Avec ces analyses, nous pouvons recentrer le dĂ©bat. Nous ne prĂ©tendons pas que ces donnĂ©es sont infaillibles, mais il sâ€™agit certainement dâ€™un excellent point supplĂ©mentaire Ă  ajouter dans lâ€™Ă©quation.</p>
<p><strong>Les Ă©lĂ©ments suggĂ©rĂ©s par lâ€™analyse, dont nous sommes confiants de la pertinence :</strong></p>
<ul>
<li>Les liens sont importants, mais les donnĂ©es trop basiques peuvent ĂŞtre trompeuses. Il faut Ă©tablir des analyses sophistiquĂ©es sur les liens.</li>
<li>Il nâ€™y a pas une donnĂ©e en particulier qui peut prĂ©dire le positionnement.</li>
<li>H1 (et H2 Ă  H4) ne sont probablement pas des bons endroits pour capitaliser sur des mots clĂ©s</li>
<li>Lâ€™attribut Â«altÂ» des images est un endroit privilĂ©giĂ© pour mettre des mots clĂ©s</li>
<li>Le keyword stuffing peut vous retenir au-delĂ  des 15 premiers rĂ©sultats.</li>
<li>En faire trop avec des liens de mauvaise qualitĂ© peut avoir un impact nĂ©gatif.</li>
</ul>
<p>=&gt; Une autre Ă©tude Ă  consulter sur les <a href="http://www.laurentbourrelly.com/blog/732.php">paramĂ¨tres influents des backlinks</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.laurentbourrelly.com/blog/702.php/feed</wfw:commentRss>
		<slash:comments>44</slash:comments>
		</item>
		<item>
		<title>Billet synchronisĂ© me voilĂ !</title>
		<link>http://www.laurentbourrelly.com/blog/531.php</link>
		<comments>http://www.laurentbourrelly.com/blog/531.php#comments</comments>
		<pubDate>Thu, 21 Jan 2010 21:00:26 +0000</pubDate>
		<dc:creator>Laurent</dc:creator>
				<category><![CDATA[Moteurs de recherche]]></category>
		<category><![CDATA[Antoine Leroux]]></category>
		<category><![CDATA[AurĂ©lien Bardon]]></category>
		<category><![CDATA[Aymeric Jacquet]]></category>
		<category><![CDATA[billet synchronisĂ©]]></category>
		<category><![CDATA[blog]]></category>
		<category><![CDATA[blogueur]]></category>
		<category><![CDATA[David Degrelle]]></category>
		<category><![CDATA[Ă©tude]]></category>
		<category><![CDATA[Gonzague Dambricourt]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Jean-Marie Le Ray]]></category>
		<category><![CDATA[LĂ©o Ludwig]]></category>
		<category><![CDATA[Marie Pourreyron]]></category>
		<category><![CDATA[Michel de Guilhermier]]></category>
		<category><![CDATA[moteur de recherche]]></category>
		<category><![CDATA[Olivier Andrieu]]></category>
		<category><![CDATA[olivier duffez]]></category>
		<category><![CDATA[RĂ©fĂ©rencement]]></category>
		<category><![CDATA[rĂ©fĂ©renceur]]></category>
		<category><![CDATA[Renaud Joly]]></category>
		<category><![CDATA[SĂ©bastien Vallery]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[sondage]]></category>
		<category><![CDATA[Sylvain Richard]]></category>

		<guid isPermaLink="false">http://www.laurentbourrelly.com/blog/?p=531</guid>
		<description><![CDATA[Grande premiĂ¨re mondiale : 15 blogueurs publient exactement au mĂŞme moment sur un sujet identique. Sujet : commentez librement l&#8217;Ă©tude Google &#171;&#160;le moteur de recherche idĂ©al vu par les internautes&#160;&#187; Quand : maintenant En lisant lâ€™Ă©tude qui a servi de point de dĂ©part pour ce billet, je me suis dit que Ă§a serait intĂ©ressant dâ€™avoir [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/01/billet-synchro.jpg" rel="shadowbox[sbpost-531];player=img;" title="billet-synchro"><img class="alignleft size-thumbnail wp-image-574" style="border: 0pt none; margin: 0px 10px;" title="billet-synchro" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/01/billet-synchro-150x150.jpg" alt="" width="120" height="120" /></a>Grande premiĂ¨re mondiale : 15 blogueurs publient exactement au mĂŞme moment sur un sujet identique.</p>
<p>Sujet : commentez librement l&#8217;Ă©tude Google &laquo;&nbsp;le moteur de recherche idĂ©al vu par les internautes&nbsp;&raquo;</p>
<p>Quand : maintenant<span id="more-531"></span></p>
<p>En lisant lâ€™Ă©tude qui a servi de point de dĂ©part pour ce billet, je me suis dit que Ă§a serait intĂ©ressant dâ€™avoir lâ€™avis de certaines personnes que j&#8217;avais en tĂŞte. Puis, pourquoi pas carrĂ©ment leur demander de rĂ©diger un billet et publier au mĂŞme moment.</p>
<p>Jâ€™ai donc demandĂ© lâ€™avis de deux ou trois potes qui traĂ®naient sur Gtalk et vu lâ€™enthousiasme (confirmĂ© par le <a href="http://www.laurentbourrelly.com/blog/522.php">teasing</a>), le concept du billet synchronisĂ© Ă©tait lancĂ©. Tous les participants m&#8217;ont vraiment bien aidĂ© avec des suggestions pertinentes Ă  tous niveaux, mais une mention spĂ©ciale Ă  Marie qui mâ€™a donnĂ© un coup de main dans la logistique. D&#8217;ailleurs, vous pouvez lui souhaiter bon anniversaire car c&#8217;est aujourd&#8217;hui qu&#8217;elle devient enfin majeure.</p>
<h1>Les blogueurs aux billets synchronisĂ©s</h1>
<p>Les participants nâ€™ont pas Ă©tĂ© choisi parce que se sont mes meilleurs amis ou que je leur dois de lâ€™argent, mais plutĂ´t dans un souci de confronter des expĂ©riences et des visions diffĂ©rentes. La plupart ont un lien direct avec le rĂ©fĂ©rencement, tandis que d&#8217;autres sont Â«Â non SEOÂ Â». Pour des raisons Ă©videntes de logistique et de ne pas submerger le lecteur, nous avons gardĂ© le groupe dans un volume restreint. Au dĂ©part, nous devions ĂŞtre 10 au maximum, mais la liste finale comporte 15 noms.</p>
<p>Je remercier chacun d&#8217;eux d&#8217;avoir tentĂ© avec moi cette expĂ©rience synchronisĂ©e et surtout improvisĂ©e.</p>
<ul>
<li><a href="http://adscriptum.blogspot.com/2010/01/les-chercheurs-du-web-de-3eme.html" target="_blank">Jean-Marie Le Ray</a></li>
<li><a href="http://www.antoineleroux.fr/google/futur-moteur-de-recherche/697" target="_blank">Antoine Leroux</a></li>
<li><a href="http://www.webrankinfo.com/actualites/201001-search-future.htm" target="_blank">Olivier Duffez</a></li>
<li><a href="http://ajblog.fr/referencement/802-recherche-ideale.html" target="_blank">Aymeric Jacquet</a></li>
<li><a href="http://www.pink-seo.com/blog/futur-search-461" target="_blank">Marie Pourreyron</a></li>
<li><a href="http://micheldeguilhermier.typepad.com/mdegblog/2010/01/google.html" target="_blank">Michel de Guilhermier</a></li>
<li><a href="http://www.1ere-position.fr/blog/etude-google-le-moteur-de-recherche-du-futur" target="_blank">David Degrelle</a></li>
<li><a href="http://blog.axe-net.fr/enquete-google-sur-la-recherche-du-futur/" target="_blank">Sylvain Richard</a></li>
<li><a href="http://www.renaud-joly.fr/index.php/post/2010/google-recherche-internautes" target="_blank">Renaud Joly</a></li>
<li><a href="http://oseox.fr/blog/index.php/786-moteur-recherche" target="_blank">AurĂ©lien Bardon</a></li>
<li><a href="http://gonzague.me/futur-search-selon-google" target="_blank">Gonzague Dambricourt</a></li>
<li><a href="http://fr.propulsr.com/moteurs-de-recherche/google-vision-futur/" target="_blank">LĂ©o Ludwig</a></li>
<li><a href="http://blog.abondance.com/2010/01/google-et-le-moteur-de-recherche-ideal_21.html" target="_blank">Olivier Andrieu</a></li>
<li><a href="http://www.seoplayer.com/google/quel-futur-pour-la-recherche-d-information-en-ligne.html" target="_blank">SĂ©bastien Vallery</a></li>
</ul>
<h2>Le sujet</h2>
<p>Il s&#8217;agit d&#8217;une Ă©tude exĂ©cutĂ©e par DirectPanel pour Google se basant sur un sondage d&#8217;utilisateurs franĂ§ais des moteurs de recherche. Je ne me suis pas renseignĂ©, mais il est fort possible que cette Ă©tude ait pris place dans d&#8217;autres pays. La date de publication est trĂ¨s rĂ©cente puisqu&#8217;elle remonte Ă  dĂ©cembre 2009.</p>
<p>Le lien pour tĂ©lĂ©charger <a href="http://www.directpanel.com/fichiers/communiques/docs/Directpanel_Etude_Google_Search_of_the_future_12_2009.pdf">Etude &laquo;&nbsp;Search of the Future&nbsp;&raquo; &#8211; France</a></p>
<p>En bonus, le slideshow</p>
<div id="__ss_2958257" style="width: 425px; text-align: left;"><a style="font: 14px Helvetica,Arial,Sans-serif; display: block; margin: 12px 0 3px 0; text-decoration: underline;" title="Directpanel Etude Google Search Of The Future 12 2009" href="http://www.slideshare.net/ThickParasite/directpanel-etude-google-search-of-the-future-12-2009">Directpanel Etude Google Search Of The Future 12 2009</a><object style="margin: 0px;" classid="clsid:d27cdb6e-ae6d-11cf-96b8-444553540000" width="425" height="355" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,40,0"><param name="allowFullScreen" value="true" /><param name="allowScriptAccess" value="always" /><param name="src" value="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=directpaneletudegooglesearchofthefuture122009-100120125138-phpapp02&amp;rel=0&amp;stripped_title=directpanel-etude-google-search-of-the-future-12-2009" /><param name="allowfullscreen" value="true" /><embed style="margin: 0px;" type="application/x-shockwave-flash" width="425" height="355" src="http://static.slidesharecdn.com/swf/ssplayer2.swf?doc=directpaneletudegooglesearchofthefuture122009-100120125138-phpapp02&amp;rel=0&amp;stripped_title=directpanel-etude-google-search-of-the-future-12-2009" allowscriptaccess="always" allowfullscreen="true"></embed></object></div>
<h3>Mon billet sur &laquo;&nbsp;le futur moteur de recherche&nbsp;&raquo;</h3>
<p>Cette annĂ©e, nous fĂŞtons le 20<sup>Ă¨me</sup> anniversaire de la naissance dâ€™Archie (10/10/90) qui est lâ€™ancĂŞtre des moteurs de recherche. Je ne lâ€™ai pas connu, mais je me rappelle de Lycos, Excite et surtout Altavista. En 1998, Google est arrivĂ©, puis vous connaissez la suite.</p>
<p>Nous voilĂ  donc en 2010 Ă  lire une Ă©tude commanditĂ© par Google qui a pour objectif de Â«Â savoir comment les utilisateurs voient le moteur de recherche idĂ©al de demainÂ : Ă  quoi ressemblera-t-ilÂ ? Que sera t-il capable de faireÂ ? Comment changera-t-il notre vie, la technologie et le Web en gĂ©nĂ©ralÂ ?Â Â»</p>
<p>En parcourant lâ€™Ă©tude, jâ€™avais une citation de Larry Page (co-fondateur de Google) lue il y a 7 ans qui me revenait sans cesseÂ : Â«Â on peut imaginer un jour que votre cerveau soit renforcĂ© par Google. Par exemple, vous pensez Ă  quelque chose, et votre tĂ©lĂ©phone cellulaire vous chuchote la rĂ©ponse dans lâ€™oreille.Â Â»</p>
<h3>Le Google Chip</h3>
<p>MĂŞme si les rĂ©ponses mâ€™intĂ©ressaient, je voulais savoir si cette histoire de puce allait ressortir au travers des questions posĂ©es par Google. Sur ce point, je nâ€™ai pas Ă©tĂ© dĂ©Ă§u car les questions nâ€™ont pas tardĂ© Ă  abonder dans ce sens. Quand je lis Â«Â fournir des informations sur ce que jâ€™entendsÂ Â» ou Â«Â fournir des informations sur une personne ou un objet de que je toucheÂ Â» ou Â«Â permettre de rechercher dans les souvenirs stockĂ©s dans ma mĂ©moireÂ Â», câ€™est bien vers cette puce dans le cerveau quâ€™on se dirige.</p>
<p>A mon avis, ce Â«Â Google ChipÂ Â» est technologiquement bien avancĂ©, car ce sondage va tout Ă  fait dans le sens dâ€™une prise de tempĂ©rature pour voir si le public commence Ă  intĂ©grer ces Â«Â progrĂ¨sÂ Â» Ă  venir. Maintenant, la seule question rĂ©side de savoir quand ils trouveront le timing adĂ©quat pour nous greffer le cerveau avec un puce Â«Â made in Mountain View.Â Â» Si vous craigniez pour vos donnĂ©es personnelles aujourdâ€™hui, je vous laisse imaginer ce que le Google du futur nous rĂ©serveâ€¦</p>
<h3>Peut mieux faireÂ !</h3>
<p>Pour le reste de lâ€™Ă©tude, jâ€™ai Ă©tĂ© surpris que la quasi totalitĂ© des utilisateurs attendent des amĂ©liorations. Quand je vois que cette mĂŞme quasi totalitĂ© ne savent absolument pas utiliser au mieux un moteur de recherche, Ă§a mâ€™Ă©tonne dâ€™apprendre que Google doit mieux faire. Rien quâ€™en utilisant une poignĂ©e dâ€™opĂ©rateurs et en ayant une bonne rĂ©flexion autour de la requĂŞte, il nâ€™y a pas de rĂ©ponse qui reste inassouvie lors de la premiĂ¨re recherche.</p>
<p>Remarque, lâ€™utilisateur nâ€™a pas non plus tort dans le sens oĂą la technologie devrait sâ€™adapter Ă  lâ€™homme et non le contraire. Sauf quâ€™il y a trĂ¨s peu de cas que je connaisse oĂą cette notion est respectĂ©e. Pour revenir Ă  Google, il est aussi vrai que le moteur ne comprend toujours pas ce quâ€™il indexe. MalgrĂ© quelques sursauts prometteurs il y a quelques annĂ©es, je nâ€™entends plus trop parler de la sĂ©mantique appliquĂ©e et les outils de recherche. La recherche dâ€™information recentrĂ©e sur lâ€™utilisateur au travers dâ€™outil comme Twitter (on demande Ă  ses followers, plutĂ´t quâ€™Ă  Google) suggĂ¨re la limite dâ€™un algorithme Â«Â idiot.Â Â»</p>
<h4>Conclusion (et suiteÂ ?)</h4>
<p>Le sentiment global qui ressort de cette Ă©tude est clairement que le moteur de recherche va devenir de plus en plus une partie intĂ©grante de notre vie quotidienne. Sans attendre la puce dans le cerveau, le moteur va rĂ©pondre Ă  plus de besoins en Ă©tant toujours plus performant.</p>
<p>Quand je repense Ă  Archie et Altavista, il sâ€™en est vraiment passĂ© des choses en 20 ans. Dire que nous sortons Ă  peine de la PrĂ©histoire du Search, il est stupĂ©fiant de jeter un coup dâ€™Ĺ“il en arriĂ¨re et se projeter sur ce qui va arriver demain.</p>
<p>Jâ€™ai tĂ˘chĂ© de rester concis car il y a 14 autres billets Ă  lire, mais jâ€™espĂ¨re que cette expĂ©rience du billet synchronisĂ© se rĂ©vĂ©lera intĂ©ressante et quâ€™elle sera renouvelĂ©e. Parmi les idĂ©es, je voulais lĂ˘cher le concept en confiant le prochain sujet et choix des participants Ă  un autre blogueur qui passera le relais Ă  son tour afin de gĂ©nĂ©rer une sorte de chaine intellectuelle au travers des blogs.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.laurentbourrelly.com/blog/531.php/feed</wfw:commentRss>
		<slash:comments>36</slash:comments>
		</item>
		<item>
		<title>Comment Google classe les Tweets</title>
		<link>http://www.laurentbourrelly.com/blog/509.php</link>
		<comments>http://www.laurentbourrelly.com/blog/509.php#comments</comments>
		<pubDate>Wed, 13 Jan 2010 21:20:05 +0000</pubDate>
		<dc:creator>Laurent</dc:creator>
				<category><![CDATA[Moteurs de recherche]]></category>
		<category><![CDATA[Amit Singhal]]></category>
		<category><![CDATA[Chris Lake]]></category>
		<category><![CDATA[classement]]></category>
		<category><![CDATA[David Talbot]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[hashtag]]></category>
		<category><![CDATA[moteur de recherche]]></category>
		<category><![CDATA[Real Time Search]]></category>
		<category><![CDATA[rĂ©putation]]></category>
		<category><![CDATA[spam]]></category>
		<category><![CDATA[tweet]]></category>
		<category><![CDATA[Twitter]]></category>
		<category><![CDATA[update]]></category>

		<guid isPermaLink="false">http://www.laurentbourrelly.com/blog/?p=509</guid>
		<description><![CDATA[Depuis un mois, nous voyons apparaĂ®tre les Tweets â€“ messages issus de la plateforme de micro-blogging Twitter â€“ au sein des rĂ©sultats de recherche lorsque la fonctionnalitĂ© Social Search est activĂ©e. La question qui se pose maintenant est de savoir comment Google sâ€™y prend pour choisir les Tweets Ă  faire apparaĂ®tre au sein des pages [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/01/Google-Twitter.jpg" rel="shadowbox[sbpost-509];player=img;" title="Google et Twitter"><img class="alignleft size-thumbnail wp-image-514" style="border: 0pt none; margin: 0px 10px;" title="Google et Twitter" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/01/Google-Twitter-150x150.jpg" alt="" width="105" height="105" /></a>Depuis un mois, nous voyons apparaĂ®tre les Tweets â€“ messages issus de la plateforme de micro-blogging Twitter â€“ au sein des rĂ©sultats de recherche lorsque la fonctionnalitĂ© Social Search est activĂ©e.</p>
<p>La question qui se pose maintenant est de savoir comment Google sâ€™y prend pour choisir les Tweets Ă  faire apparaĂ®tre au sein des pages de rĂ©sultats.<span id="more-509"></span></p>
<p>Câ€™est Ă  la lecture dâ€™<a href="http://www.technologyreview.com/web/24353/page1/" target="_blank">un article de David Talbot</a> (pionnier du journalisme en ligne et web entrepreneur) que nous pouvons extraire quelques informations grĂ˘ce aux commentaires de Amit Singhal, responsable de la Search Quality chez Google et chef du projet Real Time Search.</p>
<h1>Classement du Tweet basĂ©e sur le PageRank</h1>
<p>Apparemment, Google utilise une technologie semblable Ă  celle du PageRank afin de sĂ©lectionner les Tweets qui mĂ©ritent dâ€™ĂŞtre publiĂ©s en temps rĂ©el au sein des rĂ©sultats de recherche et dans les Updates du Social Search.</p>
<p>La clef est dâ€™identifier les Followers de rĂ©putation honorable. Dans ce sens, le nombre de Followers nâ€™est pas le critĂ¨re prĂ©pondĂ©rant. Câ€™est plutĂ´t lâ€™ensemble du rĂ©seau autour du compte qui est analysĂ© afin de voir si lâ€™environnement est construit autour dâ€™une rĂ©putation quâ€™on peut qualifier de Â«Â recommandableÂ Â» ou Â«Â honorable.Â Â» Nous retrouvons ainsi les notions dâ€™autoritĂ© et rĂ©putation qui sont fortement impliquĂ©es dans le calcul du PageRank.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/01/tweet-matt-cutts.png" rel="shadowbox[sbpost-509];player=img;" title="tweet matt cutts"><img class="alignnone size-medium wp-image-510" title="tweet matt cutts" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/01/tweet-matt-cutts-300x122.png" alt="" width="300" height="122" /></a></p>
<h2>Encore et toujours le spam en ligne de mire</h2>
<p>Maintenant, il faut bien que Google puisse dĂ©cider instantanĂ©ment si un Tweet tend Ă  ĂŞtre du spam ou mĂŞme de mauvaise qualitĂ©.</p>
<p>Le hashtag (#) est utilisĂ© au sein des Tweets afin dâ€™associer le message Ă  certains mots clĂ©s. Cela permet de faire remonter le Tweet lorsquâ€™un utilisateur entre la requĂŞte associĂ©e au hashtag dans le moteur de recherche Twitter.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/01/tweet-referencement.png" rel="shadowbox[sbpost-509];player=img;" title="tweet-referencement"><img class="alignnone size-medium wp-image-511" title="tweet-referencement" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/01/tweet-referencement-300x126.png" alt="" width="300" height="126" /></a></p>
<p>Lâ€™intĂ©rĂŞt est dâ€™accroĂ®tre la visibilitĂ© dâ€™un Tweet, mais cela engendre Ă©videmment des abus avec des Tweets qui sont gavĂ©s de mots clĂ©s ou qui veulent faire passer un message publicitaire. Du coup, le hashtag est aussi symbole de spam, pub et mauvaise qualitĂ©. Pour bien faire, il faut savoir lâ€™utiliser sans en abuser.</p>
<p>Singhal prĂ©tend quâ€™ils ont rĂ©ussi Ă  modĂ©liser le comportement des utilisateurs par rapport Ă  lâ€™utilisation du hashtag. Bien entendu, il nâ€™est pas rentrĂ© dans les dĂ©tails, mais il remarque que cela constituait le vĂ©ritable challenge technique du Real Time Search.</p>
<p>Lorsquâ€™un utilisateur Ă©met une requĂŞte, Google scanne les Tweets afin dâ€™en retirer le ratio signal/bruit adĂ©quat. Un signal fort poussera le moteur Ă  afficher des Tweets en relation avec la requĂŞte, fournissant ainsi les rĂ©sultats les plus frais possibles.</p>
<p>Dans le futur, Google et Twitter veulent pousser du cĂ´tĂ© de la gĂ©o location des donnĂ©es, ainsi que de la tĂ©lĂ©phonie mobile.</p>
<p>Enfin Singhal rassure sur le fait que Twitter nâ€™est pas le seule source dâ€™information en temps rĂ©el. Chez Google, les autres mĂ©dians (actualitĂ©, blogs, pages Web) sont interprĂ©tĂ©e comme des composants du Web en temps rĂ©el. Twitter est juste pratique car il comporte un contenu trĂ¨s limitĂ© sur lequel il est plus facile de travailler du cĂ´tĂ© technique.</p>
<h3>Mon avis</h3>
<p>Pour ce que jâ€™ai testĂ©, le hashtag me semble vraiment valorisĂ©. En tout cas, jâ€™arrive Ă  faire apparaĂ®tre mon tweet assorti dâ€™un hashtag dans les updates Social Search et les recherches Web avec hashtag.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/01/tweet-css3.png" rel="shadowbox[sbpost-509];player=img;" title="tweet css3"><img class="alignnone size-medium wp-image-512" title="tweet css3" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/01/tweet-css3-300x207.png" alt="" width="300" height="207" /></a></p>
<p>Sans le hashtag, Ă§a se complique.Â  Aucun problĂ¨me pour la Updates, mais pour la recherche Web, il faut arriver Ă  dĂ©clencher une insertion de tweets et Ă§a ne marche pas Ă  tous les coups. Le mix hashtag plus mot clef sans # associĂ© marche aussi.</p>
<p>En dehors de Twitter, je vois passer quelques rĂ©sultats de micro-blogging issus de FriendsFeed et Jaiku, mais je nâ€™ai rien vu dâ€™autre dans la partie Update ou dans la zone Real Time Search des recherches Web.</p>
<p>Pas trouvĂ© non plus un type de profil privilĂ©giĂ© pour les comptes Twitter qui ressortent.<br />
Pour ma part, j&#8217;utilise le hashtag dans moins de 10% des tweets. Pour le reste, je ne suis pas plus assidu qu&#8217;un autre et encore moins influent. Pourtant, j&#8217;ai fais remonter chacun des tweets testĂ©s avec hashtag.</p>
<p>Il suffit dâ€™observer quelques minutes une requĂŞte comme Â«Â <a href="http://www.google.com/search?q=haiti&amp;ie=utf-8&amp;oe=utf-8&amp;aq=t&amp;rls=org.mozilla:fr:official&amp;client=firefox-a" target="_blank">haiti</a> Â» au lendemain des tremblements de terre pour vraiment voir cette recherche en temps rĂ©el Ă  lâ€™Ĺ“uvre. En effet, on remarque la prĂ©sence dâ€™une plus grande variĂ©tĂ© de sources qui sont incluses dans la zone de Real Time Search. Les tweets sont mĂŞme carrĂ©ment inondĂ©s par les articles dâ€™actualitĂ©s. Les tweets proposĂ©s ne mâ€™ont pas paru ĂŞtre indispensables pour mieux comprendre de quoi il sâ€™agit. Je nâ€™ai rien vu passer digne dâ€™ĂŞtre relevĂ© entre les incitations aux dons, les messages de soutien et le relais des articles de presse.</p>
<p>Le seul tweet qui mâ€™a interpellĂ© Ă©tait dâ€™un humour tellement nul quâ€™il mĂ©rite que je poste le screenshot, mais je ne vois pas ce quâ€™il venait faire sur la premiĂ¨re page de Google.</p>
<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/01/tweet-haiti.png" rel="shadowbox[sbpost-509];player=img;" title="tweet haiti"><img class="alignnone size-medium wp-image-513" title="tweet haiti" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2010/01/tweet-haiti-300x104.png" alt="" width="300" height="104" /></a></p>
<p>Bon, je crois quâ€™il est sage de ne pas sâ€™emballer sur ces inclusions Twitter au sein du moteur Google. J&#8217;avais dĂ©jĂ  Ă©mis des doutes lors de l&#8217;<a href="http://www.laurentbourrelly.com/blog/316.php">annonce du partenariat Twitter et Google</a>, mais je n&#8217;ai pas changĂ© d&#8217;avis. Ă‡a me semble encore brut de dĂ©coffrage et je ne pense pas que lâ€™algorithme qui traite le Real Time Search arrive Ă  la cheville du PageRank. <a href="http://econsultancy.com/blog/5239-googles-real-time-ranking-factors-for-twitter" target="_blank">Chris Lake</a> se pose plein de questions et j&#8217;avoue ne pas vouloir faire des plans sur la comĂ¨te sous peine de partir dans les travers du &laquo;&nbsp;reverse engineering Ă  la petite semaine&nbsp;&raquo; dont j&#8217;ai horreur.</p>
<p>A voir si j&#8217;ai la motivation pour pousser les tests plus loin que le hashtag, mais je suis curieux de savoir ce que vous avez trouvĂ© au sujet du classement des tweets par Google.</p>
<p>Fondamentalement, le problĂ¨me reste le mĂŞmeÂ : Google ne comprend pas ce quâ€™il lit. A partir de lĂ , on peut nous sortir toutes les formules mathĂ©matiques possibles sans jamais pouvoir atteindre lâ€™Ă©valuation sĂ©mantique nĂ©cessaire.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.laurentbourrelly.com/blog/509.php/feed</wfw:commentRss>
		<slash:comments>35</slash:comments>
		</item>
		<item>
		<title>Murdoch contre Google ou la fin dâ€™un rĂ¨gne</title>
		<link>http://www.laurentbourrelly.com/blog/446.php</link>
		<comments>http://www.laurentbourrelly.com/blog/446.php#comments</comments>
		<pubDate>Tue, 24 Nov 2009 11:12:20 +0000</pubDate>
		<dc:creator>Laurent</dc:creator>
				<category><![CDATA[Moteurs de recherche]]></category>
		<category><![CDATA[actualitĂ©]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Google News]]></category>
		<category><![CDATA[information]]></category>
		<category><![CDATA[monde]]></category>
		<category><![CDATA[moteur de recherche]]></category>
		<category><![CDATA[Murdoch]]></category>
		<category><![CDATA[pouvoir]]></category>

		<guid isPermaLink="false">http://www.laurentbourrelly.com/blog/?p=446</guid>
		<description><![CDATA[La joute qui se dĂ©roule en ce moment entre Rupert Murdoch &#8211; le magnat de la presse internationale &#8211; et Google &#8211; le grand ordonnateur du Web et au-delĂ  &#8211; Ă©voque beaucoup plus quâ€™une affaire de gros sous. Quelles sont les forces en prĂ©sence et les consĂ©quences de cette lutte ? Ce qui semblait ĂŞtre [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/murdoch-google.jpg" rel="shadowbox[sbpost-446];player=img;" title="Le combat entre Google et Murdoch"><img class="alignleft size-thumbnail wp-image-447" style="border: 0pt none; margin: 0px 10px;" title="Le combat entre Google et Murdoch" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/murdoch-google-150x150.jpg" alt="Le combat entre Google et Murdoch" width="90" height="90" align="left" /></a>La joute qui se dĂ©roule en ce moment entre Rupert Murdoch &#8211; le magnat de la presse internationale &#8211; et Google &#8211; le grand ordonnateur du Web et au-delĂ  &#8211; Ă©voque beaucoup plus quâ€™une affaire de gros sous.</p>
<p>Quelles sont les forces en prĂ©sence et les consĂ©quences de cette lutte ?<span id="more-446"></span></p>
<p>Ce qui semblait ĂŞtre un coup de gueule de la part dâ€™un des plus gros patron de presse au monde, rĂ©vĂ¨le plutĂ´t un bouleversement de proportions dantesques.</p>
<h1>Le vieux lion contre le jeune loup</h1>
<p>Pour replacer dans le contexte, je rappelle que Rupert MurdochÂ est lâ€™homme le plus dangereux du monde. Les centaines de mĂ©dias majeurs possĂ©dĂ©s par cet homme peuvent dĂ©clencher les pires maux possibles et imaginables au sein dâ€™une sociĂ©tĂ©. Un simple exemple en 2003 avec les 175 journaux de Murdoch qui soutenaient unanimement la guerre en Irak.</p>
<p>Ces mĂ©dias reprĂ©sentent la vieille Ă©coleÂ : tĂ©lĂ©vision, presse et radio. Sans avoir besoin de dĂ©codeur, tout le monde a compris que lâ€™ancien modĂ¨le mĂ©diatique se faisait dĂ©gager aussi vite quâ€™un pet glisse sur une toile cirĂ©e.</p>
<p>De lâ€™autre cĂ´tĂ© du ring, se dresse Google, le glouton du Web qui moissonne tout sur le passage de son algorithme. Il a suffit dâ€™une demie dĂ©cennie pour que ce moteur de recherche avale les donnĂ©es de la planĂ¨te entiĂ¨re.</p>
<p>Le combat pour la ceinture des poids lourds de lâ€™info Ă©tait jouĂ©e dâ€™avance. Il semblerait donc que lâ€™annĂ©e 2009 va sâ€™Ă©teindre avec lâ€™effondrement total du paysage mĂ©diatique tel que nous lâ€™avons connu.</p>
<p>Il ne peut y avoir quâ€™un seul maĂ®tre du monde. Murdoch pousse un dernier rugissement, mais lâ€™ogre du monde virtuel lâ€™a dĂ©jĂ  dĂ©capitĂ© depuis belle lurette.</p>
<h2>Histoire d&#8217;une dĂ©faite annoncĂ©e</h2>
<p>Car il ne faut pas se faire dâ€™illusion. Aussi hallucinant que Ă§a puisse paraĂ®tre, Google sâ€™est farcit Murdoch et sa News Corporation dĂ¨s le premier jour du lancement de Google News. Un algorithme mathĂ©matique appuyĂ© par des serveurs a fait un barbecue avec la presse traditionnelle par une mĂ©thode tellement efficace que ses propres crĂ©ateurs ne pouvaient sans doute pas imaginer.</p>
<p>Ce qui mâ€™Ă©tonne est que Murdoch ait attendu que le Glouton ait dĂ©jĂ  tout dĂ©vorĂ© avant dâ€™aboyer de la sorte. AprĂ¨s avoir beuglĂ©, le vieux lion sâ€™est crĂ» malin en se tournant vers lâ€™adversaire le plus puissant en face de Google. Les discussions actuelles entre Murdoch et Microsoft sâ€™apparentent Ă  se tenir par le petit doigt sur une bouĂ©e crevĂ©e au milieu dâ€™un ouragan. Il aurait peut-ĂŞtre Ă©tĂ© sage dâ€™informer Murdoch que Google avait fait du petit bois de Microsoft depuis bien longtemps. Sur le Web, il nâ€™y a quâ€™un seul prĂ©dateur et son nom ne commence pas par M.</p>
<p>De lâ€™autre cĂ´tĂ©, le prĂ©dateur Google se contente de cracher dĂ©daigneusement Ă  la face deÂ  Murdoch et son empire, en expliquant que les sources dâ€™information sont libres de ne pas figurer dans son agrĂ©gateur dâ€™actualitĂ©s. En guise, de gros molard soufflĂ© sur les lunettes du vieux Murdoch, Google rappelle que son service dâ€™actualitĂ© dĂ©pote 100 000 visiteurs Ă  la minute.</p>
<p>A la base, Google est un voleur de contenu. Il sâ€™approprie le travail dâ€™autrui pour alimenter sa machine Ă  indexer. Personne nâ€™a bronchĂ©Â ; bien au contraire, tout le monde sâ€™est empressĂ© dâ€™alimenter le monstre. Donc, Google a continuĂ© dâ€™avaler tout ce quâ€™il pouvait trouver comme donnĂ©es sur Internet, puis il sâ€™est attaquĂ© au resteâ€¦</p>
<p>Lâ€™enjeu est simple, mais le rĂ©sultat sera dĂ©terminant pour la face du monde mĂ©diatique et bien plus encore.</p>
<p>Logiquement, il faudrait que Google paye pour diffuser les sources dâ€™information. Sauf que maintenant, il est trop tard puisque les millions dâ€™internautes atteints de googlĂŻte aigĂĽe reprĂ©sentent un levier surpuissant. Aujourdâ€™hui, la tendance est complĂ¨tement renversĂ©eÂ ; câ€™est Google quâ€™on doit logiquement grassement payer pour recueillir une fraction dâ€™Ă©lectron de son Ă©norme trafic.</p>
<p>Une entitĂ© qui nâ€™est pas capable dâ€™attirer lâ€™attention, sans se retourner contre un tel pourvoyeur de visiteurs, a avouĂ© sa faiblesse. En bref, la News Corporation de Murdoch doit disparaĂ®tre car il nâ€™est pas possible dâ€™exister sur Internet sans Google. Le monstre est devenu trop puissant pour lutter, mĂŞme quand on sâ€™appelle Murdoch. Lâ€™homme le plus dangereux du monde sâ€™est fait dĂ©trĂ´ner par une formule mathĂ©matique, sans quâ€™un seul coup de feu soit tirĂ©. Câ€™est peut-ĂŞtre lĂ  quâ€™est le problĂ¨me. Le vieux brigand Ă©tait affutĂ© pour lutter contre les plus puissants et vicieux de la planĂ¨te, mais il nâ€™Ă©tait pas prĂ©parĂ© Ă  affronter ces jeunes de la Sillicon Valley qui proposent gratuitement des outils trĂ¨s utiles aux internautes.</p>
<h3>Rien n&#8217;est jamais gratuit</h3>
<p>VoilĂ , nous venons dâ€™apprendre la fin du monde tel que nous lâ€™avons connu. La gratuitĂ© de Google News et des autres services associĂ©s au moteur de recherche sont un bienfait pour lâ€™utilisateur. Ces outils gĂ©niaux sont une aubaine pour vous et moi qui bĂ©nĂ©ficionsÂ  sans bourse dĂ©lier. Sauf que le prix Ă  payer est peut-ĂŞtre beaucoup plus important que le prix dâ€™un quotidien papier ou dâ€™une licence pour un webmail. Je suis loin dâ€™ĂŞtre le seul Ă  dĂ©coder clairement oĂą Google nous entraine, mais ceux qui dirigent le monde sont nuls au point de nâ€™avoir rien vu venirÂ ?</p>
<p>Vous devriez acheter un exemplaire de votre journal prĂ©fĂ©rĂ© le 31 dĂ©cembre 2009 car câ€™est peut-ĂŞtre la derniĂ¨re fois que la Saint Sylvestre sera cĂ©lĂ©brĂ©e sur un quotidien en papier.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.laurentbourrelly.com/blog/446.php/feed</wfw:commentRss>
		<slash:comments>25</slash:comments>
		</item>
		<item>
		<title>Les trouvailles de la confĂ©rence SMX East &#8211; octobre 2009</title>
		<link>http://www.laurentbourrelly.com/blog/400.php</link>
		<comments>http://www.laurentbourrelly.com/blog/400.php#comments</comments>
		<pubDate>Tue, 17 Nov 2009 23:21:09 +0000</pubDate>
		<dc:creator>Laurent</dc:creator>
				<category><![CDATA[Moteurs de recherche]]></category>
		<category><![CDATA[301]]></category>
		<category><![CDATA[302]]></category>
		<category><![CDATA[Adam Audette]]></category>
		<category><![CDATA[Bing]]></category>
		<category><![CDATA[confĂ©rence]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[googler]]></category>
		<category><![CDATA[indexation]]></category>
		<category><![CDATA[information]]></category>
		<category><![CDATA[Joachim Kupke]]></category>
		<category><![CDATA[Matt Cutts]]></category>
		<category><![CDATA[moteur de recherche]]></category>
		<category><![CDATA[recherche]]></category>
		<category><![CDATA[redirection]]></category>
		<category><![CDATA[RĂ©fĂ©rencement]]></category>
		<category><![CDATA[SMX]]></category>
		<category><![CDATA[Yahoo]]></category>

		<guid isPermaLink="false">http://www.laurentbourrelly.com/blog/?p=400</guid>
		<description><![CDATA[L&#8217;article suivant est une traduction autorisĂ©e par Adam Audette (@audette) que je remercie pour sa gentillesse et son partage qui nous informe sur quelques Ă©lĂ©ments trĂ¨s intĂ©ressants Ă  propos de l&#8217;indexation sur Google. Les informations suivantes viennent d&#8217;une confĂ©rence de Joachim Kupke, employĂ© chez Google pour la partie indexation du moteur de recherche. Les trĂ©sors [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/seo-confidentiel.jpg" rel="shadowbox[sbpost-400];player=img;" title="seo confidentiel"><img class="alignleft size-thumbnail wp-image-408" style="border: 0pt none; margin: 0px 10px;" title="seo confidentiel" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/seo-confidentiel-150x150.jpg" alt="seo confidentiel" width="135" height="135" align="left" /></a>L&#8217;article suivant est une traduction autorisĂ©e par <a href="http://www.audettemedia.com/" target="_blank">Adam Audette</a> (<a href="http://twitter.com/audette" target="_blank">@audette</a>) que je remercie pour sa gentillesse et son partage qui nous informe sur quelques Ă©lĂ©ments trĂ¨s intĂ©ressants Ă  propos de l&#8217;indexation sur Google.</p>
<p>Les informations suivantes viennent d&#8217;une confĂ©rence de Joachim Kupke, employĂ© chez Google pour la partie indexation du moteur de recherche.<span id="more-400"></span></p>
<h2>Les trĂ©sors distribuĂ©s par Joachim Kupke (Google) lors de la confĂ©rence SMX</h2>
<p>Voici 9 trouvailles sur le rĂ©fĂ©rencement qui ressortent de la confĂ©rence <a href="http://searchmarketingexpo.com/east/2009" target="_blank">SMX East</a> qui sâ€™est dĂ©roulĂ©e Ă  New York en octobre. Globalement, câ€™Ă©tait une confĂ©rence impeccable, mis Ă  part les soucis de Wifi et autres de Javits CenterÂ  le maudit. Danny Sullivan (lâ€™organisateur de la confĂ©rence pour ceux qui vivent sous un rocher) a rĂ©pĂ©tĂ© que Â«Â Javits est pourriÂ Â», Â«Â accusez Javits, ne nous mettez pas Ă§a sur le dosÂ Â». Danny, nous accusons JavitsÂ !</p>
<p>Cette annĂ©e, parmi les absences remarquĂ©es de SMX East, il fallait compter <a href="http://twitter.com/mattcutts" target="_blank">Matt Cutts</a> et <a href="http://twitter.com/nathanbuggia" target="_blank">Nathan Buggia</a>, mais câ€™Ă©tait un plaisir dâ€™Ă©couter des googlers moins connus (Maile Ohye) et des intervenants de Microsoft/Bing (Sasi Parthasarathy).</p>
<p>En tant que rĂ©fĂ©renceur, je suis particuliĂ¨rement intĂ©ressĂ© par ce que les moteurs de recherche vont dire au sujet de paramĂ¨tres techniques spĂ©cifiques comme lâ€™indexation, le contenu dupliquĂ©, le crawl et les redirections. Cette confĂ©rence proposait quelques sessions extraordinaires oĂą un grand nombre dâ€™informations Ă©taient au centre des dĂ©bats.</p>
<p>Il y avait aussi quelques surprises (voir ci-dessous) et une paire de nouveautĂ©s, mais en gĂ©nĂ©ral lâ€™information partagĂ©e par Joachim et les autres reprĂ©sentants des moteurs de recherche portait sur des Ă©lĂ©ments spĂ©cifiques qui pourraient paraĂ®tre obscurs Ă  quiconque en dehors du cercle des Â«Â initiĂ©sÂ Â» du rĂ©fĂ©rencement. Jâ€™adore vraiment tous ces trucs dâ€™initiĂ©sÂ !</p>
<p>Allons-y pour les 9 trouvailles utiles pour le rĂ©fĂ©rencement qui sont extraites de la contribution de Joachim Kupke lors de SMX East</p>
<p><strong>PrĂ©sentation de Joachim Kupke sur le contenu dupliquĂ©</strong></p>
<p style="text-align: center;"><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/google-content-duplique.png" rel="shadowbox[sbpost-400];player=img;" title="Google et le contenu dupliquĂ©"><img class="size-full wp-image-401 aligncenter" title="Google et le contenu dupliquĂ©" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/google-content-duplique.png" alt="google-content-duplique" width="302" height="74" /></a></p>
<p>Joachim fait partie de lâ€™Ă©quipe qui sâ€™occupe de lâ€™indexation chez Google. Il a partagĂ© des bribes dâ€™informations assez primordiales au sujet de la gestion du contenu dupliquĂ© par Google. Joachim a Ă©galement partagĂ© quelques vues depuis lâ€™intĂ©rieur du moteur et sa faĂ§on de voir le Web et indexer les URLs. Voici les points essentiels que jâ€™ai retenus.</p>
<h3>1. Impressions et Clics</h3>
<p>Joachim a rĂ©pĂ©tĂ© les termes Â«Â impressionsÂ Â» et Â«Â clicsÂ Â» dans le contexte dâ€™une URL incluse dans lâ€™index de Google. Il a mentionnĂ© quâ€™une URL qui reĂ§oit peu ou pas dâ€™impressions sera plausiblement plus longue Ă  mettre Ă  jour dans lâ€™index (pas de surprise jusque lĂ ). Cependant, une URL recevant un grand nombre dâ€™impressions et clics (ou provenant de domaines importants et crawlĂ©s frĂ©quemment) sera mise Ă  jour rapidement. Câ€™est logique et connu de tous, mais il Ă©tait intĂ©ressant dâ€™avoir une confirmation sortie de la bouche dâ€™un ingĂ©nieur de chez Google. Ainsi, ces redirections 301 et tags noindex sur certaines pages qui ne sont pas crawlĂ©s Ă  nouveau et mis Ă  jour viennent dĂ©finitivement du fait quâ€™elles ne figurent pas sur la liste prioritaire du moteur de recherche (encore une raison pour laquelle <a href="http://www.seobook.com/google-branding" target="_blank">les grandes marques lâ€™ont facile en rĂ©fĂ©rencement</a>)</p>
<h3>2. Infrastructure de gestion du contenu dupliquĂ©</h3>
<p>Google est censĂ© avoir Â«Â une tonne dâ€™infrastructure pour Ă©liminer le contenu dupliquĂ©Â Â», parmi laquelle il faut citerÂ :</p>
<ul>
<li>Redirection</li>
<li>DĂ©tection de structure rĂ©currente dâ€™URLs</li>
<li>Le contenu de la page</li>
<li>Le tag de lien canonical (si tout le reste Ă©choue)</li>
</ul>
<p>A noter que Google reconnaĂ®t les structures des URLS, Ă©liminant certains paramĂ¨tres comme cause de duplication (bien sĂ»r, ils ont Ă©galement parlĂ© de <a href="http://googlewebmastercentral.blogspot.com/2009/10/reunifying-duplicate-content-on-your.html" target="_blank">lâ€™outil dâ€™Ă©limination de paramĂ¨tre dans les Outils Webmaster Google</a>).</p>
<p>Que veux-tu dire par Â«Â le contenu de la pageÂ Â»Â ? Ceci Ă©tant la partie la plus intĂ©ressante selon moi, voici la suiteâ€¦</p>
<h3>3. Enregistrement de lâ€™historique des URLs</h3>
<p>Google garde une sorte de archive.org du Web avec des versions plus anciennes du contenu (pas exactement comme cela, mais vous voyez ce que je veux direÂ : un enregistrement de lâ€™historique des pages Web). Cela permet de comparer la version fraichement crawlĂ©e avec une version plus ancienne. Le contenu qui change peut ĂŞtre soustrait des Ă©lĂ©ments qui restent invariables au sein du site. Cela peut Ă©galement donner Ă  Google la facultĂ© de sâ€™assurer que les Ă©lĂ©ments globaux, zones et morceaux de contenu apparaissent Ă  lâ€™intĂ©rieur dâ€™un site sĂ©parĂ©ment du contenu dĂ©finitivement unique et mis Ă  jour.</p>
<h3>4 . Google + rel=canonical = Amour</h3>
<p>Google adore le tag Â«Â canonicalÂ Â» des liens. Selon Joachim, câ€™est une grande rĂ©ussite qui a vu un rythme de dĂ©ploiement exponentiel sur Internet. Chez Google, on traite ce tag avec le plus grand sĂ©rieux, en suggĂ©rant son importance comme <a href="http://www.seomoz.org/blog/whiteboard-friday-interview-with-googles-maile-ohye" target="_blank">Maile Ohye</a> nous a expliquĂ© Ă  lâ€™occasion de <a href="http://searchmarketingexpo.com/advanced/2009/full_agenda#222" target="_blank">SMX Advanced en juin</a>.Â  Lâ€™intĂ©rĂŞt de ce paramĂ¨tre est donc renforcĂ© par les propos de Maile et Joachim. Cela engendre un Â«Â Ă©norme impactÂ Â» Ă  propos des dĂ©cisions de Google sur la canonicalisationÂ : 2 fois sur 3, rel=canonical altĂ¨re la dĂ©cision organique. Câ€™est assez Ă©norme comme chiffreÂ !</p>
<h3>5. Les 302 suffisent comme cibles canoniques</h3>
<p>Les redirections font des cibles canoniques correctes. Ce paramĂ¨tre a Ă©tĂ© expliquĂ© par Joachim Ă  deux reprises. Cela comporte deux partiesÂ :</p>
<ul>
<li>A cause dâ€™une mĂ©thode interne pour gĂ©rer les slashs de fermeture des URLs, Google avait besoin (et recommande Ă  tous les dĂ©veloppeurs dâ€™agir de la sorte) dâ€™un slash de fermeture sur les cibles canoniques et les liens internes. Sans le slash de fermeture, Google va ajouter un slash et mettre Ă  jour lâ€™URL dans lâ€™index.<br />
Maintenant, jâ€™ai trouvĂ© de multiples exemples de pages oĂą cela ne se dĂ©roule pas de la sorte, mais Joachim Ă©tait assez ferme sur le fait que câ€™est un problĂ¨me du Web en gĂ©nĂ©ral que Google est obligĂ© de contourner.</li>
</ul>
<ul>
<li>La trouvaille en la matiĂ¨re est que vous devriez toujours ajouter un slash de fermeture Ă  lâ€™URL absolue de la cible canonique. Sans le faire, Google va lâ€™ajouter automatiquement, mais en anticipant cette action, vous allez certainement accĂ©lĂ©rer la vitesse de rĂ©ponse du serveur (qui aurait un impact pour les sites de taille importante).</li>
</ul>
<h3>6. Comment les cibles canoniques en 302 peuvent ĂŞtre dĂ©tournĂ©es</h3>
<p>Les redirections 302 sont donc des cibles canoniques adĂ©quates. Oui je sais que je me rĂ©pĂ¨teÂ ! Voici la partie intĂ©ressante pour le rĂ©fĂ©rencementÂ : si les 302 sont OK Ă  utiliser dans ce cadre, je pense Ă  une mĂ©thode pour utiliser le tag Â«Â canonicalÂ Â» du lien Ă  des fins dâ€™optimisation du rĂ©fĂ©rencement sans avoir Ă  amĂ©liorer Ă©normĂ©ment la structure de lâ€™URL. Comment celaÂ ? Voici un exemple thĂ©oriqueÂ :</p>
<p>Prenons, un site qui prĂ©sente une structure dâ€™URL Ă  amĂ©liorer (voir <a href="http://www.cabelas.com/" target="_blank">cet exemple</a> ) pour le rĂ©fĂ©rencement et des raisons dâ€™usabilitĂ© Ă©videntes. Cependant, les dĂ©veloppeurs sont dans le jus, la plateforme technique est branlante, il nâ€™y a pas assez dâ€™argent pour un budget rĂ©fĂ©rencement de qualitĂ©, ou simplement les modifications ne valent peut-ĂŞtre pas la peine.</p>
<p>Un rĂ©fĂ©renceur arrive avec la proposition suivanteÂ :</p>
<ol>
<li>CrĂ©er un tableau avec une version optimisĂ©e pour le rĂ©fĂ©rencement de chaque URL Ă  amĂ©liorer.</li>
<li>Ajouter ces URLs amies des moteurs dans le code source avec le tag Â«Â rel=canonicalÂ Â»</li>
<li>Effectuer une redirection 302 depuis les URLs canoniques vers les URLs dĂ©gueulasses existantes sur le site.</li>
<li>Bingo! Des jolies URLs au sein des rĂ©sultats de recherche</li>
</ol>
<p>Le tag Â«Â canonicalÂ Â» agit comme une redirection 301 et met Ă  jour les indicateurs dans les rĂ©sultats de recherche (comme câ€™est le cas). Puis la cible canonique redirige vers une 302 qui ne force pas la mise Ă  jour (comme câ€™est le cas). Alors la jolie (et pseudo) URL dans le lien cible canonique va rester comme indicateur dans les rĂ©sultats de recherche, pendant que la non-pseudo URL bien dĂ©goutante va agir en tant que page temporaire aux yeux des moteurs. PigĂ©Â ? Avouez que câ€™est intĂ©ressant (voir le graphique basique ci-dessous pour un visuel de ce concept).</p>
<p style="text-align: center;"><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/rel-canonical1.png" rel="shadowbox[sbpost-400];player=img;" title="rel-canonical"><img class="aligncenter size-medium wp-image-403" title="rel-canonical" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/rel-canonical1-300x200.png" alt="rel=canonical" width="300" height="200" /></a></p>
<p>Non, je nâ€™ai pas planifiĂ© de mettre en Ĺ“uvre ceci incessamment sous peu, mais je connais au moins un site majeur dâ€™e-commerce qui agit de la sorte (certainement de maniĂ¨re involontaire) et Ă§a fonctionne parfaitement depuis le mois de juin.</p>
<h3>7. Ne pas interdire votre contenu dupliquĂ© (Â ?)</h3>
<p>Google dit Â«Â sâ€™il vous plait, nâ€™utilisez pas la directive Â«Â DisallowÂ :Â Â» dans le Robots.txt afin dâ€™Ă©radiquer le contenu dupliquĂ©Â Â». Le contenu qui nâ€™est pas disponible pour Google ne peut donc pas ĂŞtre visitĂ© et le moteur de recherche nâ€™aime pas du tout cela. La prĂ©fĂ©rence semble aller vers Â«Â mettez tout en ligneÂ Â» et laissez nous dĂ©cider ce quâ€™il y a de mieux Ă  faire. Chaque fois quâ€™un contenu nâ€™est pas disponible au crawl, les moteurs perdent la facultĂ© de faire ce choix dĂ©cisionnaire.</p>
<p>Ma prĂ©fĂ©rence personnelle est de garder le contrĂ´le complet, mais je comprends Ă©galement leur raisonnement et la raison qui pousse Ă  promouvoir cette mĂ©thode.</p>
<h3>8. Lâ€™indexation peut prendre longtemps pour des URLs Â«Â impopulairesÂ Â»</h3>
<p>Joachim a expliquĂ© quâ€™indexer peut prendre du temps (comme mentionnĂ© prĂ©cĂ©demment), mais câ€™est encore plus vrai pour des URLs obscures et peu populaires. Il faut savoir que la phase dâ€™indexation prend du temps, mais que le nettoyage des parties existantes de lâ€™index prend encore plus de temps. Bien entendu, il existe <a href="http://sebastians-pamphlets.com/pubsubhubbub-googlebot-invitations/" target="_blank">des maniĂ¨res dâ€™initier le crawl de Google</a> (phase sĂ©parĂ©e de la mise Ă  jour dans lâ€™index), mais il est indĂ©niable que les sites moins connus ne reĂ§oivent pas la mĂŞme attention que les bons gros sites populaires.</p>
<h3>9. Support du lien canonique au travers de diffĂ©rents domaines</h3>
<p>Google va bientĂ´t accepter le tag Â«Â canonicalÂ Â» sur diffĂ©rents noms de domaine. Câ€™est une grande nouvelleÂ ! YahooÂ ! et Bing ont annoncĂ© quâ€™ils travaillent sur la base qui est de comprendre rel=canonical.</p>
<p><strong>Les autres trucs supers Ă  SMX East</strong></p>
<p>Il y avait Ă©normĂ©ment dâ€™autres sessions extraordinaires comme <a href="http://www.getlisted.org/" target="_blank">David Mihm</a>, <a href="http://www.searchinfluence.com/" target="_blank">Will Scott</a>, <a href="http://www.localseoguide.com/" target="_blank">Andrew Shotland</a>, <a href="http://blumenthals.com/blog/" target="_blank">Mike Blumenthal</a> et <a href="http://www.marybowling.com/" target="_blank">Mary Bowling</a> qui ont traitĂ© des paramĂ¨tres locaux liĂ©s au rĂ©fĂ©rencement. La rĂ©gionalisation est un secteur vraiment excitant en ce moment pour les rĂ©fĂ©renceurs. Cette Ă©quipe a proposĂ© une session vraiment gĂ©niale. Tout cela mâ€™a tellement motivĂ© que je suis revenu avec lâ€™intention de creuser encore plus au niveau Â«Â localÂ Â».</p>
<p><a href="http://www.audettemedia.com/blog/9-seo-takeaways-smx-east/">Article original</a> (en anglais)</p>
<p>Remerciements : <a href="http://www.taggle.org/">Taggle</a> &amp; <a href="http://www.altiref.com/">Altiref</a></p>
]]></content:encoded>
			<wfw:commentRss>http://www.laurentbourrelly.com/blog/400.php/feed</wfw:commentRss>
		<slash:comments>40</slash:comments>
		</item>
		<item>
		<title>Faut-il avoir peur de la mise Ă  jour Google CafĂ©ine ?</title>
		<link>http://www.laurentbourrelly.com/blog/387.php</link>
		<comments>http://www.laurentbourrelly.com/blog/387.php#comments</comments>
		<pubDate>Sat, 14 Nov 2009 21:49:22 +0000</pubDate>
		<dc:creator>Laurent</dc:creator>
				<category><![CDATA[Moteurs de recherche]]></category>
		<category><![CDATA[algorithme]]></category>
		<category><![CDATA[DataCenter]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Google CafĂ©ine]]></category>
		<category><![CDATA[Google Caffeine]]></category>
		<category><![CDATA[indexation]]></category>
		<category><![CDATA[Internet]]></category>
		<category><![CDATA[Mashable]]></category>
		<category><![CDATA[Matt Cutts]]></category>
		<category><![CDATA[moteur de recherche]]></category>
		<category><![CDATA[mythe]]></category>
		<category><![CDATA[page Web]]></category>
		<category><![CDATA[pĂ©nalitĂ©]]></category>
		<category><![CDATA[RĂ©fĂ©rencement]]></category>
		<category><![CDATA[rĂ©sultat de recheche]]></category>
		<category><![CDATA[rumeur]]></category>
		<category><![CDATA[SearchEngineLand]]></category>
		<category><![CDATA[secret]]></category>
		<category><![CDATA[web]]></category>

		<guid isPermaLink="false">http://www.laurentbourrelly.com/blog/?p=387</guid>
		<description><![CDATA[Les stigmates des bouleversements causĂ©s par certaines mises Ă  jour Google, telles que Florida en 2003 restent gravĂ©s dans la mĂ©moire collective du rĂ©fĂ©rencement. Lâ€™annonce dâ€™une mise Ă  jour surnommĂ©e CafĂ©ine (Caffeine en anglais) provoque des remous plus ou moins justifiĂ©s, au travers de ceux qui s&#8217;intĂ©ressent Ă  Google et au rĂ©fĂ©rencement de site Internet. [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/google-cafeine.png" rel="shadowbox[sbpost-387];player=img;" title="La mise Ă  jour de Google Cafeine"><img class="alignleft size-thumbnail wp-image-388" style="border: 0pt none; margin: 0px 10px;" title="La mise Ă  jour de Google Cafeine" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/google-cafeine-150x150.png" alt="La mise Ă  jour de Google Cafeine" width="135" height="135" align="left" /></a>Les stigmates des bouleversements causĂ©s par certaines mises Ă  jour Google, telles que Florida en 2003 restent gravĂ©s dans la mĂ©moire collective du rĂ©fĂ©rencement.</p>
<p>Lâ€™annonce dâ€™une mise Ă  jour surnommĂ©e CafĂ©ine (Caffeine en anglais) provoque des remous plus ou moins justifiĂ©s, au travers de ceux qui s&#8217;intĂ©ressent Ă  Google et au rĂ©fĂ©rencement de site Internet.<span id="more-387"></span></p>
<p>Faut-il que ceux, qui possĂ¨dent des sites positionnĂ©s convenablement parmi les rĂ©sultats de recherche Google,Â  redoutent la mise Ă  jour CafĂ©ine?</p>
<p>Comme dâ€™habitude, les pseudo analyses, suppositions et autres interprĂ©tations fleurissent au travers des blogs et forums Ă  propos de la mise Ă  jour CafĂ©ine. Câ€™est comme cela que naissent les mythes du rĂ©fĂ©rencement, habilement alimentĂ©s par Google causĂ© par un manque de transparence rĂ©curent.</p>
<h1>Qu&#8217;est ce que Google CafĂ©ine?</h1>
<p>Il Ă©tait Ă©vident que certains allaient sortir des thĂ©ories alimentant la pompe Ă  <a href="http://www.laurentbourrelly.com/blog/369.php" target="_blank">mythes et secrets du rĂ©fĂ©rencement</a>.<br />
En guise d&#8217;avertissement, nous avons reĂ§u une <a href="http://googlewebmastercentral.blogspot.com/2009/08/help-test-some-next-generation.html" target="_blank">annonce</a> officielle de Google, plusieurs interviews de Matt Cutts, ainsi qu&#8217;un <a href="http://www.mattcutts.com/blog/google-caffeine-update/" target="_blank">post</a> sur son blog se voulant rassurant. Sur le Web, la discussion est bien lancĂ©e sur <a href="http://blogsearch.google.com/blogsearch?q=google+caffeine" target="_blank">blogs</a>, <a href="http://www.webmasterworld.com/google/3999055.htm" target="_blank">forums</a>, <a href="http://search.twitter.com/search?q=google+caffeine" target="_blank">Twitter</a>, etc.<br />
Une <a href="http://www2.sandbox.google.com/" target="_blank">URL</a> mettait Ă  disposition lâ€™accĂ¨s Ă  un aperĂ§u de l&#8217;index Google CafĂ©ine. Cet accĂ¨s est fermĂ© depuis le 10 novembre 2009.</p>
<h4>Interview de Matt Cutts Ă  propos de Google Caffeine</h4>
<p><a href="http://www.youtube.com/v/NU5cKDryjy0" rel="shadowbox[sbpost-387];player=swf;width=640;height=385;" title="Interview de Matt Cutts parlant de Google CafĂ©ine"><img class="alignnone size-medium wp-image-389" title="Interview de Matt Cutts parlant de Google CafĂ©ine" src="http://www.laurentbourrelly.com/blog/wp-content/uploads/2009/11/Matt-Cutts-Google-Caffeine-300x193.png" alt="Interview de Matt Cutts parlant de Google CafĂ©ine" width="300" height="193" /></a></p>
<h2>Propagation de la rumeur et mise en route dâ€™un mythe</h2>
<p>Au dĂ©part, <a href="http://mashable.com/2009/08/10/google-caffeine/" target="_blank">Mashable</a> sort une analyse que je qualifie de tout Ă  fait superficielle. Le point subjectif concerne une soi-disant pondĂ©ration supĂ©rieure des mots clĂ©s sur Google CafĂ©ine.</p>
<p>Un blogueur franĂ§ais orientĂ© rĂ©fĂ©rencementÂ  <a href="http://bababillgates.free.fr/index.php/googe-caffeine-a-t-il-un-impact-sur-le-seo-et-le-referencement/" target="_blank">reprend</a> la teneur de lâ€™analyse Mashable Ă  son propre compte (sans citer la source dâ€™origine qui l&#8217;a inspirĂ©) et dâ€™<a href="http://www.global-referencement.fr/SEO/google/tests-sur-impact-google-caffeine-seo.html" target="_blank">autres</a> vont citer ce billet sur leurs <a href="http://www.concepteur-redacteur-blog.com/2009/11/12/rank-tracker-google-caffeine/" target="_blank">blogs</a>, <a href="http://topsy.com/tb/bababillgates.free.fr/index.php/googe-caffeine-a-t-il-un-impact-sur-le-seo-et-le-referencement/" target="_blank">Twitter</a> et autres sources de partage de contenu. MĂŞme le <a href="http://www.journaldunet.com/solutions/moteur-referencement/selection/caffeine-le-futur-moteur-de-recherche-de-google/des-changements-en-perspective.shtml" target="_blank">Journal du Net</a> met les pieds dans le plat sans savoir de quoi il s&#8217;agit vĂ©ritablement.</p>
<p>Le pire de tous est <a href="http://ezinearticles.com/?Learn-How-Google-Caffeine-Will-Affect-Your-Website!&amp;id=2777909" target="_blank">celui lĂ </a> qui part dans un dĂ©lire total, voulant sciemment propager une peur parmi ses lecteurs.</p>
<h3>Ce qu&#8217;il faut retenir Ă  propos de Google CafĂ©ine</h3>
<p>Google CafĂ©ine est un nouvel index hĂ©bergĂ© par une nouvelle infrastructure qui repose sur le Google File System V. 2., dont la structure nous est <a href="http://www.webrankinfo.com/actualites/200411-infrastructure-google.htm" target="_blank">connue</a> depuis 2004.Â  La V.2 conĂ§oit une Ă©volution majeure du Google File System, permettant d&#8217;amĂ©liorer l&#8217;indexation et la gestion des donnĂ©es.</p>
<p><strong>Cela entraineÂ principalement:</strong></p>
<ul>
<li>Une amĂ©lioration de vitesse dâ€™indexation</li>
<li>Une plus grande fiabilitĂ© sur les rĂ©sultats de recherche</li>
<li>Des moyens dĂ©cuplĂ©s en interne pour le travail des ingĂ©nieurs Google</li>
</ul>
<p>Les observateurs du rĂ©fĂ©rencement ont tellement envie de croire que cette mise Ă  jour va provoquer des remous quâ€™ils brouillent plus ou moins volontairement la comprĂ©hension gĂ©nĂ©rale. MalgrĂ© les efforts Ă©vidents de l&#8217;inusable Matt Cutts pour signifier qu&#8217;il s&#8217;agit d&#8217;une Ă©volution d&#8217;infrastructure, certains font l&#8217;amalgame entre index et algorithme.<br />
Bien entendu, la communication Google n&#8217;Ă©tant pas limpide, tout le monde peut croire qu&#8217;il rĂ©side un piĂ¨ge au tournant. Sans doute que l&#8217;annonce du recul de dĂ©ploiement global aprĂ¨s les fĂŞtes Ă©voque les remous de Florida au sein de l&#8217;imaginaire collectif.</p>
<p>Encore une fois, Google CafĂ©ine permet Ă  Google de reposer sur une infrastructure plus performante, avec lâ€™algorithme nâ€™Ă©tant pas la principale cible de cette mise Ă  jour. Ainsi, le plus gros changement que nous allons observer concerne lâ€™index qui sera rafraĂ®chi.</p>
<h3>Et l&#8217;algorithme dans tout Ă§a ?</h3>
<p>Le principe de fonctionnement de Google est un algorithme par couches. Il existe une formule de base sur laquelle sont posĂ©s des filtres qui concernent des paramĂ¨tres en particulier et/ou certaines parties de lâ€™index.</p>
<p>Comme expliquĂ© prĂ©cĂ©demment, Google CafĂ©ine ne focalise pas sur lâ€™algorithme. Un peu comme si vous changiez de voiture pour passer dâ€™une Twingo Ă  une Porsche, mais vous nâ€™ĂŞtes pas devenu SĂ©bastien Loeb par lâ€™intermĂ©diaire de ce changement du vĂ©hicule.</p>
<p>Bien sĂ»r, l&#8217;index et l&#8217;algorithme sont liĂ©s, donc j&#8217;imagine qu&#8217;il faut accorder le bouzin pour qu&#8217;il dĂ©pote Ă  merveille. Par ailleurs, il est facile de comprendre que ce n&#8217;est pas non plus le meilleur moment pour coller des filtres Ă  foison qui pourraient mettre Ă  mal cette merveilleuse nouvelle machinerie.</p>
<h3>Les effets et consĂ©quences de Google CafĂ©ine</h3>
<p>Ma plus grande attente concerne l&#8217;indexation en temps rĂ©el. Jusque Ă  maintenant, Google Search est Ă  la ramasse et Google Images est un dĂ©sastre. EspĂ©rons que cette nouvelle infrastructure va permettre Ă  Google de pouvoir tacler lâ€™indexation en temps rĂ©el convenablement.</p>
<p>Les Ă©ventuelles perturbations observĂ©es ressortent l&#8217;excuse passe partout qui sont les <em>effets de bord</em>. Quand on bidouille un index de cette taille, il est Ă©vident que certains effets inattendus apparaissent pour des cas isolĂ©s. Bien Ă©videmment, ceux qui verront leurs sites tomber vont faire un ramdam pas possible, mais ils reprĂ©senteront une portion microscopique du total de l&#8217;index.</p>
<p>Si lâ€™algorithme Ă©tait concernĂ© par cette mise Ă  jour, cela amplifierait les effets de bords. Essayez de changer une virgule dans une formule mathĂ©matique pour voir un peu les consĂ©quences&#8230;</p>
<p>Une autre Ă©vidence du rafraichissement de l&#8217;index concerne l&#8217;affichage du nombre de rĂ©sultats qui Ă©tait notoirement farfelu. J&#8217;ose espĂ©rer qu&#8217;on pourra dĂ©sormais se fier avec plus d&#8217;exactitude aux chiffres Ă©noncĂ©s dans les rĂ©sultats de recherche.</p>
<p>La lutte contre le spam reste au coeur des besoins de Google. Une meilleure manipulation des donnĂ©es contenues dans l&#8217;index pourrait aider dans <a href="http://www.laurentbourrelly.com/blog/378.php">cette lutte pour totalement vaine</a> (pour l&#8217;instant).</p>
<p>Le paramĂ¨tre dont parlent ceux qui ont compris de quoi il s&#8217;agit porte sur la vitesse de chargement des sites, dont les plus lents pourraient ĂŞtre dĂ©favorisĂ©s. Ce nouvel index focalise sur la vitesse, donc il semble viable de demander aux pages affichĂ©es parmi les meilleurs rĂ©sultats de suivre cette tendance. Matt Cutts mis le doigt sur ce point dans une <a href="http://www.webpronews.com/topnews/2009/11/13/google-page-speed-may-be-a-ranking-factor-in-2010" target="_blank">interview</a> rĂ©cente, ainsi que <a href="http://searchengineland.com/site-speed-googles-next-ranking-factor-29793" target="_blank">SearchEngineLand</a> qui abonde dans ce sens. Attention, il ne faut pas faire partir une nouvelle rumeur suggĂ©rant quâ€™un site qui se charge en plus de 4 secondes va perdre 30 positions. Ce paramĂ¨tre est Ă  inclure parmi les +200 qui composent lâ€™algorithme, nĂ©cessitant de jauger son importante relative par rapport aux autres.</p>
<p>A propos de la vitesse de chargement des pages Web, je reste perplexe car jâ€™ai testĂ© la rapiditĂ© de mon site et le facteur le plus ralentissant est â€¦ Google Analytics &#8211; par le biais du code JavaScript installĂ© en bas de chaque page.</p>
<h4>Comment faire une analyse convenableÂ ?</h4>
<p>Le <em>reverse engineerin</em>g Ă  la petite semaine est une perte de temps. Tout dâ€™abord, il faut bien comprendre que lâ€™affichage des rĂ©sultats de recherche nâ€™est pas forcĂ©ment une retranscription exacte de ce qui se trame dans lâ€™index. Sans parler des chiffres farfelus affichĂ©s comme compteur des rĂ©sultats, Il existe toute une sĂ©rie dâ€™opĂ©rations depuis le moment oĂą GoogleBot crawle une page Web jusquâ€™au moment oĂą elle ressort sous divers opĂ©rateurs au sein des rĂ©sultats de recherche. Nous disposons uniquement de la plus petite lucarne qui sont les rĂ©sultats de recherche du moteur. Toute la machinerie en amont est invisible et inconnue.</p>
<p><a href="http://bababillgates.free.fr/index.php/googe-caffeine-a-t-il-un-impact-sur-le-seo-et-le-referencement/" target="_blank">Tirer des conclusions</a> Ă  partir dâ€™un rĂ©sultat de recherche pour dĂ©terminer ce qui se passe en amont est vouĂ© Ă  prĂ©senter une pitoyable interprĂ©tation du fonctionnement de Google.</p>
<p>Parmi les mythes du rĂ©fĂ©rencement, il demeure un paramĂ¨tre que jâ€™ai toujours combattu avec force. Il s&#8217;agit de la densitĂ© des mots clĂ©s au sein dâ€™une page. Il suffit de savoir dans les grandes lignes comment Google fonctionne pour se rendre compte que ce critĂ¨res est totalement farfelu.</p>
<p>Pour analyser le comportement du moteur par rapport aux mots clĂ©s, il faudrait Ă©valuer le nombre dâ€™occurrences sur la page. Jusque lĂ  câ€™est facileÂ ; il suffit de compter les mots cibles sans prendre en compte le nombre total de mots clĂ©s comme le fait le calcul de densitĂ©. Ensuite, il faut Ă©valuer ces occurrences par rapport aux occurrences exactes sur le reste du site, puis par rapport aux co-occurrences similaires et complĂ©mentaires.</p>
<p>Ce nâ€™est pas finiÂ ! Maintenant, il faut prendre chaque partie de ces rĂ©sultats pour les Ă©valuer en fonction des pages Web concurrentes et le reste du site des pages concurrentes qui sont elles mĂŞme analysĂ©es comme prĂ©cĂ©demment.<br />
Ensuite, il faut remonter ces donnĂ©es pour tenter d&#8217;en sortir une rĂ¨gle de pondĂ©ration qui sera toujours Ă  prendre avec prĂ©caution car je rappelle que l&#8217;index n&#8217;est pas traitĂ© de maniĂ¨re identique sur sa totalitĂ©.</p>
<p>Et lĂ  on dispose dâ€™un petit dĂ©but de piste concernant la prise en compte des mots clĂ©s. Tout cela doit Ă©videmment se rĂ©pĂ©ter sur un nombre suffisant de mots clĂ©s pour une seule page, plusieurs pages du mĂŞme site, plusieurs sites sur la mĂŞme requĂŞte, un seul site sur plusieurs requĂŞtes, plusieurs sites sur plusieurs requĂŞtes, etc.</p>
<p>Ainsi, je peux sereinement rĂ©futer les rĂ©sultats de Mashable, ainsi que tous les autres qui se sont inspirĂ©s de cette analyse bidon.</p>
<h4>Si je comprends bien, je nâ€™ai rien Ă  craindre pour mon siteÂ ?</h4>
<p>Pour la vaste majoritĂ© des sites Internet, il nâ€™y aura pas ou trĂ¨s peu de changement. Ceux qui seront touchĂ©s seront sĂ»rement affectĂ©s par un effet temporaire qui sera dĂ©gagĂ© sans rien modifier sur le site. Malheureusement, câ€™est frustrant et je connais personnellement le phĂ©nomĂ¨ne.</p>
<p>Dans tous les cas, il ne faudra pas regarder du cĂ´tĂ© dâ€™une Ă©ventuelle pĂ©nalitĂ© algorithmique, mais plutĂ´t par rapport aux paramĂ¨tres liĂ©s Ă  lâ€™indexation.</p>
<p>On verra bien en janvier lorsque Google CafĂ©ine sera dĂ©ployĂ© sur tous les DataCenters du moteur de recherche, mais je peux logiquement mâ€™avancer en rejetant en bloc tous ceux qui font l&#8217;amalgame entre index et algorithme.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.laurentbourrelly.com/blog/387.php/feed</wfw:commentRss>
		<slash:comments>40</slash:comments>
		</item>
	</channel>
</rss>

