{"id":702,"date":"2010-06-02T17:45:36","date_gmt":"2010-06-02T15:45:36","guid":{"rendered":"http:\/\/www.laurentbourrelly.com\/blog\/?p=702"},"modified":"2010-06-02T17:45:36","modified_gmt":"2010-06-02T15:45:36","slug":"des-jolis-graphes-et-des-maths-pour-expliquer-un-bout-de-lalgorithme-google","status":"publish","type":"post","link":"https:\/\/www.laurentbourrelly.com\/blog\/702.php","title":{"rendered":"Des jolis graphes et des maths pour expliquer (un bout de) l\u2019algorithme Google"},"content":{"rendered":"<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/google-logo.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"size-full wp-image-721 alignleft\" style=\"border: 0pt none; margin: 0px 10px;\" title=\"google logo\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/google-logo.jpg\" alt=\"algorithme de Google\" width=\"163\" height=\"116\" \/><\/a><\/p>\n<p>Cela faisait un moment que j&rsquo;avais entam\u00e9 la traduction (autoris\u00e9e) de l&rsquo;article suivant. Il \u00e9tait oubli\u00e9 au fond d&rsquo;un r\u00e9pertoire, puis je suis retomb\u00e9 par hasard sur <a href=\"http:\/\/www.seomoz.org\/blog\/googles-algorithm-pretty-charts-math-stuff\">l&rsquo;article original de SEOmoz<\/a> r\u00e9dig\u00e9 par <a href=\"http:\/\/www.seomoz.org\/users\/view\/63\">Rand Fishkin<\/a> et <a href=\"http:\/\/www.seomoz.org\/team\/ben\">Ben Hendrickson<\/a>.<br \/>\nApr\u00e8s une nouvelle lecture, j&rsquo;ai pens\u00e9 qu&rsquo;il serait vraiment int\u00e9ressant de terminer la traduction pour partager cette analyse passionnante avec ceux qui sont en d\u00e9licatesse avec la langue de Shakespeare.<br \/>\nLe but de cette analyse est de comprendre un peu mieux l&rsquo;algorithme de Google en effectuant une corr\u00e9lation de donn\u00e9es sur la base de l&rsquo;index Linkscape.<br \/>\n<!--more--><\/p>\n<h1>Corr\u00e9lation de donn\u00e9es<\/h1>\n<p><a href=\"http:\/\/www.seomoz.org\/linkscape\">Linkscape<\/a> est l\u2019index Web de <a href=\"http:\/\/www.seomoz.org\/\">SEOmoz<\/a>. En plus du travail habituel sur les statistiques, nous effectuons des recherches pouss\u00e9es qui sont partag\u00e9es dans cet article. \u2028Cependant, la lecture requiert de l\u2019attention car la corr\u00e9lation de donn\u00e9es ne donne pas forc\u00e9ment toutes les r\u00e9ponses. Il n\u2019en demeure pas moins que c\u2019est extr\u00eamement int\u00e9ressant, donnant une vue de l\u2019int\u00e9rieur gr\u00e2ce \u00e0 la mod\u00e9lisation des classements; tout en sachant qu\u2019il ne faut pas simplement regarder les graphes, mais bien lire le commentaire associ\u00e9. Donc, faites attention \u00e0 la lecture des donn\u00e9es brutes qui peuvent \u00eatre sujettes \u00e0 une mauvaise interpr\u00e9tation.<\/p>\n<h3>Quelques stats Linkscape (au 22\/09\/09)<\/h3>\n<ul>\n<li>Date de sortie :\u00a0 6 octobre 2009<\/li>\n<li>Domaines : 57 millions<\/li>\n<li>Sous-domaines : 215 millions<\/li>\n<li>URLs : 40,5 milliards<\/li>\n<li>Liens : 456 milliards<\/li>\n<li>Attributs de lien :\n<ul>\n<li>Liens nofollow internes : 7 milliards (1,51% du total)<\/li>\n<li> Liens nofollow externes : 2,8 milliards (0,60% du total)<\/li>\n<li>Liens nofollow au total : 9,7 milliards (2,11% du total)<\/li>\n<li>URLs en 301 : 384 millions (0,08% du total)<\/li>\n<li>URLs en 302 : 3 milliards (0,59% du total)<\/li>\n<li>URLs employant rel= \u00abcanonical\u00bb 52 millions (0,01% du total)<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul>\n<li> Corr\u00e9lation moyenne entre PageRank et mozRank\n<ul>\n<li>Erreur absolue moyenne : 0,54<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<ul>\n<li> Corr\u00e9lation moyenne entre mozRank du domaine (DmR) et PageRank de la homepage\n<ul>\n<li>Erreur absolue moyenne : 0,37<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>Maintenant, entrons dans la recherche autour de la corr\u00e9lation des donn\u00e9es pour savoir comment utiliser Linkscape pour obtenir des statistiques int\u00e9ressantes. Les premiers graphes utilisent la corr\u00e9lation brute et pas seulement la relation entre les classements et les param\u00e8tres individuels. Encore une fois, il faut bien lire les descriptions et surtout ne pas faire de conclusions h\u00e2tives. Il ne faut pas croire qu\u2019on peut forc\u00e9ment obtenir un meilleur classement en suivant les recommandations. Le but est de montrer quels param\u00e8tres sont appliqu\u00e9s aux pages qui sont positionn\u00e9es parmi les meilleures positions des r\u00e9sultats de recherche.<\/p>\n<h2>Comprendre les graphes<\/h2>\n<ul>\n<li>Mean Index By Value (index moyen par valeur) : c&rsquo;est utilis\u00e9 pour l&rsquo;axe y de plusieurs graphes. Au lieu de faire la moyenne des valeurs brutes, nous effectuons le calcul sur son index relatif dans les r\u00e9sultats de recherche &#8211; si ordonn\u00e9s par cette valeur. Prenons 3 r\u00e9sultats de recherche o\u00f9 la page en premi\u00e8re position est la quatri\u00e8me en terme de liens, la deuxi\u00e8me est la premi\u00e8re pour les backlinks, puis la troisi\u00e8me est en dixi\u00e8me position pour les liens. L&rsquo;index moyen par nombre de liens pour la premi\u00e8re position sera (4+1+10)\/3=5.<\/li>\n<li>Mean Count Numbers (moyenne des nombres) : ces nombres apparaissent sur l&rsquo;axe y du premier graphe, montrant la moyenne du nombre de liens.<\/li>\n<li>Position : c&rsquo;est utilis\u00e9 sur certains axes x. Pour les graphes concern\u00e9s, sp\u00e9cifiques \u00e0 la position organique dans Google.com, les r\u00e9sultats de recherche non traditionnels sont exclus (local, vid\u00e9o, news, images, etc.).<\/li>\n<li>Error Bars (Barres d&rsquo;erreur) : ces barres qui relient les courbes dans nos graphes montrent l&rsquo;intervalle entre deux \u00e9l\u00e9ments diff\u00e9rents. Sur certains graphes, elles montrent les 95% des intervalles de la moyenne potentielle si nous avions une infinit\u00e9 de donn\u00e9es \u00e0 traiter.<\/li>\n<\/ul>\n<h3>Les backlinks sont-ils en corr\u00e9lation ad\u00e9quate avec le positionnement ?<\/h3>\n<p>Une logique r\u00e9currente dans le r\u00e9f\u00e9rencement pr\u00e9tend que le nombre de liens qui pointent vers un r\u00e9sultat permet une bonne pr\u00e9diction du positionnement. Cependant, on remarque que Yahoo! Site Explorer (et m\u00eame Google dans ses Webmaster Tools) inclut un grand nombre de liens inutiles (nofollow, format exotique, internes, etc.), tandis qu&rsquo;il exclut des \u00e9l\u00e9ments int\u00e9ressants (comme les redirections 301).\u2028 En utilisant les donn\u00e9es Linkscape, nous pouvons \u00e9liminer ce bruit afin d&rsquo;extraire seulement les liens qualifi\u00e9s et les 301.<br \/>\n<a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/liens-classement2.gif\"><img loading=\"lazy\" decoding=\"async\" class=\"size-full wp-image-723 alignnone\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/liens-classement2.gif\" alt=\"Corr\u00e9lation entre backlinks et positionnement\" width=\"500\" height=\"375\" \/><\/a><\/p>\n<p>Ce premier graphe sugg\u00e8re qu&rsquo;une corr\u00e9lation existe entre nombre de liens et positionnement. Sauf que les pics sont frustrants. Au travers d&rsquo;une analyse plus profonde, nous avons \u00e9tabli qu&rsquo;il\u00a0 \u00e9tait \u00e9videmment caus\u00e9 par un d\u00e9s\u00e9quilibre de liens parmi certains r\u00e9sultats.\u2028 Du coup, il s&rsquo;est av\u00e9r\u00e9 pertinent de produire le graphe suivant :<\/p>\n<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/liens-positionnement.gif\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-705\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/liens-positionnement.gif\" alt=\"Valeur moyenne du positionnement par nombre de liens\" width=\"500\" height=\"375\" \/><\/a><\/p>\n<p>Ici, nous pouvons voir ce qui pourrait se passer si nous manipulions les r\u00e9sultats par nombre de liens. Dans ce cas, chaque paquet de r\u00e9sultats ont \u00e9t\u00e9 assign\u00e9 un chiffre (1, 2, 3, etc.) qui correspond \u00e0 la quantit\u00e9 de liens en comparaison avec les autres pages (la page avec le plus de liens est assign\u00e9e le \u00ab\u00a01\u00a0\u00bb, la deuxi\u00e8me qui re\u00e7oit le plus de liens porte le \u00ab\u00a02\u00a0\u00bb, etc.).\u2028 On voit que la courbe est devenue r\u00e9guli\u00e8re, mais nous pouvons assurer de sa pr\u00e9cision.<\/p>\n<p>Les barres sur la courbe ci-dessous montre l&rsquo;intervalle permise pour estimer la ligne m\u00e9diane.<\/p>\n<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/erreur-classement-liens.gif\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-706\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/erreur-classement-liens.gif\" alt=\"Zone d'erreur pour la corr\u00e9lation entre liens externes et positionnement\" width=\"500\" height=\"375\" \/><\/a><\/p>\n<p>La corr\u00e9lation est forte, sugg\u00e9rant que le nombre de liens externes est important. Le standard relev\u00e9 pour l&rsquo;erreur est si bas que nous sommes confiants \u00e0 propos de la v\u00e9racit\u00e9 de cette analyse. \u2028Clairement, les liens sont tr\u00e8s importants, mais ils ne repr\u00e9sentent pas la totalit\u00e9 de la solution. Amasser le plus de liens possible est un excellent objectif, mais cela ne peut pas \u00eatre votre seul but.<\/p>\n<p>Le dernier morceau \u00e0 observer pour cette partie concerne la d\u00e9viation standard. Cela d\u00e9montre la latitude de variation d&rsquo;une page par rapport aux moyennes.<\/p>\n<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/variation-lien-position.gif\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-707\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/variation-lien-position.gif\" alt=\"Variation de la corr\u00e9lation pour les liens et le positionnement\" width=\"500\" height=\"375\" \/><\/a><\/p>\n<p>Ce graphe nous montre que la variation pour un paquet individuel de r\u00e9sultats peut \u00eatre tr\u00e8s large. Acqu\u00e9rir plus de liens n&rsquo;est pas forc\u00e9ment un moyen infaillible. La d\u00e9viation standard est \u00e9loign\u00e9e de la ligne m\u00e9diane (1,97). Au niveau global, il importe de prendre en compte le nombre de liens externes qui sont correctement suivis, mais nous allons d\u00e9velopper nos mod\u00e8les et \u00e9largir notre champ de r\u00e9flexion pour d&rsquo;obtenir des informations actionnables au niveau granulaire.<\/p>\n<h3>Une seule mesure peut-elle pr\u00e9dire le positionnement ?<\/h3>\n<p>Franchement, \u00e7a serait excellent&#8230;<br \/>\nNous avons regard\u00e9 des indices comme le PageRank, le nombre de liens dans Yahoo! Site Explorer, Alexa Rank, etc. Pour \u00eatre clair, ces indices sont aussi fiables que piocher au hasard. Le score du PageRank de Google \u00e9tait approximativement 16% plus performant (donn\u00e9e dat\u00e9e de f\u00e9vrier 2009) qu&rsquo;une pr\u00e9diction bas\u00e9e sur le hasard pur pour d\u00e9terminer le positionnement d&rsquo;une page Web (N+10 ou la page positionn\u00e9 N\u00b01 contre la page 2). Le PageRank \u00e9tait \u00e9galement 5% meilleur que le hasard pour pr\u00e9dire le positionnement (N+1 ou la position 1 contre position 2).<br \/>\nLe graphique ci-dessous montre des corr\u00e9lations pour un certain nombre d&rsquo;indices li\u00e9s au r\u00e9f\u00e9rencement.<\/p>\n<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/correlation-google.gif\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-708\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/correlation-google.gif\" alt=\"corr\u00e9lation des donn\u00e9es avec le positionnement sur Google\" width=\"600\" height=\"436\" \/><\/a><\/p>\n<p>Nick, Ben et Chas ont travaill\u00e9 dur afin d&rsquo;am\u00e9liorer la valeur et la qualit\u00e9 de l&rsquo;index Linkscape, ainsi que l&rsquo;utilit\u00e9 des mesures.<br \/>\nLe graphe suivant montre nos progr\u00e8s.<\/p>\n<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/valeur-linkscape.png\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-709\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/valeur-linkscape.png\" alt=\"Progr\u00e8s de la valeur et qualit\u00e9 de l'index Linkscape\" width=\"448\" height=\"336\" \/><\/a><\/p>\n<p>Les corr\u00e9lations du graphe ci-dessus sont 35-50% plus satisfaisantes que les r\u00e9sultats pioch\u00e9s au hasard (il ne s&rsquo;agit pas d&rsquo;une comparaison 1 pour 1 avec les nombres ci-dessus &#8211; cela viendra dans un prochain post). L&rsquo;observation de ce graphe sugg\u00e8re que le mozRank externe (repr\u00e9sentant la quantit\u00e9 de \u00ab\u00a0link juice\u00a0\u00bb vers un page depuis les liens externes) et les liens externes suivis correspondent bien au positionnement actuel, apportant des \u00e9l\u00e9ments d&rsquo;information int\u00e9ressants pour les chasseurs de backlinks. Cette ligne de corr\u00e9lation peut sugg\u00e9rer, dans un sc\u00e9nario classique du positionnement, l&rsquo;importance de l&rsquo;apport de liens \u00e9manant de pages \u00e0 fort mozRank\/PageRank qui contiennent peu de liens externes (ainsi les liens passent plus de \u00ab\u00a0link juice\u00a0\u00bb), ainsi qu&rsquo;une grande quantit\u00e9 brute de liens externes suivis. De plus, ce graphe supporte l&rsquo;id\u00e9e que l&rsquo;apport de liens depuis un domaine unique est pertinent.<\/p>\n<p>La partie frustrante \u00e0 propos de ces donn\u00e9s est que \u00e7a ne raconte pas l&rsquo;ensemble de l&rsquo;histoire, ni que \u00e7a soit directement actionnable pour une requ\u00eate sp\u00e9cifique. Comme vous pouvez voir ci-dessous, la d\u00e9viation standard des nombres montre que pour n&rsquo;importe quelle recherche, l&rsquo;\u00e9tendu varie drastiquement.<\/p>\n<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/variation-recherche.png\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-710\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/variation-recherche.png\" alt=\"Variation standard en fonction des r\u00e9sultats de recherche\" width=\"512\" height=\"384\" \/><\/a><\/p>\n<p>Lorsque nous observons cet effet, exactement comme dans le cas ci-dessus, l&rsquo;application pour un travail de r\u00e9f\u00e9rencement d&rsquo;un projet client, dont l&rsquo;objectif est d&rsquo;obtenir un positionnement sp\u00e9cifique, n&rsquo;est pas clair. Employer ces mesures comme KPI et moyens d&rsquo;\u00e9valuer les liens potentiels est probablement utile. Construire des analyses de concurrence avec ces points de donn\u00e9es sera certainement plus efficace qu&rsquo;utiliser des mesures ext\u00e9rieures, mais cela ne dit pas \u00ab\u00a0fais ceci pour mieux te positionner,\u00a0\u00bb tout comme ce n&rsquo;est pas le \u00ab\u00a0Saint Graal\u00a0\u00bb que nous pourchassons.<\/p>\n<h3>Comment les facteurs \u00ab\u00a0On Page\u00a0\u00bb co\u00efncident avec le positionnement ?<\/h3>\n<p>Pour l&rsquo;instant, nous avons peu \u00e9valu\u00e9 les facteurs \u00ab\u00a0On Page\u00a0\u00bb et leur corr\u00e9lation avec le positionnement. C&rsquo;est ce que nous allons voir maintenant.<\/p>\n<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/facteurs-positionnement.gif\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-711\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/facteurs-positionnement.gif\" alt=\"Corr\u00e9lation meta keywords avec le positionnement\" width=\"500\" height=\"375\" \/><\/a><\/p>\n<p>Google a r\u00e9cemment annonc\u00e9 que la meta keywords \u00e9tait ignor\u00e9e. Ces donn\u00e9es montrent une courbe tr\u00e8s irr\u00e9guli\u00e8re et des barres d&rsquo;erreurs dans la limite du 13, supportant cette affirmation. Employer la requ\u00eate\/phrase dans la meta keywords est un des signaux les moins significatifs que nous avons \u00e9tudi\u00e9.<\/p>\n<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/titre-position.gif\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-712\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/titre-position.gif\" alt=\"Corr\u00e9lation entre le titre - balise Title - et le positionnement\" width=\"512\" height=\"384\" \/><\/a><\/p>\n<p>La balise Title qui contient le terme de la requ\u00eate semble avoir une r\u00e9elle corr\u00e9lation avec le classement. Ils ne sont pas en parfaite corr\u00e9lation, mais ce graphe nous montre que Google a une claire pr\u00e9f\u00e9rence, en moyenne, pour les pages qui emploient le terme de la requ\u00eate dans la balise Title.<\/p>\n<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/Hx-position.gif\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-713\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/Hx-position.gif\" alt=\"Corr\u00e9lation entre les balises d'en-t\u00eates Hx et le positionnement\" width=\"500\" height=\"375\" \/><\/a><\/p>\n<p>Nous avions examin\u00e9 auparavant les balises d\u2019en-t\u00eates H1\/H2\/Hx pour arriver \u00e0 la conclusion qu\u2019elles avaient un impact faible sur le positionnement. Ce graphe sugg\u00e8re que c\u2019est toujours le cas. Il y a une corr\u00e9lation plus grande lorsque les termes sont utilis\u00e9s dans d\u2019autres zones \u00abon page\u00bb du body ou dans l\u2019ancre des liens (internes ou externes).\u2028 Bien que le graphe montre une courbe horizontale, sugg\u00e9rant que les en-t\u00eates H1 \u00e0 H4 n\u2019ont pas trop de b\u00e9n\u00e9fice \u00e0 l\u2019utilisation, ce n\u2019est pas aussi vilain que l\u2019effet hasardeux observ\u00e9 avec la meta \u00abkeywords\u00bb (les courbes d\u00e9marrent en-dessous de 13 et se terminent juste au-dessus). En tout cas, la corr\u00e9lation positive est basse avec la ligne horizontale qui se tient entre les barres d\u2019erreur.<\/p>\n<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/url-position.gif\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-714\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/url-position.gif\" alt=\"Corr\u00e9lation entre mots cl\u00e9s dans l'url et le positionnement\" width=\"500\" height=\"375\" \/><\/a><\/p>\n<p>Le graphe est l\u2019illustration la plus claire du fait qu\u2019il faille construire des syst\u00e8mes plus avanc\u00e9s qu\u2019une simple et directe corr\u00e9lation. Selon ce graphe, l\u2019utilisation du terme de recherche dans le nom de fichier ou chemin d\u2019URL est l\u00e9g\u00e8rement n\u00e9gatif en corr\u00e9lation avec un bon classement. Le sous-domaine appara\u00eet largement inutile, tandis que le domaine racine \u00e0 une forte corr\u00e9lation. Bien que toutes les courbes (sauf le domaine racine) soient sur une bande \u00e9troite de l\u2019axe x, les bonnes pratiques du r\u00e9f\u00e9rencement nous dictent d\u2019utiliser les mots cl\u00e9s dans ces \u00e9l\u00e9ments. Du coup, lorsque nous analysons ce graphe, il convient d\u2019\u00e9mettre quelques hypoth\u00e8ses. Par exemple, les termes de recherche de l\u2019URL seraient \u00e9limin\u00e9s lorsque ils apparaissent dans le domaine racine et ailleurs dans l&rsquo;URL. Les moteurs de recherche peuvent voir ceux qui r\u00e9p\u00e8tent les termes du domaine racine dans l\u2019URL comme des pratiquants du \u00ab\u00a0keyword stuffing\u00a0\u00bb. Cela peut aussi impliquer que la corr\u00e9lation brute per\u00e7oit un grand nombre de pages qui optimisent moins l\u2019URL, mais qui sont performantes gr\u00e2ce \u00e0 d\u2019autres facteurs (liens, autorit\u00e9, etc.). C\u2019est aussi vrai que la plupart des sites qui emploient le mot clef dans l\u2019URL ne l\u2019utilisent pas forc\u00e9ment dans le domaine racine. Du coup, le n\u00e9gatif de l\u2019un peut \u00eatre m\u00e9lang\u00e9 au positif de l\u2019autre pour tenter d&rsquo;y voir plus clair.<\/p>\n<p>Cet exemple est la parfaite illustration des probl\u00e8mes d\u2019interpr\u00e9tation sur la corr\u00e9lation de donn\u00e9es brutes, n\u00e9cessitant une mod\u00e9lisation toujours plus sophistiqu\u00e9e.<\/p>\n<h3>Pouvons-nous construire une mod\u00e9lisation utilisable du positionnement?<\/h3>\n<p>Nous avons besoin d\u2019un mod\u00e8le qui imite Google du mieux possible pour obtenir une repr\u00e9sentation de la valeur potentielle pour les actions de r\u00e9f\u00e9rencement. Sauf que ce n\u2019est pas facile car Google poss\u00e8de plus de 200 param\u00e8tres dans son algorithme de classement des pages Web. Bien que nous poss\u00e9dons de nombreux points d\u2019analyse, il n\u2019en demeure pas moins que c&rsquo;est un challenge complexe.<\/p>\n<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/uber.png\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-715\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/uber.png\" alt=\"Score g\u00e9n\u00e9ral de la mod\u00e9lisation SEOmoz\" width=\"512\" height=\"384\" \/><\/a><\/p>\n<p>La courbe \u00ab\u00dcber\u00bb en rouge dans le graphe ci-dessus est construite en prenant tous les points d\u2019analyse que nous poss\u00e9dons.\u00a0 Les donn\u00e9es sont moulin\u00e9es pour \u00e9tablir une corr\u00e9lation avec les r\u00e9sultats de recherche. La courbe rouge fait clairement appara\u00eetre que notre mod\u00e8le est le plus efficace pour pr\u00e9dire le classement. En plus, la courbe est carr\u00e9ment excellente pour le Top 10 des r\u00e9sultats de recherche.<br \/>\nCette mod\u00e9lisation peut aussi s\u2019affiner pour obtenir un impact \u00e0 propos de l\u2019utilisation du mot clef dans une zone sp\u00e9cifique.<\/p>\n<p>Regardons comme exemple la corr\u00e9lation n\u00e9gative des mots cl\u00e9s dans l\u2019URL.<\/p>\n<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/mots-cles-url.gif\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-716\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/mots-cles-url.gif\" alt=\"Corr\u00e9lation affin\u00e9e entre les mots cl\u00e9s dans l'url et le r\u00e9f\u00e9rencement\" width=\"500\" height=\"375\" \/><\/a><\/p>\n<p>Encore une fois, le graphe montre clairement l\u2019inefficacit\u00e9 latente des mots cl\u00e9s dans le sous-domaine, mais que c&rsquo;est extr\u00eamement efficace dans le domaine racine. Sinon, les courbes peuvent sugg\u00e9rer un faible effet positif tout en observant une descente en dessous du 0 de l\u2019axe x pour les positions 20-25, indiquant que l\u2019utilisation du mot clef peut aussi avoir un effet n\u00e9gatif. Ainsi, l\u2019utilisation du mot clef au sein de multiples endroits peut \u00eatre n\u00e9faste; ce qui dirait \u00e0 certains qu\u2019une utilisation moins agressive des mots cl\u00e9s serait b\u00e9n\u00e9fique.<\/p>\n<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/url-erreur.gif\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-717\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/url-erreur.gif\" alt=\"D\u00e9viation standard pour l'analyse de corr\u00e9lation mots cl\u00e9s dans l'URL et le positionnement\" width=\"500\" height=\"375\" \/><\/a><\/p>\n<p>Dans ce graphe, les barres d\u2019erreurs de d\u00e9viation standard sont mises en \u00e9vidence. Ainsi, nous pouvons dire que l\u2019utilisation des mots cl\u00e9s dans l\u2019URL n\u2019a pas d\u2019impact n\u00e9gatif pour les meilleurs r\u00e9sultats, tandis que ce constat est moins serein pour la derni\u00e8re portion de r\u00e9sultats.<br \/>\nTournons notre attention vers ces satan\u00e9s Hx encore une fois pour voir si notre mod\u00e9lisation a d\u2019autres choses \u00e0 dire.<\/p>\n<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/en-tetes.gif\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-718\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/en-tetes.gif\" alt=\"Corr\u00e9lation entre positionnement et mots cl\u00e9s dans les balises d'en-t\u00eates Hx\" width=\"500\" height=\"375\" \/><\/a><\/p>\n<p>Nous obtenons des r\u00e9sultats similaires qui per\u00e7oivent les tags H1-H4 comme peu int\u00e9ressants pour y placer des mots cl\u00e9s. Les Hx semblent aider un peu, mais peuvent aussi avoir un l\u00e9ger impact n\u00e9gatif\u00a0 pour la derni\u00e8re portion des r\u00e9sultats. Cette analyse est une \u00e9vidence plut\u00f4t efficace pour d\u00e9clarer que les tags Hx n\u2019ont pas une grosse importance pour le r\u00e9f\u00e9rencement (m\u00eame en prenant en compte les barres d\u2019erreur). Evidemment, il faut continuer d\u2019utiliser les en-t\u00eates, mais ce ne sont pas les endroits les plus strat\u00e9giques \u00e0 incorporer \u00e0 propos de l\u2019optimisation pour le r\u00e9f\u00e9rencement.<\/p>\n<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/mesure-lien.gif\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-719\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/mesure-lien.gif\" alt=\"Sophistication de la mesure des liens\" width=\"500\" height=\"375\" \/><\/a><\/p>\n<p>Notre mesure pour les liens a aussi \u00e9t\u00e9 l\u2019objet d\u2019am\u00e9liorations qui donne un constat plus nuanc\u00e9. Vous pouvez voir ci-dessus que notre mozRank am\u00e9lior\u00e9 appara\u00eet plus important pour les premiers r\u00e9sultats de recherche; tout en observant que le nombre brut de liens n\u2019a pas une grande valeur. Plus profond dans les r\u00e9sultats, certaines pages semblent utiliser \u00e0 outrance l\u2019acquisition de liens et du mozRank &#8211; probablement \u00e0 cause de liens qui proviennent de sites \u00e0 faible autorit\u00e9 ou m\u00eame spammy.\u2028 Ce graphe ne contient pas un grand nombre de donn\u00e9es actionnables, mais cela confirme plut\u00f4t bien ce qu\u2019on sait du r\u00e9f\u00e9rencement (ex: peu de bons liens est mieux que beaucoup de mauvais liens).<\/p>\n<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/page-web.gif\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-720\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/page-web.gif\" alt=\"Facteurs influent pour le r\u00e9f\u00e9rencement de pages Web\" width=\"500\" height=\"375\" \/><\/a><\/p>\n<p>Ce dernier graphe montre quelques donn\u00e9es int\u00e9ressantes de nos tests sur les \u00e9l\u00e9ments \u00abon page\u00bb. Le gros param\u00e8tre aper\u00e7u concerne l\u2019utilisation d\u2019images avec un attribut \u00abalt\u00bb ad\u00e9quat incorporant les mots cl\u00e9s. La ligne verte est une des plus fortes corr\u00e9lations pour l\u2019utilisation \u00abon page\u00bb des mots cl\u00e9s. Mettre les mots cl\u00e9s en gras, dans le corpus et m\u00eame dans les ancres a le m\u00eame type d\u2019impact positif \u00e9tudi\u00e9 pr\u00e9c\u00e9demment, ainsi qu\u2019un l\u00e9ger impact n\u00e9gatif dans la zone 20-25.<\/p>\n<h4>Conclusions<\/h4>\n<p>Je sais que cela repr\u00e9sente beaucoup de donn\u00e9es \u00e0 ingurgiter, mais il est aussi tr\u00e8s important de comprendre que la cr\u00e9dibilit\u00e9 du travail de r\u00e9f\u00e9rencement passe aussi par l\u2019appui sur ce type d\u2019analyse. SEOmoz n\u2019est certainement pas la seule compagnie \u00e0 travailler de la sorte (quoi que certainement la seule \u00e0 rendre les r\u00e9sultats publics). Tout cela peut apporter des supports int\u00e9ressants pour des projets clients ou en interne avec des donn\u00e9es qui montrent l\u2019importance et la valeur pr\u00e9vue pour les changements effectu\u00e9s en tant que r\u00e9f\u00e9renceur. Nombreux sont ceux qui critiquent le m\u00e9tier parce que l&rsquo;expertise se base \u00e9norm\u00e9ment sur l\u2019intuition et le bon sens. Avec ces analyses, nous pouvons recentrer le d\u00e9bat. Nous ne pr\u00e9tendons pas que ces donn\u00e9es sont infaillibles, mais il s\u2019agit certainement d\u2019un excellent point suppl\u00e9mentaire \u00e0 ajouter dans l\u2019\u00e9quation.<\/p>\n<p><strong>Les \u00e9l\u00e9ments sugg\u00e9r\u00e9s par l\u2019analyse, dont nous sommes confiants de la pertinence :<\/strong><\/p>\n<ul>\n<li>Les liens sont importants, mais les donn\u00e9es trop basiques peuvent \u00eatre trompeuses. Il faut \u00e9tablir des analyses sophistiqu\u00e9es sur les liens.<\/li>\n<li>Il n\u2019y a pas une donn\u00e9e en particulier qui peut pr\u00e9dire le positionnement.<\/li>\n<li>H1 (et H2 \u00e0 H4) ne sont probablement pas des bons endroits pour capitaliser sur des mots cl\u00e9s<\/li>\n<li>L\u2019attribut \u00abalt\u00bb des images est un endroit privil\u00e9gi\u00e9 pour mettre des mots cl\u00e9s<\/li>\n<li>Le keyword stuffing peut vous retenir au-del\u00e0 des 15 premiers r\u00e9sultats.<\/li>\n<li>En faire trop avec des liens de mauvaise qualit\u00e9 peut avoir un impact n\u00e9gatif.<\/li>\n<\/ul>\n<p>=&gt; Une autre \u00e9tude \u00e0 consulter sur les <a href=\"https:\/\/www.laurentbourrelly.com\/blog\/732.php\">param\u00e8tres influents des backlinks<\/a>.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Cela faisait un moment que j&rsquo;avais entam\u00e9 la traduction (autoris\u00e9e) de l&rsquo;article suivant. Il \u00e9tait oubli\u00e9 au fond d&rsquo;un r\u00e9pertoire, puis je suis retomb\u00e9 par hasard sur l&rsquo;article original de SEOmoz r\u00e9dig\u00e9 par Rand Fishkin et Ben Hendrickson. Apr\u00e8s une nouvelle lecture, j&rsquo;ai pens\u00e9 qu&rsquo;il serait vraiment int\u00e9ressant de terminer la traduction pour partager cette [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[8],"tags":[68,202,282,394,409,449],"class_list":["post-702","post","type-post","status-publish","format-standard","hentry","category-moteurs-de-recherche","tag-ben-hendrickson","tag-google","tag-linkscape","tag-rand-fishkin","tag-referenceur","tag-seomoz"],"_links":{"self":[{"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/posts\/702","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/comments?post=702"}],"version-history":[{"count":0,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/posts\/702\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/media?parent=702"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/categories?post=702"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/tags?post=702"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}