Comment mesurer et analyser la Longue Traîne

Analyser et mesurer la Longue TraîneL’article suivant est une traduction autorisée par l’auteur – Patrick Altoft de Branded3 (agence SEO anglaise).

Il s’agit de montrer comment mesurer et analyser la Longue Traîne afin de mieux appréhender ce paramètre essentiel du référencement.Maintenant que Google Caféine est en place à 100% et pour rebondir sur la récente mise à jour May Day, j’ai pensé qu’il était intéressant de discuter de certains aspects avancés du référencement sur la Longue Traîne.

Tout d’abord, Caféine est une évolution d’infrastructure plutôt qu’une mise à jour d’algorithme, donc ce n’est pas directement en relation avec les changements de May Day. Ce que Caféine permet et d’augmenter la fraicheur de l’index google en augmentant ses capacités de crawl, ainsi qu’en diminuant le temps nécessaire pour retourner les pages crawlées au sein des résultats de recherche.  Ceci n’est pas un gros changement pour les blogueurs puisque les plateformes de blogs habituellement envoient un ping à Google et sont indexées en quelques minutes. Pour le reste du Web, cela devrait faire une grosse différence et éventuellement ouvrir la porte pour des résultats plus frais au niveau de la Longue Traîne.

Index de Google Caféine

La mise à jour May Day signifie globalement que certains sites avec un contenu pauvre et un manque de liens internes ne reçoivent plus la même pondération qu’auparavant. A la place, Google fait remonter des pages plus pertinentes ; ce qui est une étape positive.

Qu’est ce que la Longue Traîne ?

En référencement, la Longue Traîne décrit les centaines de millions de requêtes qui génère un trafic faible au niveau individuel, mais rassemble collectivement un gros pourcentage (disons 70%) du trafic global d’un site. La Longue Traîne ne signifie pas forcément les requêtes composées de 4,5 ou 6 mots clés qui peuvent entrer dans ce groupe, mais ce n’est pas forcément le cas. Nous avons des requêtes à 4 termes ou plus qui rapportent des milliers de visiteurs par mois et sont classés dans le groupe de la Moyenne Traîne.

La meilleure manière de qualifier les termes est de regarder aux chiffres énoncés par SEOmoz qui découpe le trafic en 3 segments :

  • Courte Traîne :  18,5%
  • Moyenne Traîne : 11,5%
  • Longue Traîne : 70%

Ces données sont approximatives tout en donnant un ordre de grandeur consistent.

Courbe de demande pour la recherche d'information

La prochaine étape consiste à mesurer votre trafic actuel au niveau des 3 segments pour surveiller comment les choses évoluent chez moi. Nous avons configuré Google Analytics et un graphique Excel pour trouver que les données suivantes tendent à donner les pourcentages souhaités pour la plupart des sites Web.

  • Courte Traîne : requêtes avec 100 ou plus visites par mois.
  • Moyenne Traîne : requêtes avec 6 à 99 visites par mois.
  • Longue Traîne : requêtes avec moins de 5 visites par mois.

Vous devez analyser votre site afin de cerner ces segments (n’oubliez par d’enlever les mots clés associés à des marques).

Segmentation de la Longue Traîne

Segmenter le trafic Longue Traîne

Visualiser des millions de mots clés qui envoient une poignée de visiteurs chaque mois est mission impossible. Donc, il faut segmenter les données pour essayer d’améliorer les chiffres. La meilleure façon de procéder consiste à diviser le site dans les mêmes sections que nous avons définies pour nos multiples SiteMaps ci-dessus, puis surveiller et analyser chaque section pour les données suivantes :

  • Nombre de pages indexées
  • Nombre de Landing Pages recevant plus d’1 visite par mois
  • Nombre de mots clés envoyant des visiteurs dans chaque section par mois

Phrases longues et courtes

Étant donné que la Longue Traîne ne correspond pas forcément au nombre de termes dans une requête, il est extrêmement important de surveiller la distribution de mots dans vos requêtes. Vous pouvez procéder de deux manières, en configurant les filtres dans Google Analytics mais aussi en exportant toutes vos données sur les mots clés dans un tableau Excel et faire tourner pivot table query pour montrer le taux de conversion contre la longueur des phrases et visiteur ou chiffres du revenu contre la longueur des phrases.

Mesure de la longue traîne

Conversion moyenne contre longueur de requête

Revenu total contre longueur de requête

Mesurer l’indexation

La meilleure façon de mesurer l’indexation sur des gros sites consiste à diviser en plusieurs sections et créer un SiteMap XML pour chacune. En procédant de la sorte, il est aisé de visualiser quelles pages sont indexées ou pas.

Sections du site dans multiple=

Si vous trouvez qu’une section en particulier rencontre un souci d’indexation, il faut diagnostiquer ce qui ne tourne par rond. Ca devient un peu technique car ma manière de procéder implique la création d’un script pour vérifier le statut d’indexation pour chaque page :

  • Vérifier l’indexation de la page en utilisant l’opérateur info:http://www.site.com/page.htm dans Google.
  • Vérifier les logs serveur pour voir combien de temps l’URL a été crawlée pendant les 30 derniers jours.
  • Utiliser l’API de SEOmoz pour trouver le total des backlinks et le mozRank.

Lorsque nous possédons ces données, il est possible de comprendre ce qui se passe pour mieux réparer.

Mesurer le nombre de Landing Pages

Encore une fois, nous divisons le site en plusieurs sections. Il est possible de procéder en masse, mais ça ne donne pas de bons résultats. La clef est d’utiliser cette méthode en ajoutant un filtre pour montrer seulement les Landing Pages dans le sous-dossier ou la catégorie à analyser.

Configurer google analytics pour analyser l'indexation

Le résultat final de votre analyse doit être un graphique qui ressemble un peu à celui ci-dessous.

Mesure et analyse des landing pages

Liens complémentaires

35 réflexions sur “Comment mesurer et analyser la Longue Traîne”

  1. Le caractère short, middle ou long tail d’une requête dépend non pas du nombre de termes composant cette dernière mais bien du volume de trafic généré par celle-ci : ça fait toujours du bien de le rappeler. 🙂

    Quelque chose qui mériterait d’être explicité : « ouvrir la porte pour des résultats plus frais au niveau de la Longue Traîne ».

    Je ne vois pas comment l’auteur parvient à cette conclusion. Des résultats plus frais, oui, c’est ce qui est promis par Google, mais pourquoi en particulier au niveau de la longue traîne ? ^^

  2. J’ai déjà entendu parler de cette longue traîne, mais le constat me semble bizarre car les grosses requêtes sont largement rémunératrices lorsqu’elles sont atteintes.
    On dirait que c’est plutôt pour les sites qui ne sont pas capables d’être ultra compétitifs puisqu’ils se recentrent sur un volume de mots clés.

  3. Je pense qu’il faut en effet se concentrer en 1er sur l’optimisation des Top Keywords qui transforment mieux et génèrent plus de CA. Il ne faut pas non plus négliger sa longue traîne qui génère la majorité des visites : elle transforme peu par requête, mais mises bout à bout celles-ci peuvent drainer un CA cumulé non négligeable!

  4. Je n’ai pas saisi en quoi Caffeine va changer radicalement la longue traine. N’est-ce pas plutôt sur les mots clés concurrentiels que ça risque de bouger plus vite ? Car sur la longue traine, personnes n’écrit précisement sur ces expressions, donc même si on crawl beaucoup, ça bougera peu, non ? Ou je n’ai rien compris ?

    J’ai aussi une question sur l’analyse : qu’est-ce que tu entends par « n’oubliez par d’enlever les mots clés associés à des marques » ?

  5. Le fait de développer de nouvelles pages pour le site avec la longue traine
    peut permettre de découvrir des expressions où il y a peu de concurrence et
    bien se positionner dessus semble être une bonne stratégie. Encore faut-il
    pouvoir développer son site avec de nouvelles expressions, il y a des sites ou
    l’ajout de nouvelles pages est assez compliqué car le thème du site est restreint.

  6. @teabol – bien sur que les grosses requetes payent mais les taux de conversions observée sur les mots cles moyenne et longue traine sont meilleurs en regle generale.

    @laurent – Merci pour la trad, ca devient de l’anaytics pointu mais ca peut en valoir la peine pour la management de gros site effectivement.

  7. @Gatien@ Equipement Moto : Je te laisse faire une recherche sur l’expression « keyword clustering » ou sinon, attends, un instant… http://tinyurl.com/298aonw 😉

    @TeaBol : Arfff! Tu sembles avoir une vision bien étriquée de la visibilité sur les outils de recherche. :p

    Un site de plusieurs centaines de milliers, voire de quelques millions de pages ne vise pas en priorité un positionnement sur de la requête générique, mais bien sur de la longue traîne, et notamment parce que c’est précisément ce type de positionnement qui apporte du traf et converti.

    Une requête générique ne paye pas toujours ; ça, c’est faux. J’avais un client qui était premier sur « immobilier », sauf que lui vendait des programmes immo, et que la plupart des internautes qui arrivaient sur son site via cette requête tournaient les talons illico car ils recherchaient vraisemblablement dans la grande majorité plutôt de la location de biens immobiliers qu’un achat de bien neuf. Gros traf, gain walou.

    @E. Referencement : C’est là où la connaissance de la cible et de ses intérêts est déterminant. Quand on fait de l’élargissement sémantique, bien souvent, on s’éloigne du sujet, mais ça ce n’es pas trop grave, c’est le jeu. Pour un client dans la location de ski, j’avais conseillé de faire un peu de contenu sur de la location d’hébergement en station (notamment via un partenaire dans ce secteur) ; assurément, la cible est la même, et un internaute intéressé par un sujet pourra bien souvent être intéressé par un sujet somme toute connexe.

  8. @Gatien@ Equipement Moto : Je te laisse faire une recherche sur l’expression « keyword clustering » ou sinon, attends, un instant… http://tinyurl.com/298aonw 😉

    @TeaBol : Arfff! Tu sembles avoir une vision bien étriquée de la visibilité sur les outils de recherche. :p

    Un site de plusieurs centaines de milliers, voire de quelques millions de pages ne vise pas en priorité un positionnement sur de la requête générique, mais bien sur de la longue traîne, et notamment parce que c’est précisément ce type de positionnement qui apporte du traf et converti.

    Une requête générique ne paye pas toujours ; ça, c’est faux. J’avais un client qui était premier sur « immobilier », sauf que lui vendait des programmes immo, et que la plupart des internautes qui arrivaient sur son site via cette requête tournaient les talons illico car ils recherchaient vraisemblablement dans la grande majorité plutôt de la location de biens immobiliers qu’un achat de bien neuf. Gros traf, gain walou.

    @E. Referencement : C’est là où la connaissance de la cible et de ses intérêts est déterminant. Quand on fait de l’élargissement sémantique, bien souvent, on s’éloigne du sujet, mais ça ce n’es pas trop grave, c’est le jeu. Pour un client dans la location de ski, j’avais conseillé de faire un peu de contenu sur de la location d’hébergement en station (notamment via un partenaire dans ce secteur) ; assurément, la cible est la même, et un internaute intéressé par un sujet pourra bien souvent être intéressé par un sujet somme toute connexe.

  9. merci pour cet interview en deux parties. toujours aseptisé à la sauce GG, mais au moins des réponses à des questions auxquelles on a pas d’écho d’ordinaire. merci

  10. Merci bien pour cette traduction, j’ai surtout apprécié les filtres pret à importés (je suis un fainéant) 🙂

  11. @Karnabal : en fait, la nouvelle infrastructure Caféine a permis cette update d’algo May Day. C’est pour cela qu’on peut parler de fraîcheur.

    @TeaBol : c’est une vision un peu réductrice, même s’ils existent des sites qui ont une poignée de mots clés à très forte valeur ajoutée.

    @Gatien : le truc est que la Longue Traîne ne pourra pas se diriger de la même manière que les principaux mots clés.
    A ton niveau, il faut faire les 2.

    @Sébastien : ça bouge bien partout (nouveau contenu, contenu effacé, contenu modifié), donc améliorer la fraîcheur va impacter sur les résultats et Caféine est au coeur de cela.
    Les marques sont des mots clés un peu particulier, notamment au niveau juridique. Cela dit, certains peuvent tout à fait les comprendre dans la stratégie. C’est un choix.

    @E. Referencement : à partir d’un certain moment, la volumétrie du contenu va être en corrélation directe avec le volume de trafic. Si ce n’est pas possible sur le site, il faut passer par de la visibilité déportée.
    Dans tous les cas, le contenu reste le parent pauvre de la création Web.

  12. Effectivement, avec la visibilité déporté, on trouve là un autre moyen de développer le trafic du site principal, même si c’est un accès moins « direct » qu’un trafic en provenance d’une Serp.

    Oui, je sais bien que la fraîcheur est la promesse qu’a faite Google, mais dans l’article on laisse entendre que c’est (« exclusivement », dirait-on) au niveau de la longue traîne.

  13. Très bon article détaillé, merci.
    La longue traîne c’est bien pour des « gros sites » à plusieurs milliers de pages, abordant de très nombreux sujets (comme les sites avec des forums, ou des articles divers et variés), ou encore des sites éditoriaux. En soit peu d’entre nous peuvent dire que la longue traine leur permet de « transformer » ou « gagner en trafic » avec de telles requêtes. J’explique un peu plus en détail mon point de vue, une requête de longue traîne pour moi, c’est une requête avec 4 ou 5 mots donc une requête très ciblée, qui va amener des internautes sur nos sites, mais si l’internaute arrive sur notre site, car celui ci a bien été optimisé pour le SEO et pour attirer l’internaute, il va trouver la réponse ou l’information qu’il recherchait sur le site très rapidement pour cette recherche très ciblée, mais après… une fois la réponse trouvée il partira comme il est venu. Je ne pense pas que les sites qui ne travaillent pas les requêtes concurrentielles ne peuvent pas être viables en terme de trafic. Les requetes de longue traine peuvent également faire augmenter sensiblement le taux de rebond du fait que la réponse demandé est trouvée et que l’internaute va partir au mieux ou revenir en arrière sur les SERP’s au pire.
    Comme il est dit plusieurs fois dans les précédents commentaires il faut du contenu pertinent frais et bien conçu pour les internautes et les robots, même si l’on peut lire par ci par là que Google ne comprend rien au contenu qu’il lit dans les pages qu’il crawle. Pour ma part ce n’est pas un domaine sur lequel je passerais du temps à faire des analyses, même si je dois dire que cela doit valoir la peine de s’y pencher pour des sites traitant de certaines thématiques. A l’aide de ton article je pense que je vais me faire une petite analyse, pour voir si je suis capable et si j’ai bien compris le principe.

  14. Merci pour la traduction, c’est toujours plus simple en français 😛
    La longue traîne me semble indispensable pour rentabiliser à long terme, les top keywords sont concurrentiels et il y a donc beaucoup plus de webmasters qui les visent donc une bonne place n’est jamais assurée ad vitam eternam.

  15. Juste pour info, je gere un site sur les collèges et lycées qui fait 1,3 million de visites sur des requetes concurrentielle au mois de juin. Il a une longue traine de 300 000 keyword… 280 000 mots clés apportent moins de 4 visites et génerent 500 000 visites soit presque la moitié du trafic ! Au niveau de rebond ca dépend… c’est quelque fois au dessus de la moyenne mais souvent en dessous… Au niveau transfo c’est pas si mauvais… surtout si comme dit dans cet article on veille aux landing pages…

  16. Bien longtemps que je n’ai pris le temps de m’arrêter.
    J’ai vraiment apprécié ce billet sur la matérialisation concrète d’un concept dont on entends tous les jours parlé sur les blogs SEO sans pour autant pouvoir réellement la quantifier.
    A présent c’est chose faite, même si là faut pousser GGA dans ses retranchements (ou plutot dans les miens) pour suivre ça de façon correcte.
    Bravo et merci pour la traduction

  17. Merci pour cette traduction.
    J’y vois plus clair sur cette notion.

    La segmentation en 3 ne devrait pas se faire en pourcentage plutôt qu’en visite car cela dépend du trafic global du site.

    Erwan
    Good Luck Ecommerce

  18. @Hotesses : le point que tu soulèves concerne l’autre pan de la problématique qui est de convertir au maximum. Pour cela, il est évident que préparer la page de manière adéquate est vital.
    Le plus facile est d’identifier la provenance du visiteur et lui proposer un contenu en conséquence. Par cela j’entends qu’il faut aller plus loin que le texte qui contient les mots clés tapés (pour le cas spécifique à la longue traîne). Par exemple, un travail sur les articles complémentaires peut s’avérer efficace s’il est bien foutu. D’ailleurs, j’utilise un plugin WordPress qui me satisfait plus que moyennement.

    @Canal Offres Emploi : en fait, la longue traîne n’est pas une fin en soi. L’important est de pouvoir l’exploiter à fond, notamment en rebondissant sur les termes qui présentent du potentiel au-delà de la poignée de visiteurs qu’ils ramènent par mois. Cela peut même engendrer des sous-thématiques ou rubriques d’un site.

    @tv 3D samsung : merci de nous faire partager cette expérience concrète et de confirmer l’importance d’une bonne landing page.

    @Blogueur & SEO tous des drogués : c’est justement le problème de toute la littérature sur la longue traîne (ou autres concepts SEO) qui sont largement disséqués, mais peu sont ceux qui s’attachent à en faire la démonstration applicative.

    @Référencement e-commerce : bonne remarque! Un % peut effectivement être plus parlant.

  19. @Hotesses : Ben ça dépend quand même du modèle économique de ton site ! Si l’internaute arrive directement sur ta page vendant la « paire de lunettes de soleil ray-ban blanche », qu’il l’achète, et ne surfe pas d’autres pages que les pages du tunnel d’achat, tu pourras quand même considérer que l’objectif est atteint, il me semble. Et comme le dit Laurent, un internaute, ça se séduit, et ça se garde, mais là, à mon sens, nous ne sommes déjà plus dans le SEO. J’aimerai bien qu’on m’oppose un cas où une requête générique convertit (à landing page égale) mieux qu’une requête long tail. 🙂

  20. yes il est vraiment bien cette article. Il y a tellement de chose a faire avec les données de google analitycs…. on pourrait passer sa vie a faire des analyses ! 🙂

  21. Beaucoup de choses intéressantes et beaucoup d’autres inexactes ou imprécises aussi. Tout d’abord sur la terminologie, la long-tail est bien le fruit d’une répartition statistique dépendant de seuils variables. La long-tail n’est donc pas liée à un volume mais plutôt un pourcentage relatif.

    De plus, dans la long-tail il y a le bon grain et l’ivraie, et cela dépend notamment de la distance sémiotique par rapport a votre site. On oublie souvent qu’un visiteur unique qui ne génère qu’un bounce ne satisfait que l’ego du webmaster concerné ou la bétise de quelques annonceurs naïfs, mais dans la majorité des cas n’apportera rien en tant que tel même en notoriété indirecte.

    La long-tail oui, n’importe laquelle non je trouve même qu’il est dangereux et absurde de cibler des mots n’ayant aucun rapport avec votre corpus, indirectement vous allez diluer la pertinence de ce dernier et baisser le référencement sur votre coeur. En d’autres termes pensez au sites satellites ou aux pages parking pour concentrer la long tail qui a augmenter le sitemap priority en conséquence.

    Bref un bon fond et une bonne logique désservie par une conclusion hative a mon avis…

  22. Bonjour 🙂

    Il convient d’analyser la longue traine parce qu’elle représenterait une part non négligeable des mots clés recherchés OK.
    Mais lors de l’audit des mots clés de qualité combien d’entre eux sont de nature à « transformer » c’est à dire à réellement nous rapporter de l’argent.
    Par les mots clés nous essayons d’attirer des clients pas des badauds…Là me semble être la difficulté.

  23. Voilà un article très intéressant, ce qui est plus compliqué est de trouver les requêtes de longue traine que le générateur de mots clefs google ne donne pas forcément. Si vous avez une solution ?

  24. @Assurance

    La meilleure solution pour moi, c’est de chercher en se mettant dans la peau d’un internaute lambda. Ca prend plus de temps, sa fait travailler les neurones mais cela peut être bénéfique.

  25. J’ai lu avec attention l’article et les commentaires mais une question me taraude depuis des jours . Un poid lourd sur internet ou un grand site de destockage qui au fond est référencé sur des millier de requêtes n’a pas vraiment de stratégie de longue traine parce que , de fait , ils ont tellement de produits que le référencement sur des requêtes marginales se fait automatiquement .

    D’un autre coté à part les poids lourds du net tout le monde cherche à monter une stratégie progressive qui s’appuie sur la longue traine . Du coup nous avons tous les mêmes expressions formées de 3 4 mots ou plus .

    En bref au bout d’un moment c’est tout de même la qualité et la pertinence du contenu sémantique et le fait d’avoir un contenu important qui fait la différence dans ma mesure ou plus il y a de contenu plus il y a d’expressions « naturelles » .

  26. @Nathalie

    Pour un poids lourd du web comme tu dis, travailler efficacement la longue traîne ce n’est pas juste mettre beaucoup de contenu en ligne, cela passe aussi par le développement de la sémantique au niveau du linkbuilding (aussi bien le linking interne que l’externe). Quand tu parviens, pour une page (très) profonde, à avoir 10 anchor texts au lieu d’un seul, tu augments sensiblement les chances de faire jouer la longue traîne.

    Ensuite, côté structure, favoriser l’accès des bots aux pages les plus profondes de son site c’est également une façon d’encourager le phénomène de longue traîne.

  27. Ping : Mon site e-commerce ne connait pas longue traîne – Please some help needed

  28. Aujourd’hui MayDay est bien installé et Panda va bientôt encore apporter des changements.

    On remarque qu’après plusieurs mois de MayDay l’on a toujours autant de référencement longue traine sur des requêtes où l’annonce a été supprimé.

    L’image du site prend un coup faute d’une fréquence de mise à jour des pages profondes importante…

  29. Bonjour,

    Je cherche un outils, ou script qui pourrait générer automatiquement le dernier graphique de l’article en se connectant ou en important les données de Google Analytics.
    Merci 🙂

  30. Bonjour,

    Je ne suis pas un pro du sujet ce qui fait que je me pose la question du nombre de pages, si il faut faire une page (landing page) par mot clef avec du contenu intéressant pour chaque page, on est pas sorti de l’auberge avec un site sur un seul thème.

    On peut utiliser le même contenu en changeant uniquement le mot clef et un peu adapter le contenu en conséquence mais le boulot n’est pratiquement pas possible !

    Patrick

  31. Ping : Alexis Faure vend du rêve avec la Long Tail Express

Laisser un commentaire