L’analyse du problème de l’analyse des mots clés
Comment est-ce possible d'obtenir un taux de rebond de 100%, un temps de 0 seconde et un nombre de pages par visites de 24.75 dans Google Analytics?
Table des matières
J’ai une énigme à résoudre aujourd’hui. Je suis dans un processus d’analyse des mots clés qui sont les plus utilisés pour venir consulter un de mes sites. Cette analyse me permettra d’établir un tableau de bord pour suivre les objectifs d’optimisation de ce site pour les moteurs de recherche. Je présenterai bientôt un résumé de la méthodologie que j’utilise pour rechercher et déterminer les mots clés qui sont importants à suivre, mais pour l’instant je suis aux prises avec une donnée vraiment bizarre. En fait, il me semble que George Bataille serait mort de rire, car je suis pris avec un impossible. J’aimerais bien que vous me disiez quelle peut être la cause de cet impossible, car je ne comprends pas. Je pourrais bien me fermer les yeux et continuer de faire mon travail comme si de rien n’était, mais ça m’embête de ne pas comprendre. Voici la brève histoire de ma rencontre avec cet impossible.
Mots clés et modificateurs
Tout a commencé quand j’analysais les modificateurs les plus populaires des termes que je cible sur mon site. J’étais en train d’utiliser la segmentation par mots clés afin de mieux comprendre l’impact des principaux termes que je cible ainsi que leurs modificateurs.
Les termes ciblés sont la raison d’être de mon site. Par exemple, pour un site de commerce électronique, ça pourrait être le nom d’un produit (par exemple, un « Kindle« ).
Les modificateurs sont les mots clés qui sont associés aux termes principaux que je vise. Pour le SEO, j’aime bien distinguer 4 types de modificateurs :
- les **types **– par exemple « 3G » ou « wifi » dans l’expression « kindle 3G » ou bien « kindle wifi »
- les **intentions **– par exemple: « buy, « reviews » ou « bargain », dans l’expression « buy a kindle » ou « kindle reviews » ou « kindle bargains »; et
- les **lieux ** – par exemple « Amazon » dans l’expression « buy a Kindle in Canada »; et
- les marques – par exemple, « Amazon » dans l’expression « Amazon Kindle ».
Il y a probablement bien d’autres modificateurs en fonction des types de solutions interactives analysées. En fait, si vous êtes un chercheur de mots clés, j’aimerais bien que vous preniez le temps de laisser un commentaire pour me faire part des modificateurs que vous utilisez pour classifier vos termes des recherches analysés.
Toujours est-il que je cherchais les modificateurs que mes clients utilisent pour chercher des produits spécifiques sur mon site.
Les révélations du « weighted sort »
J’en étais à utiliser la magnifique fonction du tri pondéré (weighted sort) en segmentant avec le taux de rebond pour valider si je n’avais pas oublié certaines opportunités que je ne devais pas laisser filer.
D’une part, je voulais comprendre quels étaient les modificateurs populaires pour mes produits qui généraient de faibles taux de rebonds. Cette donnée me permettrait ensuite de mesurer mon rang sur les moteurs de recherche comme Google ou bien Bing et de mettre en place des stratégies nécessaires afin d’améliorer le référencement de ces termes. La logique étant que puisque ces mots clés fonctionnent bien sur mon site, si j’améliore leur positionnement sur les moteurs de recherche, je pourrai probablement améliorer le rendement de ma solution d’affaires électroniques.
D’autre part, je voulais comprendre si j’avais aussi des modificateurs populaires qui généraient de forts taux de rebond. C’est que si certains termes sont populaires pour trouver mon site, mais que les gens rebondissent irrémédiablement lorsqu’ils le visitent, c’est peut-être que je dois en améliorer le contenu afin que ceux-ci trouvent une réponse à leur recherche. Ainsi, un rebond se transformera peut-être en une conversion…
À quoi bon me soucier du SEO pour ces termes quand c’est clairement l’information qui fait défaut?
L’impossible de Google
Et voilà que je rencontre mon impossible… Vous l’avez remarqué?
Comment est-ce possible d’obtenir un taux de rebond de 100%, un temps moyen de 0 seconde et un nombre moyen de pages par visites de 25.75? Hummmm.
L’hypothèse principale pour expliquer ce bogue était d’accuser Google Inc. et son Instant Preview. C’est qu’il y avait eu plusieurs discussions à propos des pages vues générées par Instant et qui faussaient à la hausse les statistiques de consultation des sites en provenance des visites avec recherche.
Segmentation méthodique
Même si le problème de Google Instant est déjà résolu, je me dis que c’est probablement ce qui est arrivé. Pour valider cette hypothèse, je filtre le terme de recherche énigmatique avec la dimension des « Services Provider » afin de trouver la marque de Google. Déception. Non seulement l’origine de ces visites n’est pas Google Inc., mais lorsque ces mots clés sont sous-segmentés en fonction du Service Provider, les 24,74 pages par visites deviennent 1 page par visite… Houlala.
Flairant la théorie de la conspiration, je me dis que c’est Vidéotron et la grève du Journal de Montréal qui doit être derrière tout ça. J’analyse toutes les visites avec mots clés en provenance de « videotron ltee », un taux de rebond de 100%, plus d’une page par visite et un temps moyen de 00:00 toc: true:00 par visite.
Ah ah! Je découvre 43 visites, avec un taux de rebond de 100%, un temps moyen passé sur le site de 00:00 toc: true:00 et une consultation en moyenne de 3,84 pages par visite… WTF?
Pour comprendre si Vidéotron est véritablement la source du glitch je décide de répéter l’exercice en incluant tous les autres câblodistributeurs. Nouvelle déception! Télus est de la partie, tout comme sympatico, hse, mrc des laurentides, omer desseres, etc. En fait, il y a en moyenne 216 visites, avec un taux de rebond de 100%, un temps moyen passé sur le site de 00:00 toc: true:00 et une consultation en moyenne de 4,21 pages par visite!
Même si l’activité de quelques-unes de ces consultations semble être l’oeuvre des robots, une grande majorité de celles-ci est définitivement de sources humaines. Peu importe. Que le visiteur soit un robot ou un humain, il ne peut pas consulter plus de 0 page s’il passe 0 seconde sur le site. Tout comme il ne peut pas y avoir un rebond de 100 % si plus d’une page est consultée dans une visite.
Retour à la case départ
Afin de m’assurer que la cause n’est pas Google Instant, je retourne dans le temps pour consulter les statistiques avant même que Google lance son système de prévisualisation instantanée. Toujours ce même constat. Il y a des visites en provenance des mots clés avec plusieurs pages visitées par visites malgré un taux de rebond de 100% et un temps passé sur le site de 0 seconde. Je décide aussi de vérifier si la source de ces visites bizarres est toujours le moteur de recherche de Google. Même si la source de toutes ces visites est presque toujours le moteur de recherche de Google (1206), quelques-unes proviennent aussi de Yahoo (26) et Bing(6). Il ne semble donc pas que ce soit la faute de Google.
Que se passe-t-il donc? Mystère et boule de gomme.
Veuillez soumettre vos hypothèses
Si je pose la question et que je veux trouver la réponse, c’est que c’est ce genre de donnée qui remet toujours en cause la crédibilité des statistiques de consultation d’un site aux yeux des hauts dirigeants d’une entreprise. Et qui justifie le fait que certains HiPPOs préfèrent s’en remettre à leur intuition plutôt qu’à la mesure afin de mettre en place leurs stratégies.
Vous avez déjà constaté ce genre de visites énigmatiques dans vos rapports de Google Analytics? (ajouter un script automatique) Qu’est-ce que vous pensez qui explique ce phénomène? J’aimerais sincèrement que vous éclairiez ma lanterne.
L’illustration impossible love de Marc Brunet provient du blogue d’Arifee.