Duplicate content : portrait robot du pire ennemi du SEO

Si vous êtes un peu branché référencement naturel, vous avez sans doute déjà entendu parler du duplicate content.

Et sinon, cet article va probablement vous sauver la vie.

Car le duplicate, c’est réellement le PIRE ennemi de votre SEO !

De toutes les choses interdites par Google, c’est sans doute la plus interdite.

C’est d’ailleurs une chose que presque tous les web entrepreneurs savent.

Mais il ne suffit pas de savoir que c’est interdit.

Encore faut-il savoir pourquoi.

Alors rien que pour vous, voici un petit portrait robot du duplicate content, le pire ennemi du SEO.

Qu’est-ce que le duplicate content ?

Le duplicate content est, suspense… Un contenu dupliqué !

Plus précisément, il s’agit d’un texte qui a été copié, en partie ou en totalité, sur un texte déjà existant.

On peut trouver un duplicate content au sein d’un même site.

C’est notamment le cas des fiches produits sur les sites marchands.

Je vous dirai d’ailleurs plus bas comment éviter ça.

Mais un contenu peut aussi avoir été dupliqué sur un autre site.

Dans ce cas, c’est souvent du plagiat, c’est-à-dire du vol de contenu.

Comment on le reconnaît ?

C’est bien là tout le problème.

Car vous pensez bien que Google n’a pas fourni sa liste de critères lui permettant de reconnaître un contenu dupliqué.

Ce serait bien trop facile sinon, et on serait tous premiers dans les SERP hein ?

Alors faute de critères précis, on est obligé de tâtonner.

Il peut bien sûr s’agir d’un contenu qui a été entièrement copié sur un autre.

Et dans ce cas-là, il n’y a aucune place pour le doute.

Mais le duplicate content peut parfois être plus subtil que ça.

On a en effet vu des sites se faire pénaliser pour une simple citation de quelques mots, qu’ils avaient eu le malheur de prendre sur un autre site.

Parfois même, ça tient à une seule phrase, dont l’ordre des mots a simplement été changé.

Hé oui, on ne trompe pas Google comme ça, aussi facilement !

Quelques cas de duplicate content très répandus

Voici une brève liste non exhaustive des cas de contenu dupliqué qu’on rencontre le plus fréquemment.

Le plagiat volontaire

Le cas le plus répandu de duplicate content reste celui d’un copié-collé intégral.

Dans ce cas, on ne s’est même pas embêté à changer l’ordre des mots ni à refaire le contenu à sa sauce : on a pris, et on a mis direct.

Notez que c’est ce cas de figure qui est recherché en priorité par Google.

Et à ce titre, c’est aussi celui qui est le plus lourdement pénalisé.

Le duplicate involontaire

C’est la même chose que le cas du dessus, à ceci près qu’ici ce n’est pas volontaire.

C’est ce qui arrive notamment quand c’est le même rédacteur qui écrit tous les contenus d’un site.

Ça peut aussi se produire lorsque plusieurs sites traitant de la même thématique achètent leurs textes auprès du même rédacteur.

Le duplicate interne

Il s’agit du cas où on retrouve le même contenu sur deux pages différentes d’un même site web.

Les pages possèdent chacune leur propre url, mais leur contenu est exactement le même.

Une petite erreur, qui n’est généralement pas trop lourdement pénalisée par Google.

On peut aussi rencontrer le cas d’une cohabitation entre une ancienne et une nouvelle url après la restructuration d’un site.

Le cas particulier des sites marchands

Ce cas est un peu à part.

Car les sites marchands possèdent généralement une fiche pour chaque produit, qu’ils dupliquent à l’identique pour décrire les variantes d’un même produit.

Prenons le cas d’un site qui vend des salons de jardin.

Il va généralement utiliser la même description pour son salon de jardin gris, et ce même salon mais en noir.

Il existe une astuce très simple pour éviter le duplicate interne, mais je ne vais pas tarder à vous en parler.

Mais il arrive aussi que deux sites différents utilisent quasiment la même description pour un produit qu’ils ont en commun.

Pourquoi c’est strictement interdit ?

Tout simplement parce que Google n’aime pas les vilains tricheurs.

Et il les pénalise donc en conséquence.

Si Google trouve sur votre site un contenu dupliqué sur un autre site, il va automatiquement chercher à retrouver la source originale.

Et une fois qu’il l’aura trouvée, il va indexer uniquement la page source du contenu, ou à défaut, la page ayant le TF/CF le plus élevé.

Votre contenu risque donc de perdre des positions dans les SERP, voire même d’être complètement désindexé des moteurs de recherche.

Astuces pour éviter le duplicate content

Éviter le duplicate content n’est pas si compliqué que ça.

C’est surtout une histoire de bon sens, même s’il existe quelques petits coups de pouce artificiels qu’on peut utiliser.

Faire appel à des rédacteurs différents

Ça, c’est du bon sens par exemple.

Il va de soi que si c’est le même rédacteur qui écrit tout le temps sur le même sujet, il risque de tourner en rond au bout d’un moment.

Si vous pouvez, essayez donc de changer de rédacteur, surtout si vous faites du linking externe.

Mais on n’a pas toujours la possibilité de faire ça.

Et dans ce cas, mieux vaut trouver un rédacteur SEO qui soit formé à la technique du content spinning.

La technique du content spinning en rédaction SEO

Bien maîtrisée, cette technique permet de gagner un temps substantiel dans la rédaction SEO.

Il s’agit en fait d’une méthode de réécriture de texte automatisée, qui permet de produire de nombreux textes uniques à partir d’un seul et même texte.

Le rédacteur doit pour cela rédiger un master spin, c’est-à-dire le texte d’origine qui servira de base à la réécriture automatique.

C’est ça qui prend le plus de temps, car il faut décortiquer le texte en petits groupes de mots, et trouver un ou plusieurs synonymes pour chaque mot.

Une fois que le master spin est écrit, la réécriture automatique se charge de produire des textes uniques, faits à partir de tous les équivalents donnés dans le texte de base.

Mais cette technique est très longue au départ, et elle montre vite ses limites.

Car même si elle est pratique pour produire des textes en grande quantité, une trop grande utilisation du master spin peut conduire à la création de textes complètement incompréhensibles pour l’utilisateur.

Et il ne faut pas oublier qu’UX et SEO sont étroitement liés.

De plus, avant de se lancer dans le content spinning, il faut bien évaluer le temps que met le rédacteur à écrire le nombre de textes souhaités, mais aussi le temps qu’il met à rédiger le texte d’origine.

Cette technique n’est pertinente que si elle permet de générer le nombre de contenus voulus plus rapidement que s’il fallait les écrire un par un.

Faire une redirection 301

Cette astuce est utile dans le cas d’une restructuration de votre site web, dont je vous parlais plus haut.

Pour éviter que le même contenu ne se retrouve sur une ancienne et une nouvelle url, assurez-vous de mettre en place une redirection 301 de l’ancienne url vers la nouvelle.

Il s’agit ici de prévenir Google que le seul contenu à indexer est celui qui se trouve sur la nouvelle url.

Cette redirection étant permanente, elle est très utile lors d’un changement de nom de domaine par exemple.

La balise canonical pour les sites marchands

On revient au cas particulier des fiches produits.

En gros, il s’agit de faire comprendre à Google pourquoi le contenu est dupliqué.

Reprenons l’exemple du salon de jardin proposé en plusieurs couleurs.

On choisit d’abord le produit qui se vend le plus, afin que Google référence en priorité celui-ci.

Puis on va insérer une balise canonical dans le header de la page.

Cette balise va permettre à Google de comprendre qu’il s’agit du même produit, mais dans deux couleurs différentes.

Et qu’il est donc normal que le contenu soit dupliqué.

La balise canonical évite ainsi d’être pénalisé au niveau du SEO.

Les outils de détection de duplicate content

Il existe plusieurs outils qui calculent ce qu’on appelle le taux de duplication.

Ces outils de chargent d’analyser le texte ou l’url en question, afin de savoir si oui ou non le contenu a été dupliqué.

Le site positeo.com par exemple, permet d’analyser un texte ou une url gratuitement.

Très pratique pour ceux qui n’en ont besoin que de façon très sporadique.

Si en revanche vous produisez des contenus en grande quantité, vous allez très vite devoir passer à la vitesse supérieure.

Et c’est là que je vous parle de Kill Duplicate, l’outil surpuissant qui détecte avec une grande précision le duplicate content.

Petit problème : il n’est pas gratuit.

Il est même assez cher.

Le prix des abonnements mensuels varie en effet entre 19 et… 399 euros !

Avec un tel écart, vous vous doutez bien qu’il y a baleine sous gravillon.

Cette différence s’explique par la limite d’analyse du nombre d’url.

Le plus petit abonnement vous permet par exemple d’analyser 100 url par mois, quand le plus cher vous permet d’en analyser 50 fois plus.

En gros, cet outil se justifie principalement pour ceux qui font du linking à haute dose, et beaucoup moins pour les sites uniques.

Vous savez maintenant comment éviter le duplicate content, et ainsi améliorer votre référencement naturel.

Et n’oubliez pas que le contenu est le premier ranking factor de Google, alors travaillez-le bien !

Laisser un commentaire