Bien référencer son site internet suppose de respecter des règles définies par les moteurs de recherche (Google, ou Bing) en terme d’optimisation on-site et off-site. Le contenu est un des principaux critères à respecter dans une stratégie de référencement naturel (SEO).
La politique de Google consiste à apporter du contenu qualitatif et unique pour les internautes. Le moteur de recherche favorise donc les sites qui apportent des textes de qualité et singuliers. De cette manière le contenu dupliqué (en anglais : Duplicate Content), c’est-à-dire un même contenu qui apparaît à plusieurs endroits sur le web, est sanctionné par les moteurs de recherche. L’algorithme Google panda déployé par Google en 2011 a pour objectif de déclasser les sites à faible valeur ajoutée.
Google lutte contre le contenu dupliqué, afin que les internautes obtiennent des résultats uniques et originaux. Car trouver plusieurs contenus identiques n’apporte ainsi aucune valeur ajoutée à l’internaute.
Risques liés au contenu dupliqué
Les sites employant du contenu dupliqué peuvent être sanctionnés pénalement puisque les droits d’auteur sont touchés (à condition d’en apporter la preuve).
Le contenu dupliqué non intentionnel n’est pas sanctionné par les moteurs de recherche. Toutefois, si Google perçoit une volonté de tromper et de manipuler les résultats avec du contenu dupliqué, il peut sanctionner le site copieur :
- Soit en pénalisant sa position dans les résultats de recherche, autrement dit le site perd des positions.
- Soit en désindexant le site en question, c’est-à-dire qu’il n’est plus visible dans les résultats. Cette sanction apparaît le plus souvent lorsque des actions de netlinking massives ont été perçues par Google.
Mauvais pour le référencement
Il est nécessaire aujourd’hui d’éviter le contenu dupliqué pour ne pas nuire à son référencement naturel (SEO). Celui-ci passe essentiellement par la création de contenu de qualité, unique associé à des backlinks qualitatifs (liens retours).
De plus, générer des URLs différentes pour un contenu identique demande un effort supplémentaire aux robots de Google, notamment pour indexer les pages. Cela « surcharge » son index, et risque de voir les pages rétrogradées dans les profondeurs du moteur.
Les causes de contenus dupliqués
Il existe différentes causes de contenu dupliqué. Il peut être rencontré au sein d’un même site ou sur différents sites :
Sur un même site, il peut concerner :
- Une indexation d’un site avec et sans « www ». Pour éviter cela, il suffit d’effectuer les redirections nécessaires lors de la mise en ligne du site. Il est également conseillé de définir le domaine préféré dans Google Console (anciennement Webmaster Tools).
- Une restructuration de site dont l’arborescence est modifiée risque de créer de nouvelles URLs avec des contenus identiques. Il faut, dans ces cas-là, prêter attention à ce qu’il n’y ait pas de doublons entre les anciennes et les nouvelles pages. Des redirections « 301 » doivent être mises en place afin d’aiguiller Google, et reporter la popularité des anciennes pages.
Sur des sites différents, il peut se traduire par :
- La reprise intégrale de contenus ou d’extraits. Il est fortement déconseillé de reprendre tout ou partie d’un texte déjà présent sur un site. Toutefois dans le cas de contenu syndiqué ou de contenu e-commerce agrégé sur plusieurs plateformes de vente en ligne, il faut utiliser les URLs Canoniques.
- Le plagiat, ou vol de contenu. Les droits d’auteur ne sont pas respectés et le référencement peut-être atteint.
Voici la recommandation officielle de Google : https://support.google.com/webmasters/answer/139066
Le contenu dupliqué peut être évité notamment en rendant le contenu d’un site unique et pertinent pour donner envie aux internautes de se rendre sur le site internet. La copie d’articles est à bannir, tout comme la création de contenu de mauvaise qualité (Spin par exemple).
N’hésitez pas à nous contacter pour des prestations de référencement éditorial.