Qu'est-ce que le contenu dupliqué ?
Le contenu dupliqué fait référence à un contenu exact ou presque exact qui apparaît à plusieurs endroits sur le web. Il peut se trouver à la fois sur un même site web et sur différents sites web.
Par exemple, si vous publiez un article de blog sur votre site web et décidez de le soumettre en tant qu'article invité à un autre site web, cela est considéré comme du contenu dupliqué.
Le contenu dupliqué fait l'objet d'une vive controverse au sein de la communauté des webmasters. La principale crainte est que Google pénalise leurs sites web s'ils ont du contenu dupliqué.
Pourquoi le contenu dupliqué est-il mauvais pour le référencement ?
1. Classement indésirable de la version de la page dans les résultats de recherche
Si le même contenu apparaît sur différentes URL, Google peut finir par classer la version que vous n'aviez pas l'intention de classer. En effet, Google choisit la version à classer en fonction de ce qu'il considère comme le meilleur pour l'utilisateur. Vous pouvez éviter ce problème en gérant correctement le contenu dupliqué.
2. Dilution des fonds propres de Link
Chaque URL au contenu dupliqué peut attirer différents backlinks et avoir son propre PageRank. N'oubliez pas que le PageRank reste un facteur de classement, ce qui signifie que l'URL que vous n'aviez pas l'intention de classer peut se retrouver avec un meilleur profil de liens que l'URL que vous essayez réellement de classer.
Un exemple courant est celui où la même page ou le même contenu est disponible à la fois sur les versions www et non www de votre site web et/ou via les protocoles HTTP et HTTPS.
3. Budget crawl gaspillé
Si vous avez un site web de grande taille ou si vous mettez fréquemment à jour le contenu, le contenu dupliqué est un gaspillage du budget d'exploration. Au lieu d'explorer les pages nouvelles et mises à jour, les moteurs de recherche explorent et ré-analysent toutes les versions de contenu dupliqué. Par conséquent, votre nouveau contenu peut mettre plus de temps à apparaître dans les résultats des moteurs de recherche.
4. Un contenu syndiqué ou récupéré qui surpasse l'original
Dans de rares cas, le contenu syndiqué ou récupéré peut surpasser votre contenu original. Bien que cela ne se produise pas souvent, cela a été rapporté dans différentes communautés de référencement.
Serez-vous sanctionné pour le contenu dupliqué ?
Selon Google, la plupart des contenus dupliqués ne sont pas trompeurs à l'origine. En d'autres termes, si vous n'avez pas l'intention de manipuler les classements de recherche avec le contenu dupliqué, Google ne pénalisera pas votre site web.
Il existe cependant une pénalité (action manuelle) pour le "contenu mince sans valeur ajoutée", qui comprend le contenu de rebut (scraped content).
Comment trouver du contenu dupliqué sur votre site ?
Vous pouvez trouver du contenu dupliqué sur votre site en utilisant des outils tels que Ranktracker Web Audit. Lorsque vous lancez un audit de votre site web, vous remarquerez une section dédiée au contenu dupliqué. Cette section vous indiquera les pages dupliquées sur votre site web qui n'ont pas de balises canoniques appropriées et les pages qui utilisent les mêmes titres et descriptions.
Meilleures pratiques pour gérer le contenu dupliqué
1. Utiliser une norme unique pour tous les URL de votre site
Assurez-vous que chaque page de votre site est accessible en version www ou non www. Appliquez le même principe à la barre oblique à la fin de l'URL et assurez-vous que chaque page n'est accessible que via le protocole HTTPS. Toutes les autres versions doivent être redirigées vers l'URL standard que vous avez choisie.
2. Utiliser les balises canoniques pour la consolidation
Les pages dupliquées ou quasi dupliquées de votre site web doivent pointer vers une version unique et canonique à l'aide de balises canoniques. Une balise canonique indique à Google quelle version est la principale et doit être indexée.
3. Utiliser une balise canonique autoréférentielle
Une balise canonique autoréférentielle est une balise qui est ajoutée à la version principale de la page, indépendamment des autres pages dupliquées. Elle n'est pas obligatoire, mais elle est recommandée. Elles sont utiles lorsque vous avez affaire à des URL auxquelles sont associés différents paramètres.
Par exemple, lorsqu'une balise canonique autoréférentielle est utilisée, une URL comme https://example.com/blog/?utm_source=facebook aura automatiquement une balise canonique qui pointe vers https://example.com/blog/.
Si vous utilisez WordPress et que vous avez installé Yoast ou un plugin SEO similaire, les balises canoniques autoréférentielles seront ajoutées automatiquement. Si vous avez un site web codé sur mesure ou si vous utilisez un CMS personnalisé, vous devrez contacter votre développeur pour mettre en place des balises canoniques autoréférentielles.
FAQ
Le contenu dupliqué est-il sanctionné par Google ?
Il n'existe pas de pénalité pour le contenu dupliqué. Cependant, le contenu volé ou récupéré relève de l'action manuelle de Google "Contenu mince avec peu ou pas de valeur ajoutée".
Qu'est-ce qu'un contenu quasi-dupliqué ?
Un contenu quasi dupliqué est un contenu qui ne diffère que très peu d'un autre contenu. Par exemple, les pages d'un même produit destinées à des visiteurs américains et britanniques dont seules les devises sont différentes sont des quasi-doublons.
Pour en savoir plus sur la gestion du contenu dupliqué et d'autres bonnes pratiques SEO, consultez le Blog Ranktracker et explorez notre Glossaire SEO pour plus de termes et de définitions.