Passer au contenu
  • Accueil
  • Marketing
  • Transformation numérique
  • Interviews
The-Rolling-Notes-Logo
  • Accueil
  • Marketing
  • Transformation numérique
  • Interviews
Contribuer
The-Rolling-Notes-Logo

Duplicate content : Comment le reconnaître ? Comment s’en prémunir ?

  • Digital & Social Media, Marketing
  • 20/01/2020
  • 6 min

Une étude de 2015 de Raven Tools révélait qu’environ 29% des pages indexées contenaient du duplicate content. Comment se prémunir contre ce fléau du Web ?

Accueil Digital & Social Media Duplicate content : Comment le reconnaître ? Comment s’en prémunir ?
duplicate-content-SEO-contenu-cover

Une étude de 2015 de Raven Tools révélait qu’environ 29% des pages indexées contenaient du duplicate content. Le duplicate content (littéralement « contenu dupliqué ») désigne le fait pour un même contenu d’être accessible via plusieurs URL. Au sens strict, il s’agit d’une duplication à l’identique (code html + textes) d’une page web, mais on considère aussi comme du duplicate content le fait que des fragments de textes substantiels soient dupliqués (« near duplicate »).

L’ennemi du Web numéro 1

duplicate-content-SEO-contenu-4

Quel que soit le type de contenu en double, il est particulièrement redouté dans le monde du référencement. En effet, bien qu’il ne soit pas techniquement une pénalité, le copié-collé peut parfois avoir un impact sur le classement des moteurs de recherche, d’autant plus que sa volumétrie est importante : lorsqu’il existe plusieurs éléments de contenu sensiblement similaire à plusieurs emplacements sur Internet, il peut en effet être difficile pour les moteurs de recherche de décider quelle version est la plus pertinente pour une requête de recherche donnée.

Au pire des cas, ne sachant pas quel contenu offre un classement plus élevé, le moteur de recherche pourrait décider de ne classer aucune de ces pages présentant le même contenu. Ne pas apparaître sur la première page d’une recherche peut être préjudiciable mais vous comprendrez que n’apparaître nulle part peut être véritablement problématique.

duplicate-content-SEO-contenu-7

Les autres problèmes posés par le duplicate content sont la dilution de la popularité (pagerank) et l’épuisement du budget crawl. En effet, les moteurs de recherche allouent un certain temps à l’indexation d’un site. Le temps passé à crawler de multiples fois les mêmes pages sous des URL différentes est du temps perdu qui n’est pas passé à crawler d’autres pages plus utiles pour le référencement.

duplicate content SEO contenu 5

Quelles sont les sources de duplicate content ?

La majorité des cas de contenus en double ne sont pas intentionnels et il est très probable que vous ayez des doublons sur votre site Internet.

Les sources courantes de contenu dupliqué sont :

  • Noms de domaine localisés par pays ou langue (site.com et www.site.ma), même s’ils appartiennent à la même société
  • Sous-domaines multiples (site.ma et site.ma)
  • Mauvaise canonisation de la page d’accueil et des répertoires (site.ma et www.site.ma/index.php)
  • Maintenance de deux versions http:// et https:// d’un site avec un contenu identique
  • Identifiants de sessions passés dans les URL (site.ma/index.php?sid=123)
  • Inconsistances dans l’ordre des paramètres, notamment dans le cas de navigation à facettes (site.ma/page.php?couleur=rose&taille=44 et www.site.ma/page.php?taille=44&couleur=rose)
  • Réécriture d’URLs sans redirection (site.ma/chemise-rose.php et www.site.ma/produit.php?type=chemise&color=rose)
  • Versions de pages alternatives telles que m.site.ma ou pages AMP

Enfin, le duplicate content se produit souvent avec les descriptions de produits sur les boutiques en ligne. Face à des déclinaisons couleurs ou tailles, les e-commerçants ne se donnent en effet pas la peine d’écrire des descriptions de produits pour chaque produit.

duplicate-content-SEO-contenu-8

Comment identifier le duplicate content ?

Il existe de nombreux outils pour identifier les contenus en double.

L’un des vérificateurs de duplicate content les plus connus est probablement CopyScape.com. Cet outil gratuit a une prise en main facile : insérez un lien dans le champ recherche de la page d’accueil et CopyScape renverra un certain nombre de résultats, présentant des parties dupliquées, ainsi qu’un pourcentage de doublonnage (ce qui donne une idée de la gravité du duplicate content). CopyScape n’affiche pas l’intégralité des résultats pour une page. Si vous souhaitez approfondir l’analyse de votre duplicate content, CopyScape propose également une version premium.

Siteliner est un outil qui, lui, recherche le duplicate content interne (sur votre propre site). Du contenu interne dupliqué ? Cela se produit très fréquemment lorsqu’un blog WordPress n’utilise pas d’extraits mais affiche l’intégralité de l’article de blog sur la page d’accueil du blog. L’article en question est dont disponible sur au moins deux pages : la page d’accueil et la page article elle-même. Et c’est probablement aussi le cas sur les pages de présentation des catégories et des balises : c’est donc déjà 4 versions du même article sur votre site Web.

Si vous souhaitez approfondir l’analyse de votre contenu dupliqué, Duplichecker, Plagspotter ou encore Smallseotools offrent de nombreuses fonctionnalités gratuites.

Des outils premium payants proposent de vérifier les contenus copiés-collés à l’aide d’algorithmes avancés : Grammarly, Plagiarismcheck et Plagium.

duplicate-content-SEO-contenu-1

Comment résoudre les problèmes de duplicate content interne ?

Il existe de nombreuses options pour résoudre les problèmes de duplicate content.

Elles tiennent fondamentalement en 4 scénarios :

  • Supprimer le contenu en double avec la balise Noindex : la balise noindex peut être particulièrement utile pour traiter le contenu en double. Ajoutée à l’entête html de chaque page individuelle, elle indique les exclusions de l’indexation des moteurs de recherche.
  • Mettre à jour le contenu en double : adoptez une approche éditoriale pour éviter le duplicate content en corrigeant vos contenus afin que chaque page propose des articles originaux. N’hésitez pas à faire appel à des rédacteurs web professionnels, qui sauront vous conseiller dans la réécriture de contenus existants.
  • Rediriger le contenu en double avec les redirections 301 : dans la plupart des cas, la meilleure façon de lutter contre le duplicate content est d’empêcher l’affichage de certaines versions de page alternatives et de configurer des redirections 301 de la page en double vers la page de contenu d’origine, pour qu’elles cessent de se faire de la concurrence.
  • Spécifier l’autorité avec les balises canoniques : chaque fois qu’un contenu peut être identifié sur plusieurs URL d’un même site, il doit être canonisé pour les moteurs de recherche. Les balises canoniques rel = canonical sont utilisées pour indiquer qu’une page donnée doit être traitée comme une copie d’une URL spécifiée, et que tous les liens et pageranks doivent être crédités à la page spécifiée. La Search Console de Google permet aussi de définir le domaine préféré de votre site (ex : site.ma ou site.ma). Cependant, cette configuration ne fonctionnera que pour Google et n’affectera pas la manière dont Bing ou d’autres moteurs de recherche pourraient éventuellement interpréter votre site.
duplicate-content-SEO-contenu-3

On a copié mon contenu. Que faire ?

Si vous être responsable du contenu dupliqué (de manière consciente ou accidentelle), vous n’aurez en fait des ennuis avec le moteur de recherche que si vous êtes engagé dans des « pratiques trompeuses ». Si elles sont signalées, cela pourrait cependant entraîner la suppression complète de votre site des résultats du moteur de recherche.

Si, réciproquement, vous pensez que quelqu’un d’autre a volé vos contenus, contactez le propriétaire du site web qui a publié ces contenus et indiquez-lui que vous avez trouvé vos contenus sur son site. Celui-ci peut ne pas être conscient que du contenu volé a été ajouté à son site alors accordez-lui le bénéfice du doute et laissez-le supprimer ce contenu. Si malgré vos demandes le contenu n’est pas supprimé, vous pouvez demander à Google de le supprimer de ses résultats de recherche pour violation du droit d’auteur.

S’il s’agit d’un site de haute qualité, donnez-leur la possibilité de conserver votre contenu en vous donnant crédit en tant qu’auteur et en intégrant un lien vers votre site. Une autre option consiste à proposer d’écrire un article révisé, lui aussi en échange d’un lien.

Étiquettes
# Content# Content Marketing# Contenu# duplicate# duplicate content# réécriture# Référencement# SEO# Web
Vous avez aimé cet article ? N'hésitez pas à le partager avec vos amis et collègues.
Mahja Nait Barka
Mahja Nait Barka

Diplômée en Management Stratégique, formée à l’innovation et à la créativité, j’accompagne depuis plus de 15 ans les entreprises, en Europe et en Afrique, pour développer des plateformes de marque performantes : de l’audit de l’identité à la clarification du positionnement en passant par la construction des fondamentaux de la marque (création de la plateforme de marque, définition des éléments de langage, stratégie de Personal Branding pour les dirigeants…).

Objectif : créer des marques fortes, désirables au-delà du produit.

J’aide aussi les marques à créer des expériences positives et intuitives autour de leurs services et passer à la vitesse supérieure dans leur trajectoire digitale. Mon expertise est transversale et orientée-business. Elle me permet de m’adapter à toutes les réalités de l’entreprise et d’embarquer des équipes souvent multidisciplinaires autour du branding, de l’accélération digitale et de l’expérience utilisateur, dans des projets complexes à fortes contraintes.

Articles: 123
email-marketing-1
Article précédent Non, les emails ne sont pas morts
Article suivant Qu’est-ce que vous attendez pour lancer votre IGTV ?
Instagram TV IGTV

Abonnez-vous à la Newsletter.

Saisissez votre adresse e-mail ci-dessous pour vous abonner à notre newsletter.

Recherche


Abonnez-vous à la Newsletter

Saisissez votre adresse e-mail ci-dessous pour vous abonner à notre newsletter.



Rejoignez la communauté
  • Facebook
  • LinkedIn
  • YouTube
  • Twitter
  • Feed RSS
  • Pinterest


Rubriques
  • Annonce Partenaire (1)
  • Biz' & Start-up (411)
  • Digital & Social Media (464)
  • Events (247)
  • Innovation & Tech (143)
  • Interview (106)
  • Marques (382)
  • Transformation numérique (23)

Publications similaires

Molly-McDonald-Blue-Door-Productions

Les cinq fondamentaux pour réussir sur YouTube

  • 05/06/2025
marketing-hybride-phygital

Marketing hybride : Comment fusionner le physique et le digital pour une expérience client fluide et performante

  • 27/05/2025
interactions-avec-les-clients-marketing

Comment l’IA va redéfinir les interactions avec les clients

  • 21/05/2025

Toutes nos rubriques :

  • Marketing
  • Marques
  • Insights
  • Communication • Publicité
  • Médias
  • Le livre de la semaine
  • Stories
  • Worldwide
  • Interviews
  • Digital & Social Media
  • Biz’ & Startups
  • Innovation & Tech
  • Apps & Développement
  • Matos & Devices
  • Geek Culture
  • Events
  • Création / Design
  • Transformation numérique

Copyright © 2013-2025 | The Rolling Notes | All rights reserved.

  • À propos
  • Contact
  • Politique de confidentialité