La duplication de contenu ou duplicate content est un phénomène assez courant de nos jours. En principe, quand on copie et colle une source pour alimenter un contenu web, là on parle de duplication. Les moteurs de recherche vont donc les considérer comme du doublon.
Même s’il s’agit d’une portion de texte que l’on va coller à mainte fois sur un site web, cela a toujours un impact sur son référencement web (En cas de problème, faire appel à un spécialiste SEO à Madagascar vous facilitera la tâche) Les moteurs de recherche ont d’ailleurs pour mission de vérifier les contenus d’un site et de sanctionner les pages remplis de duplication de contenu.
Ils les considèreront comme étant un doublon ou bien un spam. Ce qui va nuire à l’expérience utilisateur et à la bonne compréhension du site internet.
Quand on reproduit alors le même contenu d’un site sur un autre, on fait référence à du copié-collé mais sur des sites différents. Il existe par ailleurs deux types de duplication de contenu :
- Le contenu dupliqué interne : il représente les doublons qui sont présents dans le même site web. Les causes peuvent être :
- Un problème de configuration.
- Un problème en rapport avec le crawl des pages et l’indexation.
- Le contenu dupliqué externe : il s’agit bien souvent d’un contenu volé et que l’on réutilise à outrance.
Cependant, Google impose des sanctions sévères aux sites dont le taux de duplication de contenu est très élevé. Pour débuter en rédaction web ? voici 4 choses à savoir avant de se lancer
Quel est l’impact d’un duplicate content pour le SEO ?
A l’évidence, l’impact d’un contenu dupliqué pour le SEO n’a rien de superflu. Même si le contenu dupliqué n’empêche pas l’indexation des pages, le moteur de recherche va seulement éviter de surclasser le site et prendre en compte le contenu dupliqué plusieurs fois.
Lorsque les pages sont classés en duplicate contenu, elles vont forcément perdre en positionnement dans les SERP. Dans le pire des cas, elles seront exclues des résultats de recherche.
D’ailleurs, cela ne concerne pas que le contenu dupliqué car si le PageRank d’une page originale est très élevé, elle sera mise au second plan. Mais plusieurs possibilités peuvent se produire en duplicate contenu :
- Pour les pages identiques : celle ayant un PageRank fort sera indexée.
- Pour les pages similaires mais avec des balises title et description différentes : toutes les pages seront indexées. La page qui n’est pas originale n’apparaitra pas cependant aux SERP que lorsqu’on relance la recherche avec les pages ignorées.
- Pour les balises title et Description identique des pages différentes : Google refusera d’indexer les pages classées en duplicate content.
Ainsi, il faut retenir une chose, une page web doit avoir une seule URL et s’il existe un contenu dupliqué, il faut inclure l’URL de la page originale dans la balise canonical. Les conséquences sur le référencement SEO sont donc :
- La perte de trafic.
- Site pénalisé par Google.
- Site non indexé par Google.
Comment identifier et supprimer le contenu dupliqué ?
Il existe un moyen, plutôt des outils, pour identifier et supprimer un contenu dupliqué. Il faut en effet vérifier si son site web est en présence d’un contenu dupliqué ou non. Pour cela, on vérifie d’abord son compte Google Search Console. Il indique souvent si son site web rencontre un problème ou une erreur.
Son site web peut être signalé comme un site spam partiellement ou totalement. Dans ce cas, on doit alors retravailler son contenu. Pour supprimer un contenu dupliqué, on peut également se servir de l’attribut rel=canonical. En principe, on indique simplement les moteurs de recherche sur l’URL originale.
Pourquoi éviter la création de contenu en double ?
Un contenu en double désigne un ensemble de contenu qui appartient à un domaine identique ou bien des blocs de contenus qui sont répartis sur différents domaines identiques ou presque similaires.
Si un site contient des contenus en double, cela représentera un danger pour la performance SEO. Lorsqu’on veut accroître le trafic vers un site, il faut éviter absolument de reproduire les articles des autres sites. Si on veut continuer de tirer profit au maximum du référencement naturel, le contenu en double est donc à exclure dans sa stratégie. Cette mauvaise pratique pourrait avoir des répercussions sur la performance de son site internet.
Le contenu en double peut avoir deux répercussions :
- Le référencement de son site web : un site comportant des contenus en double est non-productif pour le référencement SEO. De plus, il est considéré comme non-pertinent pour Google car il n’est pas intéressant d’avoir deux pages avec deux contenus similaires dans les résultats de recherche. Par conséquent, le positionnement de la page comportant un contenu dupliqué peut se trouver à la dernière place.
- L’e-réputation : la duplication de contenu peut impacter l’image d’une marque ainsi que son e-réputation. Le site va perdre en crédibilité car ses articles se répètent plusieurs fois. De ce fait, les clients vont considérer le contenu du site comme de peu d’intérêt, ce qui va générer moins de trafic.
Quels sont les outils pour détecter le contenu dupliqué ?
Le contenu dupliqué constitue une menace pour le positionnement de son site web. Ainsi, il est important de mettre en priorité les outils permettant de scanner et d’identifier les contenus dupliqués sur son site web. Ils sont nombreux à faire ses preuves mais certains ne sont pas fiables à 100%. Voici les plus courants :
Mais s’il ne faut retenir que trois outils uniquement, voici les plus intéressants et les plus fiables :
- Siteliner : il scanne d’abord le site et indique ensuite le pourcentage de contenu dupliqué interne. Il aide aussi l’utilisateur à mieux comprendre les contenus ainsi que l’architecture de son site. Ce site possède une version gratuite et version payante.
- Google : Google est aussi un outil efficace pour identifier un contenu dupliqué. Pour cela, il suffit juste de faire quelques recherches en tapant quelques phrases de son contenu. De cette manière, les résultats peuvent indiqués si Google a indexé les pages similaires ou non.
- Copyscape : c’est le plus utilisé par les référenceurs du fait de son efficacité et sa fiabilité. Tout comme Siteliner, il permet de déterminer si un site possède le même contenu que son site sur le web. On l’utilise surtout pour le duplicate content externe.