(+33) 6 50 46 27 02 contact@lesmarketing.fr

 

duplicationdecontenuexterne

Google évalue la qualité du contenu publié en analysant son originalité. Si les algorithmes des moteurs de recherche (et en particulier l’algorithme Panda) détectent les mêmes textes publiés sur plusieurs sites, ils décident eux-mêmes qui en est l’auteur. Ils ne le font pas objectivement : les domaines les plus forts sont considérés comme propriétaires du contenu, atteignant des positions plus élevées dans les résultats de recherche. Et que deviennent les sites web considérés comme des plagiaires ? Ils disparaissent du classement de Google. Les conséquences de la duplication de contenu peuvent être très graves, aussi pour éviter le risque de perte de visibilité, nous vous recommandons de lire notre guide complet ou de contacter notre agence pour un audit sémantique.

Qu’est-ce que la duplication de contenu externe ?

Le contenu dupliqué externe peut causer des problèmes d’indexation et de positionnement et il vaut mieux l’éviter. Les causes les plus courantes sont :

  • Le copier/coller de la description du site est une pratique courante que l’on peut observer sur plusieurs sites. Cela se produit souvent lorsqu’ils partagent des produits similaires, qui ont été remplis d’informations provenant d’un autre fournisseur ou d’un fournisseur.
  • Le deuxième type consiste à prendre le contenu écrit par un blog partenaire qui est publié sur votre site, mais aussi celui du blog ami.

Information complémentaire : lorsque le moteur de recherche détecte un contenu dupliqué, il est objectivement incapable d’évaluer qui en est le créateur. Le processus d’indexation se déroule en continu, et l’index ne comporte aucune date d’indexation du contenu. Par conséquent, on ne sait pas quelle page a publié le texte en premier. Par conséquent, Google attribue un domaine plus fort, même s’il aurait pu dupliquer le texte.

Quelles sont les conséquences de la duplication de contenu sur le SEO ?

Le pire effet du duplicate content est la suppression de la page de l’index Google et donc des résultats de recherche organique. Cela peut affecter l’ensemble du domaine ou seulement des pages. Une telle conséquence est relativement rare, mais l’indexation du site est une menace réelle.

Le plus souvent, le contenu dupliqué externe conduit à :

  • Diminution des positions du site web dans le classement de Google,
  • Réduction de la visibilité de la marque dans les résultats de recherche de Google,
  • Une diminution du trafic issu du référencement naturel,
  • Une moindre chance de conversion.

Comment vérifier si la duplication de contenu externe ?

Le moteur de recherche Google est la source d’information la plus fiable sur les contenus dupliqués. Vous pouvez vérifier gratuitement si certaines parties du contenu de votre site se trouvent également sur d’autres sites.

  • Copiez une partie de votre contenu présent sur votre site.
  • Ouvrez le moteur de recherche Google.
  • Collez le contenu copié et ajoutez les guillemets.
  • Google vérifiera s’il y a une correspondance exacte avec votre texte dans son index.
  • Les doublons apparaîtront dans les résultats de la recherche, et la correspondance exacte sera en gras dans la description.
  • Si Google trouve beaucoup de pages avec le même contenu, il masquera les résultats sous le bouton :
  • Vérifier l’unicité du contenu présent sur les autres sites internet, l’inconvénient de base avec cette technique : seul un court fragment du contenu peut être vérifié et non la totalité. Si vous vouliez vérifier la duplication de tout votre contenu de cette manière, cela vous prendrait certainement beaucoup de temps.

Pour gagner du temps, utilisez des outils !

L’un des meilleurs programmes de détection de contenus dupliqués externes est Copyscape. Le programme peut être testé dans sa version gratuite qui est limitée. En souscrivant à un abonnement, vous pouvez, entre autres, vérifier plusieurs URL, et vérifier l’unicité du contenu, qui apparaît dans un rapport facile à télécharger. En outre, l’outil Copyscape est également utile pour vérifier l’originalité du contenu soumis par les rédacteurs.

Comment corriger les contenus dupliqués ?

Vous avez trouvé des contenus externes et après ? Vous avez plusieurs solutions, et selon la recommandation du support Google, vous devez simplement réécrire le texte. 

Les solutions sont :

  • Réécrire les textes dupliqués.
  • Supprimer les parties de contenus dupliqués.
  • Contacter les sites qui vous ont volé votre contenu afin de faire retirer vos contenus de leur site.
  • Bloquer l’indexation des contenus dupliqués.

Comment se protéger du vol de contenu ?

Malheureusement, il n’existe aucun moyen efficace de protéger le site contre le vol de contenu. Vous ne pouvez que compliquer la tâche des voleurs qui n’ont pas de compétences avancées en programmation pour dupliquer le contenu.

Parmi les méthodes techniques les plus courantes qui rendent difficile la copie du contenu, on peut citer :

  • Bloquer le bouton droit de la souris sur la page.
  • Verrouillez la sélection et la copie du texte.
  • Ajout d’un lien vers la page au texte copié.

Comment éviter le contenu dupliqué ?

Vous trouverez ci-dessous des méthodes que vous pouvez essayer si vous n’êtes pas en mesure d’éliminer tout contenu dupliqué :

Balise canonical 

Le contenu dupliqué peut être un problème pour les e-commerces. Certains articles sont extrêmement similaires, avec des descriptions semblables, et sont publiés sous plusieurs URL. Les balises canoniques peuvent être très utiles dans ce cas, elles peuvent servir à identifier le contenu dupliqué pour les moteurs de recherche.

Comment utiliser la balise canonical ?

Ajoutez rel=”canonical” dans vos contenus. La balise doit renvoyer au contenu d’origine.

<head> 

<link rel= “canonical” href= “https://votre site.fr/contenu origine”/>

</head>

Les robots des moteurs de recherche reconnaissent cette balise et ne classent pas le contenu dupliqué ; par conséquent, le contenu d’origine est mieux classée dans les SERP tout en évitant de créer une concurrence entre les pages.

Privilégier le contenu unique

La balise canonical est un moyen efficace d’éviter le contenu dupliqué, néanmoins, la création de contenu unique est la première chose à faire. La création de texte unique de qualité peut prendre plus de temps et conduire à la publication d’articles en double sur votre site. C’est pourquoi il est préférable de planifier la création de vos contenus et d’éviter totalement la création de doublons.

Les redirections peuvent être une solution idéale si vous devez déplacer du contenu pour des raisons spécifiques, comme pour la refonte de votre site internet. Utilisez le code de statut 301 pour les redirections permanentes, tandis que le code 302 ne doit être utilisé que temporairement.

Sources de contenu dupliqué

Le contenu dupliqué peut être difficile à repérer, surtout s’il est caché dans des endroits peu évidents sur votre site internet. Voici les différentes probabilités, qu’un texte dupliqué sur votre site web n’est pas détecté.

Plusieurs sous-domaines

Vous possédez plusieurs domaines au contenu identique ? Vous pourriez être en concurrence avec vous-même avec votre contenu dupliqué.

La solution : le contenu peut simplement résider sur un domaine et rediriger tous les autres domaines à l’aide du code 301. 

Cependant, si pour une autre raison, vous devez laisser le contenu accessible. Nous recommandons de désindexer les contenus des moteurs de recherche (ou d’intégrer une balise canonical)

Note : pour désindexer le texte, il faut intégrer la balise noindex dans vos contenus. 

Domaines spécifiques à chaque pays

En raison des différences de taux d’imposition et de frais de port dans les différents pays, il peut être avantageux pour les magasins d’établir des domaines et des répertoires dans différents pays. 

Les moteurs de recherche ne considèrent pas les traductions de contenu, comme du contenu dupliqué. Néanmoins, un contenu allemand identique sur un domaine en Suisse, en Allemagne et en Autriche constituerait du contenu dupliqué.

Google recommande de baliser chaque version d’un contenu à l’aide de la balise “hreflang”, afin de s’assurer que les deux pages se réfèrent l’une à l’autre en utilisant la même langue.

La balise “hreflang” peut être utilisée pour marquer plusieurs domaines qui partagent une langue similaire.

Descriptions similaires sur des sites externes

De nombreuses boutiques en ligne vendent leurs produits non seulement par l’intermédiaire de leur domaine, mais aussi sur eBay, Amazon Marketplace ou d’autres places de marché semblables, ce qui crée un contenu dupliqué si la même description de produit apparaît deux fois sur différents sites. Certains magasins travaillent même avec des sites de comparaison de prix et de produits qui reçoivent des données par flux RSS, ce contenu fait souvent double emploi avec celui trouvé sur le domaine du propriétaire.

La solution : Dans ce cas, il n’y a pas d’échappatoire, c’est à vous de créer un contenu original pour les marketplaces. Dans le cas contraire, vos chances de classement sont très limitées (Google attribue la paternité du contenu au domaine le plus puissant et non le premier qui a publié le contenu).

Descriptions similaires sur votre site

Le texte de votre produit peut apparaître sur plusieurs marketplaces, mais aussi entre les pages de votre site, créant ainsi du contenu dupliqué. Ce type de contenu dupliqué se retrouve souvent dans les boutiques en ligne : un article est dupliqué pour plusieurs catégories du site. Ce qui créer deux URLS différentes pour le même produit (et en conséquences de la duplication de contenu). 

La solution : il faut déterminer quelle URL de votre produit doit être prise en compte par Google et intégrer des balises canoniques pour indiquer aux moteurs quel produit doit faire référence.

Site en version de pré-production

Une copie identique de votre site web peut être créée dans un autre sous-domaine à des fins de test ou de refonte, de sorte que son contenu est indexé deux fois par les robots des moteurs de recherche. 

Solution : les domaines de test ne doivent jamais être accessibles à Gogole pour les protéger, il convient d’utiliser le fichier .htaccess et d’intégrer la balise noindex, nofollow sur l’ensemble du site.

Domaine accessible sur plusieurs versions

Selon les paramètres de votre navigateur, il est possible qu’un domaine soit accessible à la fois sous https://www.votresite.fr et https://votresite.fr.

La solution : il faut apporter des modifications à votre fichier .htaccess. Il suffit de spécifier qu’une version d’une URL redirige vers son homologue (code 301) :

RewriteEngine On

Options +SymLinksIfOwnerMatch

RewriteCond %{HTTP_HOST} ^votresite.fr

RewriteRule (.*) www.votresite.fr/$1 [R=301,L]

Domaine accessible avec le slash

L’utilisation du slash “/” peut entraîner du contenu dupliqué. Une barre oblique apparaît à la fin d’une URL pour indiquer sa structure de répertoire :

https://votresite.fr/index1/

Si la redirection n’est pas mise en place, et que la barre oblique finale a été supprimée d’un URL, le serveur l’interprétera comme désignant une URL unique.

https://votresite.fr/index1

Lorsque le serveur découvre qu’un fichier n’existe pas, il charge un répertoire portant le même nom que celui de l’URL initiale et donne accès aux deux versions de la même page, ce qui peut donner lieu à un contenu dupliqué.

Solution : les redirections peuvent être mises en œuvre en utilisant le fichier .htaccess avec le code de statut 301.

RewriteCond %{REQUEST_FILENAME} !-d

RewriteRule ^(.*)/$ /$1 [R=301,L]

Les paramètres des filtres

Les options de filtrage, de tri et d’affichage génèrent des URL contenant des paramètres (par exemple ?sort=highest ou ?mode=list). Google peut indexer ce contenu, qu’il va considérer comme du contenu dupliqué.

Solution : il faut indiquer aux moteurs de recherches de ne pas prendre les URLs paramétrées en compte, elles doivent être marquées avec des balises canonical, soit avec la balise noindex.

Sujets Connexes