Quelles solutions pour la problématique de contenus dupliqués?

A l’occasion du SEO-Campus, Olivier Andrieu d’Abondance.com a proposé une synthèse intéressante des principales problématiques rencontrée sur ce sujet souvent mal compris.
A la base il est assez facile de comprendre qu’un contenu dupliqué n’intéresse pas un moteur de recherche. A choisir entre 10 ou 100 pages qui proposent exactement le même contenu, il facile de comprendre que seule (à priori) une page suffira pour répondre à la recherche d’un visiteur.
Entre les contenus volés (entièrement ou partiellement) et une gestion dynamique de contenu qui crée différents formats de contenu, la problématique de duplication du contenu est assez large à comprendre.
Olivier Andrieu a donc présenté une problématique duplicated content (DC) divisée en cinq typologies:

  • Le DC intrasite
  • Le DC intersite
  • le DC « DUST » : duplicated url with same text
  • le DC « Title+Description »
  • le DC multi langues

L’approche Contenu Dupliqué par Mitambo

La capacité d’analyse des crawlers Mitambo permet d’identifier précisement une grande partie des problématiques internes à un site web.
Avec le principal avantage de pouvoir parser des sites de plusieurs millions de pages et de fournir des rapports exacts sur chaque problématique:

  • DC Titre : Titre et meta-description dupliqués
  • DC DUST : Différentes URLs pointant sur le même contenu
  • DC Intrasite : Où l’on se trouve très proche du DUST (un contenu publié dans des sections différentes)

Nos outils permettent une granularité dans l’analyse qui va jusqu’à l’identification du noyau central de la page (en écartant les blocs de navigation principaux (en-tête, pied de page, navigation latérale, …). Ce qui permet entre autre de pouvoir identifier un contenu d’article qui serait publiés dans une mise en page générale différentes.

Laisser un commentaire