Référencement négatif : le duplicate content par HTTPS

Une des méthodes les plus simples pour effectuer du contre-référencement sur un site est de mettre en place un duplicate content par https. Découvrez comment cela fonctionne et comment s'en protéger facilement.

Attention : Google étant en constante amélioration, cet article n'est plus d'actualité. En effet, la faille qui permettait de référencer un site en http et https n'existe plus.

Le duplicate content ?

Plutôt que de vous donner une énième définition du duplicate content, je vous invite à regarder la définition du duplicate content proposée par le JDN.

Le duplicate content par HTTPS

Le but du duplicate content par HTTPS est de faire en sorte que les moteurs de recherche indexent non seulement la version HTTP d'un site web, mais aussi sa version HTTPS.

Ces deux versions, étant considérées comme deux sites distincts, possédant exactement le même contenu, ils seront classés en tant que duplicate content par les moteurs de recherche.

Le site web visé se verra donc attribuer un malus au niveau de son référencement, en plus d'être considéré comme un site "peu fiable" par les moteurs de recherche.

Comment est-il mis en place ?

Pour des raisons évidentes, je ne m'étendrais pas beaucoup sur ce sujet.

Pour mettre en place un duplicate content par HTTPS, un hacker doit tout simplement faire indexer la version HTTPS d'un site web, en plus de sa version HTTP, sur les moteurs de recherche.

Comment s'en protéger ?

La bonne nouvelle, c'est que cette méthode est aussi facile à déjouer qu'à mettre en place. En effet, pour protéger votre site de ce genre d'attaque, vous avez plusieurs possibilités :

Restreindre l'accès à la version HTTPS (déconseillé)

Cette méthode n'est pas très propre, mais très efficace : il suffit tout simplement d'empêcher l'accès à la version HTTPS de votre site. On peut le faire notamment en redirigeant toutes les pages en https vers les pages http correspondantes (une redirection 301 de préférence).

Ajouter une balise canonical sur les pages de votre site

Cette méthode est beaucoup plus propre. Elle consiste à indiquer aux moteurs de recherche que la version originale de vos pages HTTPS est située sur la version HTTP de la page.

Pour ce faire, il faut ajouter un lien rel=canonical dans la partie <head> des pages de votre site.

		<head>
			<link rel=canonical href="http://votre-site.com/page-actuelle"/>
		</head>		

Attention : le lien de la balise doit commencer par http, sinon cela n'aura aucun effet sur cette méthode de contre-référencement.

Voilà, les moteurs de recherche sauront maintenant que ces deux versions ne font qu'une.

Et vous ?

Avez-vous mis en place une méthode pour contrer le duplicate content par https sur votre site ?

Quelle méthode utilisez-vous ?