La plupart des webmasters s’inquiètent de l’indexation des pages de leur site internet. Mais toutes les pages ne sont pas égales. Il s’avère que l’indexation de certaines de vos pages peut nuire à votre classement dans les moteurs de recherche et à l’autorité du site.
Le pire, c’est que vous ne savez généralement même pas que ces pages ont été indexées. Google est bon en matière d’indexation, parfois trop bon, et indexe des pages qui ne devraient pas l’être.
Aujourd’hui, vous allez apprendre comment désindexer une page de Google. Dans cet article, vous découvrirez comment et quelles pages vous devez désindexer pour augmenter l’autorité de votre site et obtenir un meilleur classement.
Mais tout d’abord, pourquoi faut-il désindexer une page de l’index Google? Je vous propose de découvrir la réponse tout de suite ci-dessous.
Pourquoi désindexer une page de l’index de Google?
Il existe de nombreuses raisons pour lesquelles on choisit de désindexer certaines pages de Google. La raison la plus courante est le contenu dupliqué. Mais dans certains cas, c’est parce que les pages ne sont pas destinées à être utilisées pour l’indexation.
Par exemple, une page de remerciement. Il s’agit d’une page que vous montrez aux utilisateurs après qu’ils ont effectué certaines actions sur votre site internet. Vous souhaitez certainement désindexer cette page car vous ne voulez pas que les internautes la trouvent par le biais de la recherche Google sans avoir effectué l’action que vous souhaitez.
L’indexation de ces pages peut entraîner de graves problèmes tels que:
- Nuire à votre autorité (et à vos classements)
- Ralentir l’exploration et l’indexation des pages importantes en utilisant votre budget de crawl
Pour éviter cela, vous devez désindexer ces pages des résultats de recherche.
Quand désindexer une page?
Avant de voir comment désindexer une page de votre site internet, il est important de déterminer quelles pages peuvent être concernées.
Tout d’abord, toutes les pages de WordPress sont indexées par défaut lorsqu’un site internet est publié. Sauf si vous bloquez l’exploration ou le non référencement de vos pages.
Si vous n’avez pas beaucoup d’expérience dans les paramètres de SEO pour un site WordPress, des pages inutiles peuvent être indexées par erreur. Par exemple, outre les pages, vous pouvez trouver des archives, des catégories, des éléments de menu, des parties de thème, des filtres, etc. affichés sur la SERP.
Heureusement, un plugin SEO comme Rank Math ou Yoast vous permet de choisir quels types de page ou de contenu doivent apparaître dans les résultats des moteurs de recherche.
Deuxièmement, il est conseillé de désindexer les pages dupliquées (une même page avec différentes URLs) et de masquer les pages qui n’apportent rien à l’expérience utilisateur. Par exemple, si votre site internet contient une version imprimable et une version ordinaire, une seule d’entre elles doit apparaître dans l’index de recherche.
Troisièmement, si vous avez des pages de votre site piratées (j’espère que ce n’est pas le cas maintenant), il est nécessaire de supprimer au plus vite ces pages de l’index de recherche. Les moteurs de recherche surveillent les sites internet et peuvent les bloquer en cas de piratage pour éviter que d’autres utilisateurs ne soient attaqués.
Toutefois, cela ne se produit pas très souvent, si vous suivez certaines règles de protection et de sécurité. En outre, si des URL piratées apparaissent dans l’index de recherche, vous devez les supprimer manuellement.
Noindex et Nofollow
Comme ces termes peuvent prêter à confusion, examinons les différences.
Lorsqu’on utilise une balise noindex, on indique aux moteurs de recherche que s’ils peuvent explorer la page pour en comprendre le contenu, ils ne peuvent pas l’indexer pour qu’elle apparaisse dans les résultats des moteurs de recherche.
Au contraire, une balise nofollow ajoutée à un lien indique aux moteurs de recherche de ne pas suivre ce lien. Cela désavoue le lien et informe le moteur de recherche de ne pas transmettre d’autorité (ni de jus SEO) à la page liée dans votre contenu.
Comment vérifier si une page est désindexée?
Vous vous demandez peut-être: Comment puis-je savoir si une page n’est pas indexée?
Il existe différentes méthodes très simples de le savoir.
1. Vérifier manuellement sur Google
Le moyen le plus simple de savoir si vous avez désindexé la page ou non est de vérifier directement dans les résultats de recherche de Google. Pour cela, allez sur Google et tapez site:domaine, en indiquant votre nom de domaine. Comme par exemple:
site:thimaffiliation.com
Vous obtiendrez le nombre exact de pages indexées juste en dessous de la barre de recherche et les pages indexées spécifiques seront listées dans les résultats de recherche.
Cette technique est très pratique pour voir quelles pages sont indexées ou non dans Google. Mais que faire si vous voulez vérifier une page spécifique?
Vous pouvez faire de même, mais au lieu de taper site:domaine, vous tapez l’URL spécifique de la page que vous voulez vérifier. Comme par exemple:
site:thimaffiliation.com/site-wordpress/
Cela vous aidera à savoir si une page spécifique est indexée ou non, afin que vous puissiez la supprimer ultérieurement. Si votre page est désindexée, vous n’obtiendrez aucun résultat.
2. Utiliser la Google Search Console
La Google Search Console est particulièrement utile pour obtenir des informations détaillées sur l’état de vos pages.
Vous pouvez consulter rapidement la liste de toutes les URL indexées ou saisir une URL spécifique dans le champ de recherche de la barre haute pour en savoir plus.
Si votre page est indexée, vous obtiendrez le message « Cette URL est sur Google ».
Si vous avez désindexé la page, vous obtiendrez le message « Cette URL n’a pas été indexée par Google ».
En outre, grâce à la Search Console, vous pouvez également consulter la liste de toutes les pages incluses dans l’index et celles exclues, ce qui peut vous aider à voir quelles pages n’ont pas été indexées. Vous pouvez également en connaître la raison. Cela peut accélérer le processus, car vous n’avez pas à vérifier manuellement quelles pages sont désindexées.
3. Les extensions de navigateur
Il existe plusieurs extensions que vous pouvez installer sur votre navigateur web afin de vérifier l’état de n’importe quelle page sur internet.
Dans Chrome, les extensions comme Website SEO Checker ou SEO Minion ne sont que quelques exemples.
De même, dans Firefox, vous pouvez trouver l’extension SeoQuake, Detailed SEO Extension, SEO Minion, etc.
Comment désindexer une page de Google?
Parfois, vous vous rendez compte que votre site internet contient certaines pages qui devraient être exclues de l’index de recherche.
Il existe de multiples façons de supprimer une URL de Google. Mais les méthodes suivantes sont les plus faciles et les plus utilisées pour désindexer une page de Google.
- Supprimer la page
- Marquer comme noindex
- Utiliser une balise canonical pour les pages dupliquées
- Bloquer l’URL depuis la Google Search Console
1. Supprimer la page
Si vous n’avez plus besoin d’une page (comme dans le cas de pages piratées), vous pouvez simplement supprimer la page. Ce qui est d’ailleurs recommandé dans ce cas. Votre serveur renverra alors une erreur 404, et Google supprimera la page de son index avec le temps.
Il n’y a rien de plus facile que de supprimer une page de votre site internet. En effet, il suffit de repérer une page indexée mais sans intérêt et de la supprimer de votre site. C’est la meilleure façon de traiter les pages indexées dont vous ignorez l’existence.
Un exemple de cela peut être une page créée par erreur. Il s’agit d’une page de faible qualité et sans intérêt. Elle n’a aucun intérêt à être indexée dans Google, ni à exister sur votre site internet. De plus, il n’y a aucun avantage à la conserver, et elle ne fera que nuire à votre autorité et ralentir l’indexation des autres pages du site.
Lorsque vous supprimez la page, elle affichera par la suite une page d’erreur 404. Cette page sera supprimée de l’index de Google peu de temps après que le robot d’exploration l’ait crawlée de nouveau.
2. Marquer comme Noindex
Il se peut que vous ayez des pages que vous ne voulez pas supprimer, mais que vous ne voulez pas non plus qu’elles soient indexées. C’est généralement le cas des pages telles que la page de remerciement ou des pages non informatives.
Tout ce que vous voulez faire, c’est dire à Google, bien qu’il puisse explorer cette page, de ne pas l’indexer. Pour faire cela, vous pouvez utiliser la balise meta robots noindex.
La méthode la plus simple pour ajouter une balise Noindex lorsque vous êtes sur WordPress est d’utiliser un plugin SEO comme Rank Math ou Yoast SEO. Vous pourrez ensuite facilement en quelques clics ajouter une balise Noindex aux pages de votre choix.
Ensuite, les robots des moteurs de recherche supprimeront la page des résultats de recherche dès qu’ils l’auront parcouru à nouveau.
3. Utiliser une balise canonical pour les pages dupliquées
Il arrive parfois qu’un site ait des pages dupliquées. Il s’agit de pages qui apparaissent sur l’internet à plusieurs endroits – vous pouvez accéder au même contenu avec plusieurs URL.
Cela se produit généralement automatiquement, sans que vous le sachiez. Mais ça peut avoir un impact négatif sur votre SEO et vos classements dans les moteurs de recherche. En effet, une page dupliquée peut perturber le moteur de recherche et l’empêcher de classer correctement votre page.
Le moyen le plus simple de corriger le contenu dupliqué est d’utiliser une balise « rel=canonical ».
Pour cela, vous devez d’abord choisir la page que vous voulez afficher dans les SERP. Il s’agira de votre page principale. Vous devrez ensuite ajouter la balise rel=canonical à toutes les pages dupliquées.
La balise canonical indique aux moteurs de recherche que la page n’est qu’une copie de la page principale. Cela permettra de résoudre le problème du contenu dupliqué, de désindexer la page qui n’est qu’une copie et de classer vos pages correctement.
4. Bloquer l'URL depuis la Google Search Console
Cette méthode de désindexation ne doit être utilisée qu’en dernier recours.
Il s’agit d’une solution temporaire qui retire votre page de l’index de Google pendant un certain temps. Vous ne devez l’utiliser que dans les cas les plus extrêmes, comme les fuites de données, les problèmes de sécurité et d’autres situations similaires.
En général, la page est masquée très rapidement, en l’espace d’une journée.
Pour cela, Google Search Console fournit des instructions sur la manière de supprimer une page de l’index Google. Vous pouvez masquer temporairement des pages des résultats de recherche à l’aide de l’outil de suppression d’une URL.
Cependant, cette action n’est pas une suppression permanente de la page mais seulement une désindexation temporaire. Elle fonctionnera pendant environ six mois, puis vous devrez décider de l’action à entreprendre. Si votre page existe toujours, elle pourra de nouveau apparaître dans l’index de recherche de Google.
Pour conclure
Il existe de nombreuses situations dans lesquelles vous souhaitez désindexer une page de l’index de Google.
Par exemple, lorsque vous êtes confronté à un contenu dupliqué, à des pages inutiles pour la recherche ou à des pages indexées contenant des données personnelles sensibles.
Nous avons vu dans cet article comment désindexer une page sur Google de différentes manières et les bonnes pratiques à mettre en place concernant l’indexation.
Gardez à l’esprit qu’il n’existe pas d’approche unique, car chaque situation requiert une approche différente. Et si vous lisez entre les lignes, vous aurez remarqué que la plupart des situations dans lesquelles vous devez désindexer une page de Google peuvent en fait être évitées.