La question de cette semaine vient de Xaris, qui demande:
« Pourquoi, même si j’ai correctement composé et lié le plan du site au site Web d’un client, et que j’ai tout vérifié, ai-je des problèmes d’indexation avec certains articles, pas tous, même après des demandes répétées à Google et à Google Search Console. Quel pourrait être le problème? Je ne peux pas le comprendre. »
C’est loin d’être un problème unique; Nous l’avons tous vécu! « J’ai fait tout ce à quoi je peux penser, mais Google n’indexe toujours pas mes pages. »
N’est-ce certainement pas indexé?
Le tout premier aspect à vérifier est si la page n’est vraiment pas indexée, ou ne se classe pas bien.
Il se peut que la page n’apparaît pas indexée car vous ne pouvez pas la trouver pour ce que vous considérez les mots clés pertinents. Cependant, cela ne signifie pas qu’il n’est pas indexé.
Aux fins de cette question, je vais vous donner des conseils sur la façon de gérer les deux circonstances.
Quel pourrait être le problème?
Il existe de nombreuses raisons pour lesquelles une page peut ne pas être indexée ou bien classer sur Google. Discutons des principaux.
Problème technique
Il y a des raisons techniques, à la fois des erreurs et des décisions conscientes, qui pourraient empêcher Googlebot d’atteindre votre page et de l’indexer.
Bots bloqués dans robots.txt
Google doit être en mesure d’atteindre le contenu d’une page s’il veut comprendre la valeur de la page et, finalement, le servir de résultat de recherche pour les requêtes pertinentes.
Si Googlebot est empêché de visiter ces pages via Robots.txt, cela pourrait expliquer pourquoi il ne les indexent pas.
Il peut techniquement indexer une page à laquelle il ne peut pas accéder, mais il ne pourra pas déterminer le contenu de la page et devra donc utiliser des signaux externes comme les backlinks pour déterminer sa pertinence.
S’il ne peut pas ramper sur la page, même s’il sait qu’il existe via le plan du site, cela le rendra peu susceptible de se classer.
La page ne peut pas être rendue
De la même manière, si le bot peut ramper la page mais qu’il ne peut pas rendre le contenu, il pourrait choisir de ne pas l’indexer. Il est certainement peu probable qu’il classera la page bien car il ne pourra pas lire le contenu de la page.
La page a une balise sans indice
Un problème évident, mais souvent négligé, est qu’une balise NOINDEX a été appliquée à la page. Cela demandera littéralement à Googlebot de ne pas indexer la page.
Il s’agit d’une directive, c’est-à-dire quelque chose que Googlebot s’engage à adopter.
Blocage de bot au niveau du serveur
Il pourrait y avoir un problème au niveau de votre serveur qui empêche Googlebot de ramper votre page Web.
Il peut bien y avoir eu des règles définies au niveau de votre serveur ou CDN qui empêchent Googlebot de ramper à nouveau votre site et de découvrir ces nouvelles pages.
C’est quelque chose qui peut être un problème assez courant lorsque les équipes qui ne connaissent pas bien le référencement sont responsables de la maintenance technique d’un site Web.
Codes de réponse du serveur non 200
Les pages que vous avez ajoutées au site du site peuvent bien renvoyer un code d’état du serveur qui confond Googlebot.
Par exemple, si une page renvoie un code 4xx, bien que vous puissiez voir le contenu sur la page, Googlebot peut décider qu’il n’est pas une page en direct et ne l’indexera pas.
Page de chargement lent
Il se pourrait que vos pages Web se chargent très lentement. En conséquence, la perception de leur qualité peut être diminuée.
Il se pourrait également qu’ils prennent tellement de temps à charger que les robots doivent prioriser les pages qu’ils rampent tellement que vos pages plus récentes ne sont pas rampées.
Qualité de la page
Il y a également des problèmes avec le contenu du site Web lui-même qui pourrait empêcher une page d’être indexée.
Liens internes faibles suggérant une page de faible valeur
L’une des façons dont Google déterminera si une page vaut la peine d’être classée via les liens internes le pointant vers lui. Les liens entre les pages de votre site Web peuvent tous deux signifier le contenu de la page lié, mais aussi si la page est une partie importante de votre site. Une page qui a peu de liens internes peut ne pas sembler suffisamment précieuse pour bien se classer.
Les pages n’ajoutent pas de valeur
L’une des principales raisons pour lesquelles une page n’est pas indexée par Google est qu’elle n’est pas perçue comme de qualité suffisante.
Google ne rampera pas et n’indexera pas chaque page qu’il pourrait. Google privilégiera le contenu unique et engageant.
Si vos pages sont minces ou n’ajoutent pas vraiment de valeur à Internet, elles peuvent ne pas être indexées même si elles pourraient l’être techniquement.
Ce sont des doublons ou des doublons proches
De la même manière, si Google perçoit que vos pages sont exactes ou très proches des versions en double des pages existantes, cela pourrait bien ne pas indexer vos nouveaux.
Même si vous avez signalé que la page est unique en l’incluant dans votre plan du site XML, et en utilisant une balise canonique auto-référencée, Google fera toujours sa propre évaluation quant à savoir si une page vaut la peine d’être indexée.
Action manuelle
Il est également possible que votre page Web ait été soumise à une action manuelle, et c’est pourquoi Google ne l’indexte pas.
Par exemple, si les pages que vous essayez d’indexer Google sont ce qu’elle considère comme des «pages d’affiliation minces», vous ne pourrez peut-être pas les classer en raison d’une pénalité manuelle.
Les actions manuelles sont relativement rares et affectent généralement les zones de site plus larges, mais cela vaut la peine de vérifier le rapport sur les actions manuelles de la console de recherche pour exclure cela.
Identifier le problème
Savoir quelle pourrait être la cause de votre problème n’est que la moitié de la bataille. Voyons comment vous pourriez potentiellement réduire le problème, puis comment vous pouvez le résoudre.
Vérifiez les outils de webmaster Bing
Ma première suggestion est de vérifier si votre page est indexée dans Bing.
Vous ne vous concentrez peut-être pas beaucoup sur Bing dans votre stratégie de référencement, mais c’est un moyen rapide de déterminer s’il s’agit d’un problème axé sur Google, comme une action manuelle ou des classements médiocres, plutôt que quelque chose sur votre site qui empêche la page d’être indexé.
Aller à Outils de webmaster Bing et entrez la page dans son outil d’inspection URL. De là, vous verrez si Bing index la page ou non. Si c’est le cas, vous savez que c’est quelque chose qui n’affecte que Google.
Vérifiez le rapport «Page» de Google Search Console
Ensuite, accédez à Google Search Console. Inspectez la page et voyez si elle est vraiment marquée comme non indexée. S’il n’est pas indexé, Google devrait expliquer pourquoi.
Par exemple, il se pourrait que la page soit:
Exclu par «noindex»
Si Google détecte une balise NOINDEX sur la page, elle ne l’indexera pas. Dans le cadre des résultats de l’outil d’inspection URL, il vous dira que «la page n’est pas indexée: exclue par tag« noindex »»
Si c’est le résultat que vous obtenez pour vos pages, votre prochaine étape sera de supprimer la balise NOINDEX et de soumettre à nouveau la page à ramper par Googlebot.
Découvert – actuellement non indexé
L’outil d’inspection peut vous dire que «la page n’est pas indexée: actuellement non indexée».
Si tel est le cas, vous savez avec certitude qu’il s’agit d’un problème d’indexation, et non d’un problème avec les mauvais classements, c’est-à-dire que votre page apparaît dans la recherche Google.
Google explique qu’une URL apparaissant comme «découverte – actuellement non indexée» est:
« La page a été trouvée par Google, mais pas encore rampée. En règle générale, Google voulait ramper l’URL, mais cela devait surcharger le site; donc Google a reprogrammé la rampe. C’est pourquoi la dernière date d’exploration est vide sur le rapport. »
Si vous voyez ce statut, il y a de fortes chances que Google ait examiné d’autres pages sur votre site Web et les considérées comme ne valant pas la peine d’ajouter à l’indice, et en tant que tel, ne dépense pas des ressources qui rampent ces autres pages dont il est conscient car elle s’attend à ce qu’elles soient de plus faible qualité.
Pour résoudre ce problème, vous devez signifier la qualité et la pertinence d’une page pour Googlebot. Il est temps de jeter un aperçu critique de votre site Web et d’identifier s’il y a des raisons pour lesquelles Google peut considérer vos pages comme de mauvaise qualité.
Pour plus de détails sur la façon d’améliorer une page, lisez mon article précédent: «Pourquoi mes pages sont-elles découvertes mais pas indexées?»
Rampé – actuellement non indexé
Si votre page inspectée renvoie un statut de «rampé – actuellement non indexé», cela signifie que Google est au courant de la page, l’a rampé, mais ne voit pas de valeur en l’ajoutant à l’index.
Si vous obtenez ce code d’état, vous êtes mieux à la recherche de moyens d’améliorer la qualité de la page.
Duplicate, Google a choisi un canonical différent de celui de l’utilisateur
Vous pouvez voir une alerte pour la page que vous avez inspectée, qui vous indique que cette page est un « en double, Google a choisi un canonical différent de l’utilisateur ».
Cela signifie qu’il considère l’URL comme un double double d’une page existante, et qu’il choisit l’autre page à afficher dans les SERP au lieu de la page inspectée, bien que vous ayez correctement défini une balise canonique.
La façon d’encourager Google à afficher les deux pages dans les SERP est de s’assurer qu’ils sont uniques, ont un contenu suffisant pour être utile aux lecteurs.
Essentiellement, vous devez donner à Google une raison d’indexer les deux pages.
Résoudre les problèmes
Bien que vos pages puissent ne pas être indexées pour une ou plusieurs raisons, les correctifs sont tous assez similaires.
Il est probable qu’il existe un problème technique avec le site, comme une balise canonique errante ou un bloc Robots.txt, qui a empêché la rampe et l’indexation correctes d’une page.
Ou, il y a un problème avec la qualité de la page, ce qui fait que Google ne le considère pas comme suffisamment précieux pour être indexé.
Commencez par examiner les causes techniques potentielles. Ceux-ci vous aideront à vous identifier rapidement s’il s’agit d’un correctif «rapide» que vous ou vos développeurs pouvez modifier.
Une fois que vous avez exclu les problèmes techniques, vous envisagez probablement des problèmes de qualité.
Selon ce que vous pensez maintenant, la page n’apparaît pas dans les SERP, il se peut que la page elle-même ait des problèmes de qualité, ou une plus grande partie de votre site Web.
Si c’est le premier, considérez l’unicité de la page dans la portée d’Internet et comment vous pouvez signifier l’importance de la page, par exemple par le biais de backlinks pertinents.
S’il s’agit de ce dernier, vous souhaiterez peut-être exécuter un audit de contenu pour vous aider à réduire les moyens d’améliorer la perception globale de la qualité sur votre site Web.
Résumé
Il y aura un peu d’enquête nécessaire pour identifier si votre page n’est vraiment pas indexée, ou si Google choisit simplement de ne pas le classer hautement pour les requêtes que vous jugez pertinentes.
Une fois que vous avez identifié cela, vous pouvez commencer à vous rapprocher de savoir s’il s’agit d’un problème technique ou de qualité qui affecte vos pages.
Il s’agit d’un problème frustrant à avoir, mais les correctifs sont assez logiques, et l’enquête devrait, espérons-le, plus de moyens d’améliorer le rampage et l’indexation de votre site.
Plus de ressources:
Image feadée: Paulo Bobita / Recherd Engine Journal

Commentaires