L’outil Sources préférées de Google est destiné à permettre aux fans de certains sites Web de dire à Google qu’ils souhaitent voir davantage de leurs sites préférés dans la fonctionnalité Top News. Cependant, Google découvre des sites de spam copiés, des sites aléatoires et des domaines parqués. Certains des sites apparaissant dans l’outil sont de si mauvaise qualité que seules leurs pages d’accueil sont indexées. Cet outil ne devrait-il pas afficher uniquement les sites Web légitimes et non le spam ?
Sources préférées de Google
La fonctionnalité Sources préférées de Google permet aux utilisateurs de contrôler quels médias apparaissent le plus souvent dans la fonctionnalité Top Stories de Google. Plutôt que de s’appuyer uniquement sur le système de classement de Google, les utilisateurs peuvent faire apparaître plus fréquemment leurs sources d’information préférées. Ce changement n’empêche pas l’apparition d’autres sites, il personnalise uniquement ce qu’un utilisateur voit pour refléter les sources choisies. Les sources préférées permettent aux utilisateurs d’avoir plus de contrôle sur les sources d’information qui apparaissent le plus souvent.
Domaines similaires dans les sources préférées
Ce qui semble se produire, c’est que les gens enregistrent des domaines similaires à ceux de sites Web bien connus. Une façon de procéder consiste à squatter un domaine sur une correspondance exacte avec un nom de domaine utilisant un TLD différent. Par exemple, lorsqu’un nom de domaine populaire est enregistré avec un .com ou un .net, les squatteurs de domaine enregistreront le même nom de domaine en utilisant un nom de domaine .com.in ou .net.in.
Capture d’écran d’un classement de sous-domaine aléatoire pour Automattic

Erreurs de sources préférées
Il n’est pas clair si les gens enregistrent des noms de domaine et les ajoutent à l’outil Sources préférées ou s’ils sont ajoutés d’une manière différente. Une recherche d’un outil de référencement populaire fait apparaître le domaine correct, mais également un domaine parqué dans le ccTLD indien .com.in :
Capture d’écran d’un domaine stationné indien

Ce que l’on sait, c’est que les gens enregistrent des domaines copiés, mais la manière dont ils accèdent à l’outil Sources préférées de Google n’est pas bien connue. Preferred Sources est actuellement disponible aux États-Unis et en Inde, ce qui peut expliquer l’apparition de domaines indiens dans l’outil.
Capture d’écran du domaine parqué indien du NYTimes

Par exemple, une recherche dans l’outil Sources préférées du Huffpost fait apparaître un site copié sur un domaine de niveau code de pays indien.
Capture d’écran du HuffPost dans les préférences source

Ce site indien du Huffpost propose des articles (et des liens) sur des sujets tels que les prêts sur salaire, les avocats spécialisés en dommages corporels et les montres de luxe. Sans surprise, il ne semble pas que Google indexe davantage que la page d’accueil de ce site.
Capture d’écran d’une recherche sur un site

Il existe également un site indien qui squatte le nom de domaine du Search Engine Journal.
Capture d’écran de SEJ dans l’outil de préférences source

Que se passe-t-il?
Il est possible que les référenceurs enregistrent des domaines copiés et soumettent ensuite leurs domaines au Outil Sources préférées. Ou il se pourrait que Google les récupère automatiquement et répertorie simplement tout ce qui existe.

Commentaires