Lorsque ChatGPT Search crée une réponse, il peut générer des requêtes Web en arrière-plan pour trouver des sources. Un nouveau rapport de la société d’analyse de recherche IA Peec AI a constaté qu’une grande partie de ces requêtes en arrière-plan s’exécutent en anglais, même lorsque l’invite d’origine était dans une autre langue.
Peec AI a analysé plus de 10 millions d’invites et 20 millions de requêtes de diffusion à partir des données de sa plateforme. Sur l’ensemble des invites non anglophones analysées, la société rapporte que 43 % des étapes de diffusion ont été effectuées en anglais.
Que sont les requêtes de diffusion
OpenAI Documentation de recherche ChatGPT décrit les requêtes de diffusion. Lorsqu’un utilisateur pose une question, ChatGPT Search « réécrit généralement votre requête en une ou plusieurs requêtes ciblées » et les envoie aux partenaires de recherche. Après avoir examiné les premiers résultats, « La recherche ChatGPT peut envoyer des requêtes supplémentaires et plus spécifiques à d’autres fournisseurs de recherche. »
Peec AI fait référence à ces sous-requêtes réécrites comme des « fan-outs ». Le rapport de la société a suivi les langues utilisées par ChatGPT lors de leur génération.
La documentation d’OpenAI ne décrit pas comment la langue est choisie pour les requêtes réécrites.
Ce que Peec AI a trouvé
Peec AI a filtré ses données pour inclure uniquement les cas où l’emplacement IP correspondait à la langue de l’invite. Invites en polonais provenant d’adresses IP polonaises, invites en allemand à partir d’adresses IP allemandes et invites en espagnol à partir d’adresses IP espagnoles. Les signaux mixtes, tels que les invites en allemand provenant d’adresses IP britanniques, ont été exclus.
Les données filtrées ont montré que 78 % des exécutions d’invites dans des langues autres que l’anglais incluaient au moins une requête de diffusion en anglais.
Les invites en langue turque incluaient le plus souvent des diffusions en anglais, à 94 %. Les invites en espagnol étaient les plus faibles, à 66 %. Aucune langue autre que l’anglais dans l’ensemble de données de Peec AI n’est tombée en dessous de 60 %.
Les données de Peec AI ont montré une tendance cohérente dans toutes les langues. ChatGPT démarre généralement ses requêtes de diffusion dans la langue de l’invite, puis ajoute des requêtes en anglais au fur et à mesure qu’il crée la réponse.
Exemples tirés du rapport
Le billet de blog de Peec AI comprenait plusieurs exemples montrant comment ce modèle peut se dérouler dans la pratique.
Lorsqu’une adresse IP polonaise lui demande en polonais quels sont les meilleurs portails d’enchères, ChatGPT est soit omis, soit enterré. Allegro.pl en faveur d’eBay et d’autres plateformes mondiales. Peec AI décrit Allegro comme la plateforme de commerce électronique dominante en Pologne.
Interrogé en allemand sur les sociétés de logiciels allemandes, Peec AI a indiqué que la réponse ne mentionnait aucune société allemande. Lorsqu’on leur a demandé en espagnol des marques de cosmétiques, aucune marque espagnole n’est apparue.
Dans l’exemple des cosmétiques espagnols, Peec AI a montré les requêtes de diffusion réelles de ChatGPT. Le premier était en anglais. Le second était en espagnol mais ajoutait le mot « globales » (global), un qualificatif que l’invite d’origine n’avait jamais utilisé. Le système semble avoir interprété une invite en espagnol provenant d’une adresse IP espagnole comme une demande de marques mondiales.
Il s’agit d’exemples individuels issus des tests de Peec AI, pas nécessairement représentatifs de tous les comportements de recherche ChatGPT.
Pourquoi c’est important
Les équipes de référencement et de contenu opérant sur des marchés non anglophones peuvent être confrontées à un désavantage dans la sélection des sources de ChatGPT, qui peut ne pas correspondre clairement aux signaux de classement traditionnels. Dans les exemples de Peec AI, les requêtes de diffusion en anglais ont fait apparaître des sources en anglais qui favorisaient les marques mondiales par rapport aux concurrents locaux.
Nous couvrons les modèles de citation de ChatGPT depuis plus d’un an maintenant, du rapport de SE Ranking sur les facteurs de citation aux résultats de précision d’attribution du Tow Center. Ces rapports antérieurs montraient quels signaux prédisent si une source est citée. Les données de Peec AI suggèrent que le langage de la requête en arrière-plan peut filtrer quelles sources sont même prises en compte, avant que les signaux de citation n’entrent en jeu.
Notes méthodologiques
Peec AI est un fournisseur dans le domaine de l’analyse de recherche IA. La société documentation décrit sa méthode de collecte de données comme l’exécution quotidienne d’invites définies par le client via l’automatisation du navigateur, en interagissant avec les plates-formes d’IA via leurs interfaces Web plutôt que par des API. Les 10 millions d’invites contenues dans ce rapport provenaient de la plate-forme Peec AI, et non d’un panel de sessions ChatGPT grand public.
Le rapport ne détaille pas la composition de ces invites, les catégories ou les secteurs qu’elles couvrent, ni dans quelle mesure elles sont représentatives des modèles d’utilisation plus larges de ChatGPT.
Tomek Rudzki, l’auteur du rapport, est présenté par Peec AI comme « GEO Expert » sur son blog. Il est un praticien technique du référencement bien connu qui a pris la parole à BrightonSEO et SMX Munich et a contribué à des publications telles que Moz.
Regarder vers l’avenir
Les documents publics ChatGPT Search d’OpenAI décrivent la réécriture des requêtes et les requêtes de suivi, mais n’expliquent pas comment la langue est choisie pour ces requêtes. On ne sait pas encore si le modèle de diffusion anglais identifié par Peec AI est un choix de conception intentionnel ou un comportement émergent du système.
Le rapport soulève une question qui mérite d’être surveillée. La création de contenu en anglais fera-t-elle partie des stratégies d’optimisation de la recherche IA, ou les plateformes de recherche IA ajusteront-elles leur sélection de sources pour mieux refléter les marchés locaux ?
Image en vedette : arda savasciogullari/Shutterstock

Commentaires