IA et part de voix : pourquoi cette métrique vient de s'effondrer et ce qu'il faut mesurer à la place
Je vais être direct, parce que la situation l’exige : si vous présentez encore à votre direction un score de « part de voix IA » sous forme de pourcentage bien net, vous montrez un chiffre qui ne repose sur rien de vérifiable. Ce n’est pas une opinion de plus dans le débat sur le référencement génératif. C’est devenu mesurable, et un évènement précis l’a rendu impossible à ignorer : en septembre 2025, la mise à jour du modèle de ChatGPT a fait chuter d’un coup les indicateurs de visibilité de quantité d’entreprises, sans qu’aucune d’elles n’ait rien changé à sa stratégie. Voilà le signal d’alerte. Si une simple modification de modèle peut effacer votre « visibilité » du jour au lendemain, c’est que cette visibilité n’en était pas une. Dans les lignes qui suivent, je vous explique ce qui a réellement basculé, pourquoi la part de voix appliquée aux moteurs conversationnels est un mirage statistique, et quels sont les trois indicateurs que je suis désormais à la place.
Ce qui vient de se casser, et pourquoi maintenant
La part de voix classique reposait sur un accord tacite : tout le monde savait sur quoi on mesurait. Pendant des années, un responsable marketing définissait une liste fixe de mots clés, suivait sa position face aux concurrents sur cette liste, et utilisait cet ensemble comme dénominateur stable. La méthode avait ses défauts, mais ses limites étaient affichées. Chacun comprenait le périmètre de la mesure et pouvait en discuter les frontières. C’était imparfait, mais honnête.
Ce modèle n’existe tout simplement plus. Les pages de résultats ne sont plus des objets stables : elles sont devenues des paysages mouvants, personnalisés, recomposés en continu selon le profil de chaque internaute et le contexte du moment. Entre les résumés générés par l’intelligence artificielle, les résultats localisés, le défilement infini, les grilles marchandes interactives et les fils sociaux en temps réel, deux personnes qui tapent exactement la même requête au même instant ne verront pas le même écran. À partir de là, calculer une « part » précise de cet écran devient une impossibilité mathématique, pas une difficulté technique que l’on finira par résoudre.
L’alerte de septembre 2025 a cristallisé tout cela. Lorsque OpenAI a fait évoluer le modèle derrière ChatGPT, le volume global de citations et de liens sortants présentés aux utilisateurs a nettement reculé sur l’ensemble de la plateforme. Pour toutes les équipes branchées sur un tableau de bord de suivi génératif, cela s’est traduit par une dégringolade brutale des chiffres de visibilité. Or aucune marque n’avait perdu en pertinence. Aucune campagne n’avait échoué. Le moteur avait simplement changé sa façon de montrer ses sources. Voilà la leçon qu’il faut retenir aujourd’hui : ces métriques sont volatiles et largement hors de votre contrôle, parce qu’elles dépendent d’une décision de produit qui peut tomber sans préavis.
Le mirage du dénominateur caché
Le cœur du problème tient en un mot : le dénominateur. Pour qu’un pourcentage veuille dire quelque chose, il faut savoir sur quel total on le calcule. Les outils de référencement d’hier reposaient sur une liste de requêtes définie par l’utilisateur, donc transparente. Si un système annonçait une visibilité de 12 %, vous pouviez ouvrir la liste, l’auditer, l’ajuster, contester son contenu. Le total était sous vos yeux.
Les moteurs conversationnels imposent une réalité mathématique entièrement différente. L’univers des requêtes possibles y est, à toutes fins pratiques, infini. Les gens ne cherchent plus avec des expressions de deux mots. Ils formulent des demandes longues, précises, qui décrivent leur contexte exact, leurs contraintes d’intégration, leurs besoins fonctionnels, parfois en plusieurs phrases qui s’enchaînent au fil de la conversation. Aucun outil ne peut échantillonner sérieusement cet océan de langage naturel. Personne ne le peut.
Alors que font les éditeurs de logiciels ? Faute de mieux, ils choisissent un petit sous-ensemble arbitraire de requêtes figées, les font tourner en coulisses dans les modèles, puis agrègent ces quelques sorties en un pourcentage présenté comme une vérité globale. Le résultat ressemble à une mesure de part de voix, mais il ne mesure la visibilité qu’à l’intérieur d’un environnement fabriqué de toutes pièces. On vous présente un bac à sable fermé comme s’il s’agissait du web ouvert. Et c’est là que le bât blesse vraiment : ce dénominateur, contrairement à celui d’hier, est enfermé dans une boîte noire propriétaire, presque certainement incomplet, et impossible à auditer. Vous ne savez pas sur quelles requêtes on vous note, ni pourquoi, ni si elles ressemblent de près ou de loin à ce que cherchent vos clients réels.
Je ne dis pas que les éditeurs agissent de mauvaise foi. La plupart s’attaquent honnêtement à un problème d’ingénierie redoutable. Mais la méthode ne peut pas soutenir le niveau de certitude que suggèrent ces tableaux de bord aux pourcentages bien lissés. Ces chiffres doivent être traités comme des signaux directionnels, jamais comme des données dures sur lesquelles arbitrer un budget.
La volatilité est devenue la norme, pas l’exception
Le réflexe ancien consistait à viser la première position et à en déduire un trafic prévisible. Dans le modèle d’avant, décrocher la place numéro un revenait à capter un pourcentage assez stable de clics. La relation entre rang et audience était connue, presque comptable. On savait ce qu’une position valait.
Ce lien s’est dissous. Aujourd’hui, être premier en organique peut signifier se retrouver sous plusieurs annonces sponsorisées, sous un résumé généré par l’intelligence artificielle, sous des accordéons de questions interactives et sous des discussions issues de plateformes communautaires. La position « une » existe toujours sur le papier, mais elle ne garantit plus la visibilité qu’elle garantissait. Et comme les moteurs assemblent leurs mises en page à la volée, en réponse à l’intention immédiate et à l’historique de chaque internaute, le classement fluctue d’heure en heure pour une même requête.
Mesurer une part de voix sur des positions figées dans ce contexte, c’est comme vouloir mesurer le volume d’une vague avec une règle en bois. L’instrument suppose une stabilité qui n’existe plus dans l’objet mesuré. C’est pour cette raison que je refuse désormais de bâtir une recommandation stratégique sur un classement instantané : il décrit un état qui aura déjà changé au moment où je clique sur « exporter ». La bonne posture n’est pas de chercher un meilleur thermomètre pour une fièvre qui change de nature toutes les heures. C’est de changer ce qu’on observe.
Trois indicateurs qui comptent davantage
Le glissement de fond, c’est de cesser de mesurer un volume de présence pour mesurer une qualité d’intégration. Dans un environnement de découverte conversationnelle, la visibilité d’une marque ne se définit plus par les mots clés qu’elle « possède », mais par la profondeur avec laquelle elle est ancrée dans les représentations que les modèles mobilisent pour répondre. Voici les trois indicateurs que je suis aujourd’hui, et que je vous invite à adopter avant la prochaine secousse de modèle.
Premier indicateur : la présence dans les corpus de référence. Plutôt que de demander à un outil quel pourcentage de réponses me cite, je regarde si ma marque, mes contenus et mes prises de position figurent dans les sources que les modèles considèrent comme faisant autorité sur un sujet. Documentation technique, encyclopédies collaboratives, forums spécialisés, publications reconnues du secteur : c’est ce substrat que les modèles ont digéré pendant leur entraînement et qu’ils continuent de consulter. Une marque absente de ce socle restera structurellement invisible, quel que soit le pourcentage affiché ailleurs. Cet indicateur a un avantage décisif : il est auditable. Vous pouvez vérifier vous même votre présence, page par page.
Deuxième indicateur : la cohérence de la représentation. Je pose la même question de fond à plusieurs moteurs, sous plusieurs formulations, et j’observe si la façon dont ils décrivent ma marque, mon domaine d’expertise et mon positionnement reste stable et exacte. Ce qui m’intéresse n’est pas d’apparaître plus souvent, mais d’être décrit correctement et de manière constante. Une représentation cohérente signale que le concept associé à votre marque est solidement installé dans le modèle. Une représentation flottante, contradictoire d’un moteur à l’autre, révèle un ancrage fragile qu’aucun score global ne vous signalera.
Troisième indicateur : la traçabilité des recommandations vers l’action réelle. Plutôt que de courir après un pourcentage de citations, je cherche à savoir si les conversations avec une intelligence artificielle débouchent réellement sur une visite, une demande, un acte concret du côté de mon audience. C’est plus modeste, moins flatteur dans une présentation, mais c’est mesurable de votre côté, donc à l’abri d’un changement de modèle décidé ailleurs. Un indicateur que vous maîtrisez vaut mieux qu’un indicateur impressionnant que le fournisseur peut faire évoluer sans vous prévenir. C’est exactement la fragilité que septembre 2025 a mise en pleine lumière.
FAQ
La part de voix IA est-elle complètement inutile ? Non, et je veux être nuancé. Elle garde une valeur de signal directionnel : si votre score s’effondre ou progresse fortement sur plusieurs semaines, cela mérite qu’on regarde pourquoi. Le problème surgit quand on traite ce pourcentage comme une donnée dure, qu’on l’inscrit dans un tableau de bord de direction et qu’on arbitre un budget dessus. Le chiffre repose sur un échantillon arbitraire de requêtes enfermé dans une boîte noire. Lisez la tendance, jamais la valeur absolue.
Que s’est-il vraiment passé en septembre 2025 ? La mise à jour du modèle derrière ChatGPT a réduit le volume de citations et de liens sortants présentés aux utilisateurs sur l’ensemble de la plateforme. Mécaniquement, les tableaux de bord de suivi génératif ont enregistré une chute brutale de visibilité pour de nombreuses marques. Aucune de ces marques n’avait perdu en pertinence : le moteur avait simplement modifié sa façon d’afficher ses sources. C’est la démonstration la plus claire que ces métriques sont volatiles et dépendent de décisions sur lesquelles vous n’avez aucune prise.
Par où commencer concrètement si je veux changer de méthode ? Commencez par l’indicateur le plus auditable : votre présence dans les sources de référence de votre secteur. Recensez les contenus, documentations et discussions reconnus comme faisant autorité, puis vérifiez si votre marque y figure et de quelle manière. Posez ensuite quelques questions de fond à plusieurs moteurs et notez si la description de votre expertise reste stable et exacte. Vous obtiendrez une image plus lente à bouger, mais bien plus fiable qu’un pourcentage recalculé chaque nuit.
Ce qui me frappe, en regardant l’épisode de l’automne 2025, c’est qu’il ne s’agit pas d’un accident isolé mais d’un avant goût. Tant que notre lecture de la visibilité reposera sur des chiffres que nous ne pouvons ni auditer ni reproduire, nous resterons à la merci de la prochaine mise à jour de modèle. La vraie bascule n’est pas de trouver un meilleur score : c’est d’accepter que, dans un univers de requêtes infini, la précision affichée d’un pourcentage est presque toujours une illusion de confort. Mieux vaut une mesure modeste que vous maîtrisez qu’une certitude empruntée à une boîte noire. La question que je laisse ouverte est celle ci : et si la maturité, en référencement génératif, consistait justement à renoncer aux faux chiffres rassurants pour assumer des signaux plus honnêtes, plus lents, mais réellement les nôtres ?