21 mai 2024 | Blog, Blog 2024, Communication, Marketing | Par Christophe Lachnitt
Trois tendances lourdes pour les marques mises en exergue par les récentes annonces de Google et OpenAI
L’intelligence artificielle générative progresse à pas de géants vers davantage d’intermédiation entre marques et audiences, d’interactions vocales avec celles-ci et de traitement – en entrée et sortie – des émotions.
Un nouveau degré d’intermédiation
Les chatbots (robots conversationnels), tels que ChatGPT, Claude (désormais accessible en Europe), Google Gemini, Le Chat Mistral, Meta AI (pas encore disponible en Europe sans VPN), Microsoft Copilot ou Perplexity, fournissent à leurs utilisateurs des synthèses personnalisées en réponse à leurs questions. Dans l’écrasante majorité des cas, ces synthèses, sous la forme de quelques paragraphes, occultent leurs sources, qu’elles soient des médias ou des marques : elles ne fournissent pas les liens vers celles-ci que Bing, DuckDuckGo ou Google Search présentent. C’est donc une intermédiation qui s’apparente à une censure à laquelle les chatbots s’adonnent : elles neutralisent mêmement médias et marques. Même lorsque ces intelligences artificielles génératives fournissent des liens vers leurs sources, comme c’est le cas de Perplexity et va l’être des “AI Overviews” (ex-Search Generative Experience) de Google, ils sont beaucoup moins intéressants que dans des moteurs de recherche classiques étant donné que les contenus associés à ces liens sont résumés dans les synthèses dont ils relèvent. Comme le professe Google dans le tout-nouveau slogan de ses “AI Overviews” (“Let Google Do the Googling for You”), lequel en dit certainement plus qu’il ne le devrait, le Groupe fait désormais le travail de recherche et synthèse à notre place : il n’est donc pas nécessaire de regarder les contenus accessibles derrière les liens qu’il nous fournit.
Incidemment, cette neutralisation est porteuse d’un nouveau risque pour le groupe de Mountain View : en donnant une réponse à une question et non plus une liste de liens bleus, il assume de mécontenter ses utilisateurs sur des sujets qui leur tiennent à coeur et d’être perçu par les régulateurs non plus comme une plate-forme mais comme un éditeur responsable de ce qu’il publie. Cette réforme de la recherche en ligne pourrait donc susciter de riches débats sur la disposition légale américaine dite de la Section 230 qui exonère les plates-formes numériques de toute responsabilité sur les contenus qu’elles hébergent. L’impossibilité, même pour leurs créateurs, de comprendre comment le coeur des intelligences artificielles génératives fonctionne promet de compliquer ces délibérations.
Plus globalement, c’est une nouvelle lutte pour l’attention qui s’engage entre les grandes plates-formes numériques. En effet, l’intermédiation mise en oeuvre par les chatbots leur permet de conserver les internautes dans un domaine fermé plutôt que de les envoyer s’ébrouer dans l’Internet ouvert comme le font les moteurs de recherche classiques et les médias sociaux. Ce n’est pas par hasard que la nouvelle version de Google Search (voir la vidéo reproduite ci-dessous) adopte la formule des synthèses personnalisées à la chatbot et que Meta a placé son chatbot Meta AI – fondé sur son modèle open source Llama 3 – dans le champ de recherche de ses applications. Pour les deux groupes, il s’agit de maintenir leurs utilisateurs dans leurs “jardins clos” (“walled gardens”) respectifs. Dans cette approche1, le web, qui était une fin en soi jusqu’à présent, devient une donnée d’entrée pour des services fournis indépendamment de lui. L’Internet ouvert se trouve donc en concurrence avec une nouvelle vision féodale de l’univers numérique : des domaines visant à une forme d’autonomie informationnelle et applicative. Ce n’est certes pas une ambition nouvelle, notamment de la part de Facebook et Google, mais l’intelligence artificielle générative lui confère une telle différence de degré qu’elle induit une différence de nature. Cette évolution va rendre l’émergence des marques plus difficile – et coûteuse – encore.
Gartner prédit d’ailleurs que le trafic redirigé par les moteurs de recherche vers les sites Internet va chuter de 25% d’ici 2026. Or 68% du trafic Internet provient des moteurs de recherche, ce qui en fait les premiers pourvoyeurs de vues pour les sites web devant les bannières et les médias sociaux. Cette perte de trafic sera naturellement variable d’un site à l’autre mais certains vont subir une réelle hémorragie de leur audience. Il me semble que les sites de niche qui se rémunéreront sur abonnement s’en sortiront le mieux, s’ils arrivent à se protéger des incursions des grandes faucheuses de contenus des modèles d’intelligence artificielle générative.
Le phagocytage du trafic par ces applications va créer deux types de problèmes.
Du côté des médias, les intelligences artificielles génératives pourraient manquer, à la longue, de nouveaux contenus à synthétiser sur certains sujets lorsqu’elles auront asséché financièrement les sites qui les produisent, ce qui finirait d’ailleurs par affaiblir lesdits chatbots et le nouveau Google Search enrichi des “AI Overviews”. Cela risquerait également d’affaiblir Google financièrement car le Groupe garnit en publicités d’innombrables sites web menacés par cette perte de trafic.
Plus notablement, le risque pour l’information et, partant, la démocratie est considérable. A cet égard, je considère que les accords de licence de contenus conclus par certains médias, dont Le Monde en France, avec des créateurs de chatbots ne sont pas judicieux. Ils sont à mon sens le pendant court-termiste de la mise à disposition gratuite sur Internet de leurs contenus au début de la révolution numérique : le point commun est la captation de revenus immédiatement disponibles (la publicité en ligne censément dans le premier cas, les subsides des créateurs de chatbots dans le second) au détriment des revenus plus importants collectables sur le long terme. De fait, si les chatbots bénéficient des contenus des médias d’actualité, quel sera l’intérêt, pour les internautes, de visiter les sites de ces derniers ? C’est un enjeu d’autant plus conséquent que l’impact de l’éloignement de Meta des thématiques d’actualité est fort : le trafic de redirection de Facebook vers un groupe-échantillon de près de 800 éditeurs de presse a diminué de moitié en 12 mois. Ce sont autant de vues, et donc de potentiel publicitaire, en moins.
Quant aux marques, elles risquent de manquer de terrains de diffusion et d’activation de leur contenus. L’intermédiation effectuée par les chatbots n’en sera alors que plus dangereuse encore pour leur faculté à engager et convaincre leurs parties prenantes, l’attention de celles-ci s’éloignant des pages web qui ont constitué l’unité nucléaire de contenus (textes, images, vidéos…) depuis bientôt quarante ans. Dès lors, leurs médias détenus, au premier rang desquels les sites Internet/applications mobiles (qui vont devoir adopter une approche conversationnelle personnalisée) et newsletters, et la capacité d’influencer ces chatbots – une nouvelle discipline de l’Artificial Intelligence Optimization (AIO) va compléter le SEO – joueront un rôle toujours plus important.
Les marques devront aussi se reposer sur les vecteurs de monétisation publicitaires que les créateurs de chatbots mettront en place. Il est évident, à cet égard, que Google ne va pas tuer sa poule aux oeufs d’or mais la faire muter. Il est également clair, quand on regarde les vidéos du Groupe (voir par exemple celle reproduite ci-dessus), que son objectif est de fonder son prochain modèle publicitaire sur la personnalisation des réponses apportées dans le cadre des “AI Overviews”. Reniant son engagement initial, Perplexity va être le premier chatbot à monétiser son activité générative avec une offre publicitaire qui sera lancée cette année. Perplexity utilise une intelligence artificielle générative pour répondre aux questions de ses utilisateurs en se fondant sur des sources Internet qu’il intègre dans ses réponses. Il suggère également des questions connexes que ses utilisateurs pourraient vouloir lui poser : ce sont ces interrogations, qui représentent 40% des requêtes qu’il reçoit, que ses annonceurs pourront influencer sous forme de questions sponsorisées.
Enfin, les marques vont devoir intégrer le fait que les chatbots et agents d’intelligence artificielle vont être capables de réaliser de manière autonome des recherches ou actions comprenant plusieurs étapes. Demain par exemple, les moteurs de recherche prendront des rendez-vous et réserveront des restaurants à notre place et nous déléguerons à nos agents d’intelligence artificielle individuels des missions beaucoup plus complexes. Ainsi les agents des clients converseront-ils avec les agents des marques, ce qui est déjà possible avec GPT-4o. Cela mettra indubitablement en cause la part de la subjectivité dans la relation entre ces deux parties, ce qui, paradoxalement, va renforcer le rôle des émotions dans la performance des marques.
La voix, une nouvelle interface homme-machine enfin à maturité
Ce n’est pas la première fois qu’on évoque le potentiel de la voix pour interagir avec les nouvelles technologies. On avait beaucoup cogité à ce sujet, déjà, lors de l’apparition d’Alexa, Google Assistant et Siri. Mais ces systèmes n’opéraient que dans le cadre de scénarios pré-définis et ne produisirent donc pas la transformation attendue. Les intelligences artificielles génératives, qui peuvent, elles, gérer un nombre infini de situations et demandes, changent complètement la donne (voir la vidéo reproduite ci-dessous). Cela ne signifie pas que la voix va remplacer définitivement et intégralement les claviers car chaque innovation applicative se superpose généralement aux précédentes.
Mais les démonstrations en direct d’OpenAI et les vidéos de Google tracent un futur dans lequel la voix va jouer un rôle éminent dans nos interactions avec les intelligences artificielles génératives. OpenAI, en particulier, a présenté une solution vocale intégrée de manière native à son nouveau modèle, GPT-4o (lequel préfigure certainement le futur GPT-5), qui impressionne par son traitement des informations de toute nature et par sa latence (son temps de réaction) équivalent à celui d’un être humain. Ces qualités en font un interlocuteur extrêmement naturel qu’il est encore plus facile d’anthropomorphiser. OpenAI a d’ailleurs tout fait, jusqu’à l’excès2, pour que GPT-4o ait les caractéristiques de la machine dont le personnage incarné par Joaquin Phoenix tombe amoureux dans le film “Her”. GPT-4o est facétieuse, ce qui la destine d’ailleurs pour l’instant davantage à des applications B2C que B2B/B2G.
A cet égard, il convient également de noter que l’interface vocale va aggraver les problèmes d’hallucination (le fait que les grands modèles de langage inventent les informations qu’ils ignorent et ne savent pas communiquer une incertitude à leur sujet), non pas parce qu’elle va les faire davantage halluciner mais parce qu’une fausse réponse communiquée vocalement paraît encore plus assertive, et donc plus faussement vraie, qu’exprimée textuellement. De nouveau, ce n’est un sujet indifférent ni pour les marques ni pour les Sociétés démocratiques.
Or, parallèlement aux créateurs d’intelligences artificielles génératives, d’autres innovateurs du monde des nouvelles technologies travaillent sur des systèmes également fondés sur une interaction vocale. C’est par exemple le cas de IYO, une entreprise qui développe un ordinateur entièrement managé par la voix, le IYO One. Vous pouvez en voir une démonstration dans ce récent talk TED du patron de Ia start-up.
Des machines émotionnelles, une révolution dans la révolution de l’IA générative
Les capacités émotionnelles de GPT-4o en entrée (comprendre les émotions de ses interlocuteurs) comme en sortie (exprimer des émotions) sont faramineuses (voir les vidéos reproduites ci-dessus et ci-dessous) par rapport à ce que nous avons expérimenté jusqu’à présent de la part de technologies, même si elles ne sont pas encore parfaites.
Naturellement, ces nouvelles capacités interrogent : comment vont-elles être perçues par les internautes ? Vont-ils les accepter, ce qui engendrerait une révolution inédite dans les interactions homme-machine, ou se sentir suggestionnés et les rejeter ? Comment vont-elles être utilisées par des acteurs mal intentionnés pour se livrer à des manipulations dans des optiques notamment mercantiles et politiques ? Comment la confiance, indispensable à toute vie en Société, va-t-elle pouvoir être cultivée dans ce contexte ? Comment les relations humaines vont-elles évoluer lorsque beaucoup préféreront échanger avec leurs interlocuteurs artificiels qu’avec leurs congénères ?
Les marques face à un nouveau défi d’adaptation
Ces trois mutations (intermédiation, interfaçage vocal et capacité artificielle émotionnelle) vont modifier en profondeur les rapports entre les marques et leurs parties prenantes, qu’il s’agisse d’engagement ou de commerce. Les dynamiques de visibilité, d’émergence, de notoriété, de différenciation et de préférence vont devoir être réimaginées dans le cadre de nouvelles mécaniques médiatiques et de nouveaux modes d’interaction avec les publics cible. Les enjeux prégnants à cet égard, qui sont au coeur de mes conseils auprès de mes clients dans ce domaine, vont concerner la neutralisation des marques par les chatbots et agents, la production et la médiatisation des contenus, la désinformation, la surinformation, la personnalisation, l’influence (au sens large), et ce en marketing de même qu’en communication externe et interne.
Il serait prématuré d’apporter des réponses générales et définitives à ces questions. Mais il serait fou de ne pas commencer immédiatement à y réfléchir au sein de chaque marque en fonction de ses enjeux propres.
—
1 Dont Apple est absente, ce qui pourrait justifier les rumeurs de ses pourparlers avec OpenAI pour valoriser GPT-4 au sein d’iOS. Doté d’une intelligence artificielle générative de pointe qui serait au courant de toutes leurs activités, l’iPhone, le seul ersatz de jumeau numérique grand public actuel, pourrait proposer à ses utilisateurs un ensemble de nouvelles fonctionnalités inenvisageables aujourd’hui avec lesquelles seul Google, s’il intégrait verticalement Android, Gemini et les smartphones Pixel, pourrait rivaliser.
2 “Sky”, l’une des cinq voix proposées pour GPT-4o et celle mise en avant par OpenAI dans sa communication sur son nouveau modèle, ressemble étrangement à Scarlett Johansson, l’actrice qui prête sa voix à l’ordinateur de “Her”, le film préféré de Sam Altman auquel il fit référence lors de la présentation de GPT-4o. Scarlett Johansson a raconté que Sam Altman lui avait proposé de la recruter pour être aussi la voix de GPT-4o et qu’elle avait refusé. Elle accuse l’Entreprise d’avoir utilisé une version artificielle de sa voix sans son autorisation et, pire, après qu’elle eût explicitement refusé d’être associée à ce produit. Ses avocats ont écrit à Sam Altman pour lui demander des explications à ce sujet. Dans la foulée, OpenAI a annoncé le retrait de la voix “Sky” de son modèle et expliqué que la ressemblance de celle-ci avec Scarlett Johansson était une “coïncidence”, ce qui constitue, au vu du témoignage de l’actrice (deux jours seulement avant la démo de GPT-4o, Sam Altman avait contacté l’agent de Scarlett Johansson pour lui demander de reconsidérer sa position) et de la référence de Sam Altman à “Her”, le plus effronté mensonge corporate de ces derniers temps. C’est un signe d’arrogance sans fin que de prendre ses parties prenantes pour des imbéciles. Et c’est un signal inquiétant que Sam Altman et son équipe se croient autorisés à se comporter ainsi, se pensant intouchables. Ajouté au départ de l’équipe chargée de l’alignement (i.e. l’innocuité) des modèles d’OpenAI en raison de désaccords de fond avec Sam Altman, cela fait beaucoup pour ce dernier ces deniers jours. Le Conseil d’Administration de l’Entreprise va peut-être devoir de nouveau se pencher sur son cas. En attendant, ne croyez pas la moindre des déclarations de Sam Altman et d’OpenAI.