design trendsMay 9, 202612 min read

Le chat n'est pas l'interface utilisateur adaptée à la plupart des produits d'IA actuellement.

Le chat est l'interface d'IA par défaut, mais elle est inadaptée à la plupart des tâches. La solution réside dans la manipulation directe, la sortie structurée, l'interface utilisateur générative, l'IA intégrée et l'IA ambiante.

By Boone
XLinkedIn
chat is the wrong ui

Le chat est une interface utilisateur inadaptée à la plupart des produits d'IA. Toutes les équipes qui intègrent un panneau « Parlez à notre IA » dans un coin d'une interface classique commettent la même erreur : le problème ne réside pas dans le modèle, mais dans son interface.

L'interface conversationnelle est devenue la norme car ChatGPT a permis à un milliard de personnes de maîtriser l'art de dialoguer avec une zone de texte. Cette maîtrise est bien réelle. En conclure que chaque fonctionnalité d'IA devrait donc se limiter à une zone de texte est une erreur de catégorie.

Le chat est un outil parmi d'autres. Pour la plupart des fonctionnalités d'IA, c'est le mauvais. Les solutions optimales sont la manipulation directe, les sorties structurées, les interfaces génératives, l'IA intégrée et l'IA ambiante. Les produits qui réussissent actuellement sont ceux qui ont compris cela avant tout le monde.

Comment le chat est devenu la norme

Le chat est devenu la norme car c'était l'interface la moins coûteuse à intégrer à un modèle de langage. L'intégration d'une entrée et d'une sortie de texte ne prend qu'une journée. Toute autre approche pose un réel problème de conception.

La seconde raison est l'effet de démonstration. Le lancement de ChatGPT a fait du chat le symbole visuel de l'« IA désormais disponible », et les équipes produit ont opté pour une forme moderne.

La troisième raison est une forme de paresse déguisée en humilité. Les équipes se disent « laissons l'utilisateur poser toutes ses questions » car elles ne veulent pas se prononcer sur le fonctionnement de l'IA. Une zone de texte vide est l'équivalent, en matière de design, d'un haussement d'épaules.

Aucune de ces raisons ne concerne l'utilisateur. Elles sont liées à la rapidité, à l'image et à la volonté d'éviter les risques, et c'est pourquoi le produit final donne l'impression d'un haussement d'épaules aux utilisateurs.

À quoi sert réellement le chat ?

Le chat est adapté à un nombre restreint de situations, et il est important de les connaître précisément. L'exploration libre, où l'utilisateur ne sait pas encore ce qu'il veut, en est une. La négociation en plusieurs étapes, où la réponse nécessite d'être affinée au fil de plusieurs échanges, en est une autre. L'intention floue, où l'utilisateur ne peut pas formuler son objectif de manière structurée, en est une troisième.

L'interface principale de ChatGPT est correcte. Celle de Claude.ai l'est également pour la même raison. Le panneau de chat de Cursor est approprié lorsque vous êtes confronté à un problème d'architecture complexe et que vous avez besoin d'un second avis.

Ces trois produits ont en commun que l'interface de chat est au cœur du produit, et non un simple ajout. Le chat est l'élément central : l'utilisateur est là pour converser, et le reste de l'écran est au service de la conversation.

Dès que le chat cesse d'être l'élément central et devient un simple outil d'aide relégué dans un coin de l'écran, l'interface utilisateur est inadaptée. C'est à ce moment-là que les alternatives deviennent importantes, et qu'elles représentent la majeure partie du travail.

Les limites du chat

Le chat est inadapté à tout ce qui a une forme définie. Si le rôle de l'IA est de remplir un formulaire, le chat est inadapté. Si son rôle est de modifier un paragraphe précis, le chat est inadapté. Si le rôle de l'IA est de suggérer le champ suivant, la ligne suivante, le pixel suivant, le chat est inadapté.

Le chat est lent. Chaque échange est un aller-retour : taper, envoyer, attendre, lire, puis retaper. Pour une tâche qui se fait en un clic dans une interface classique, trois échanges par chat représentent une perte de temps et d'énergie pour l'utilisateur.

Le chat est inadapté à la gestion du multitâche. Une conversation forme un fil de discussion unique, alors que la plupart des tâches impliquent plusieurs actions simultanées. L'utilisateur modifie trois sections, compare deux options et visualise un aperçu ; un fil de discussion condense tout cela en une simple séquence.

Le chat est source de frustration. On ne peut pas anticiper les actions de l'IA avant qu'elles ne soient effectuées, et la modification est alors déjà intégrée au document. La manipulation directe permet à l'utilisateur de visualiser l'action avant de la valider, tandis que le chat la dissimule au sein d'une phrase.

Composition voxel montrant une bulle de chat unique à gauche, intitulée CHAT, et une zone de manipulation directe plus large à droite, avec un glyphe de touche Tabulation survolant un contenu modifiable. Les deux éléments sont rendus dans des tons corail doux et crème sur un fond studio sombre Brainy avec un léger halo cyan.
Composition voxel montrant une bulle de chat unique à gauche, intitulée CHAT, et une zone de manipulation directe plus large à droite, avec un glyphe de touche Tabulation survolant un contenu modifiable. Les deux éléments sont rendus dans des tons corail doux et crème sur un fond studio sombre Brainy avec un léger halo cyan.

Les cinq alternatives au chat

Il existe cinq modèles d'interface qui surpassent presque toujours le chat pour l'IA appliquée aux produits. Manipulation directe, sortie structurée, interface utilisateur générative, IA intégrée et IA ambiante, classées approximativement par ordre de pertinence.

  1. Manipulation directe : l’utilisateur saisit l’élément et l’IA l’assiste.

  2. Sortie structurée : l’IA renvoie un objet textuel que l’interface utilisateur affiche, et non un paragraphe.

  3. Interface utilisateur générative : l’IA construit l’interface de la réponse au lieu de la rédiger.

  4. IA intégrée : l’IA s’intègre à l’interface existante sous forme d’action contextuelle.

  5. IA ambiante : l’IA est présente sans interface utilisateur propre et apparaît en cas de besoin.

Chacune de ces technologies offre des fonctionnalités qu’une messagerie instantanée ne peut pas remplir. Les équipes produit qui déploieront les meilleures fonctionnalités d’IA en 2026 en utiliseront deux ou trois conjointement, et privilégieront rarement la messagerie instantanée.

Manipulation directe : l’exemple parfait de la saisie au clavier

La saisie au clavier est le meilleur exemple de manipulation directe réussie. L'utilisateur saisit du code, le modèle prédit la modification suivante et une simple pression sur la touche Tabulation la valide. Pas de chat, pas d'invite, pas de fil de discussion, pas de salle d'attente.

L'utilisateur n'a pas posé de question, il a saisi du code. L'IA a analysé le code et proposé l'action suivante ; l'utilisateur a validé d'un doigt et a continué. Cette boucle est la solution idéale pour une vaste gamme de fonctionnalités d'IA.

La manipulation directe fonctionne car elle préserve les schémas moteurs existants de l'utilisateur. Ce dernier sait déjà écrire du code, cliquer sur des pixels, déplacer des calques, modifier des cellules, et l'IA s'intègre à ces schémas moteurs sous forme de suggestion que l'utilisateur accepte ou ignore à son propre rythme.

L'IA intégrée de Notion applique ce principe au texte. La récente refonte et le renommage de l'IA de Figma le mettent en évidence pour les calques. Ce modèle se généralise bien au-delà du code, et partout où l'utilisateur interagit déjà avec le texte, l'IA devrait s'y associer plutôt que d'entamer une conversation séparée à ce sujet.

Sortie structurée : le modèle utilisé par Linear pour éviter le chat

Les commandes en langage naturel de Linear transforment une phrase comme « créer un bug pour le flux d'autorisation qui m'est assigné, à rendre vendredi » en une Linear (ticket) avec un titre, un responsable, une étiquette et une date d'échéance. L'utilisateur a saisi du texte, le produit a généré un ticket.

La sortie est structurée. Il n'y a ni conversation, ni question de clarification, ni intervention de l'IA. Le modèle a renvoyé un objet saisi et l'interface utilisateur l'a affiché comme prévu : une fiche ticket.

La sortie structurée est le modèle idéal pour presque toutes les fonctionnalités permettant d'effectuer des actions textuelles dans un produit. L'utilisateur bénéficie de la rapidité de la saisie libre, le produit de la précision de son propre modèle de données et l'IA reste invisible car elle se contente de traduire une information en une autre et de se faire discrète.

L'approche « transcription et non conversation » de Granola repose sur le même principe appliqué aux réunions. Le produit est une interface de transcription, et non une conversation instantanée. L'IA extrait de cette transcription des éléments structurés tels que les actions à entreprendre, les décisions et les suivis. L'utilisateur interagit directement avec ces éléments, sans dialogue avec l'IA concernant la réunion.

Composition voxel montrant cinq cartes étiquetées alignées sur le sol sombre d'un studio, dans des tons corail doux et crème avec un subtil halo cyan. Chaque carte a une forme différente, suggérant l'un des cinq motifs d'interface alternatifs.
Composition voxel montrant cinq cartes étiquetées alignées sur le sol sombre d'un studio, dans des tons corail doux et crème avec un subtil halo cyan. Chaque carte a une forme différente, suggérant l'un des cinq motifs d'interface alternatifs.

Interface utilisateur générative : la révolution v0 et les artefacts Claude

L'interface utilisateur générative est un modèle où l'IA renvoie une interface, et non du texte. La version v0 reçoit une requête et renvoie un composant React fonctionnel que l'utilisateur peut prévisualiser et copier. Les artefacts Claude reçoivent une requête et renvoient un graphique rendu, une application fonctionnelle ou un document utilisable directement dans la conversation.

Le changement de perspective est radical. L'IA ne se contente plus de répondre à une question ; elle fournit un petit module logiciel qui y répond. L'utilisateur n'a pas reçu un paragraphe décrivant les données, mais un graphique interactif qu'il peut survoler et filtrer.

L'interface utilisateur générative fonctionne car la plupart des réponses sont mieux structurées sous forme d'interfaces que de texte. Vous ne vouliez pas une description du tableau de bord, vous vouliez le tableau de bord lui-même. Vous ne vouliez pas un résumé des données, vous vouliez le tableau.

Ce modèle a le plus d'avenir. L'évolution de l'IA produit au cours des deux prochaines années sera marquée par la rapidité avec laquelle les équipes adopteront l'interface utilisateur générative comme format de réponse par défaut, et par la facilité avec laquelle elles permettront aux utilisateurs de conserver, modifier et intégrer les éléments générés par l'IA.

IA intégrée et IA ambiante : l'IA au cœur de l'activité

L'IA intégrée s'intègre à l'interface déjà ouverte par l'utilisateur, sous forme d'action contextuelle liée à l'élément sur lequel il travaille. Les blocs d'IA intégrée de Notion permettent à l'utilisateur de sélectionner un paragraphe et de demander une transformation ; le résultat remplace alors la sélection. Les mini-interfaces d'IA de Arc s'affichent en parallèle de la page consultée par l'utilisateur, et le résultat apparaît dans le même onglet.

Le principe est celui d'une « IA comme action, et non comme lieu ». L'utilisateur n'a pas navigué jusqu'à l'IA ; il l'a invoquée directement sur l'élément qu'il consultait. Une fois l'action terminée, l'utilisateur se trouvait toujours sur la même interface, toujours devant le même document.

L'IA ambiante est un modèle où l'IA est présente sans interface utilisateur propre. Elle observe, se prépare, apparaît au besoin, et reste discrète le reste du temps. La saisie semi-automatique de Cursor est en partie ambiante, Granola l'est en grande partie, et les meilleures fonctionnalités de GitHub Copilot le sont également.

Une IA ambiante bien conçue se comporte comme un bon collègue qui sait s'adapter. Elle ne se manifeste pas, ne demande pas si vous avez besoin d'aide, mais détecte le moment où vous en avez besoin et vous offre la moindre fonctionnalité utile.

Composition voxel montrant trois cartes voxel lumineuses, chacune portant un glyphe représentant un seul mot : OUVRIR, AFFINER et PARLER. Disposées en triangle sur le sol sombre du studio Brainy, dans des tons corail doux et crème, avec un halo cyan, elles suggèrent le contexte précis où la conversation est la solution appropriée.
Composition voxel montrant trois cartes voxel lumineuses, chacune portant un glyphe représentant un seul mot : OUVRIR, AFFINER et PARLER. Disposées en triangle sur le sol sombre du studio Brainy, dans des tons corail doux et crème, avec un halo cyan, elles suggèrent le contexte précis où la conversation est la solution appropriée.

Quand le chat est la solution idéale

Le chat est pertinent lorsque trois conditions sont réunies : l’utilisateur ne sait pas encore ce qu’il veut, la réponse nécessite plusieurs échanges pour être affinée, et la conversation elle-même constitue l’objet de la visite.

Les chatbots de thérapie, les assistants de recherche exploratoire, les architectes logiciels avec lesquels vous êtes bloqué à minuit, les partenaires de brainstorming, et les interfaces principales de ChatGPT et Claude.ai répondent tous à ces trois conditions. L’utilisateur est venu pour parler, la conversation est le travail, le chat est donc approprié.

Si votre fonctionnalité ne remplit pas ces trois conditions, le chat n’est probablement pas l’interface la plus adaptée. Faites le test honnêtement. Si l’utilisateur sait ce qu’il veut, le chat est trop lent ; si la réponse se prête à une formulation structurée, le chat est trop vague.

En réalité, environ 10 % des fonctionnalités d’IA nécessitent le chat comme interface principale. Les 90 % restants nécessitent l'une des cinq alternatives et un concepteur capable de faire la différence. Autrement dit, la plupart des conversations ne constituent pas une interface utilisateur adaptée au produit livré.

Cadre de décision

Utilisez ce tableau pour déterminer la forme que devrait prendre une fonctionnalité d'IA. Il n'est pas exhaustif ; il s'agit d'une première ébauche.

| Tâche | Interface appropriée | Interface inappropriée |

|---|---|---|

| Modifier l'élément devant l'utilisateur | Manipulation directe ou IA intégrée | Panneau de conversation |

| Effectuer une action dans le produit par écrit | Sortie structurée | Fil de discussion |

| Répondre avec des données que l'utilisateur peut explorer | Interface générative | Paragraphe dans la conversation |

| Observer le travail et assister en temps réel | IA ambiante | Conversation toujours ouverte |

| Aider l'utilisateur à verbaliser sa pensée | Conversation | IA intégrée |

| Négocier un objectif flou en plusieurs étapes | Conversation | Formulaire unique |

| Traduire un texte en actions structurées | Sortie structurée | Conversation avec confirmations |

| Créer l'interface pour une réponse | Interface utilisateur générative | Markdown dans le chat |

Ce framework est transparent quant aux compromis à faire. Le chat est adapté à deux des huit tâches de cette liste, les six autres relevant des alternatives. Ce ratio correspond à celui des meilleurs produits d'IA actuellement disponibles.

Les échecs récurrents

Quatre échecs apparaissent presque systématiquement lors du lancement d'un produit intégrant l'IA. Ils sont prévisibles, évitables et tous liés au chat.

Le premier est l'utilisation abusive du chat. L'équipe choisit le chat comme interface, puis tente de l'utiliser pour tout, du remplissage de formulaires à l'exploration de données en passant par les modifications en temps réel. Le produit se réduit alors à une simple zone de texte greffée sur une application complexe, et l'utilisateur est contraint de traduire chaque action en phrase.

Le deuxième est la crainte de la latence. Chaque échange de chat représente un aller-retour que l'utilisateur doit effectuer. L'utilisateur saisit du texte, appuie sur Envoyer, observe une animation de chargement, lit un paragraphe, saisit à nouveau du texte, et pour les tâches qui devraient se résumer à un clic, la latence du chat est exorbitante.

Le troisième problème est la perte de contexte. La conversation ne sait pas ce que l'utilisateur regarde ni ce qu'il faisait trente secondes auparavant. L'utilisateur doit tout réexpliquer, et les réponses de l'IA semblent impersonnelles car elle ne voit pas le travail effectué.

Composition voxel montrant quatre cartes étiquetées, disposées en grille sur le sol sombre du studio Brainy. Les glyphes, composés d'un seul mot, représentent HAMMER, LATENCIE, CONTEXT et NOISE. Ils sont écrits dans des tons corail crème et cyan doux, avec un léger éclairage périphérique, suggérant quatre modes de défaillance d'une IA de chat intégrée.
Composition voxel montrant quatre cartes étiquetées, disposées en grille sur le sol sombre du studio Brainy. Les glyphes, composés d'un seul mot, représentent HAMMER, LATENCIE, CONTEXT et NOISE. Ils sont écrits dans des tons corail crème et cyan doux, avec un léger éclairage périphérique, suggérant quatre modes de défaillance d'une IA de chat intégrée.

Le quatrième problème est le bruit ambiant. Lorsque l'équipe décide de rendre le chat omniprésent, cela se traduit par des suggestions, des fenêtres contextuelles et des notifications non sollicitées. Le produit donne l'impression de s'interrompre constamment, et l'utilisateur finit par ignorer complètement l'IA.

Chacun de ces dysfonctionnements indique que le chat était une erreur dès le départ. La solution ne consiste presque jamais à améliorer l'invite, mais plutôt à repenser l'interface.

Comment concevoir les alternatives

Concevoir une IA post-chat consiste principalement à respecter l'interface utilisateur existante et à adapter l'IA à celle-ci. Commencez par la tâche que l'utilisateur est venu accomplir, identifiez le moment où l'IA peut lui faire gagner du temps, puis intégrez-la précisément à cet endroit, de manière optimale.

La manipulation directe est conçue en observant les gestes de l'utilisateur. Où glisse-t-il, clique-t-il, saisit-il, sélectionne-t-il déjà ? L'IA assiste ces mouvements sans les remplacer par une fenêtre de chat.

La sortie structurée est conçue en associant la réponse de l'IA au modèle de données du produit. Le modèle renvoie un objet saisi, l'interface utilisateur l'affiche, sans couche de texte intermédiaire.

L'interface utilisateur générative est conçue en considérant la réponse de l'IA comme un petit composant logiciel. L'IA intégrée est conçue par inventaire, recensant tous les endroits où l'utilisateur pourrait souhaiter une transformation ou une saisie semi-automatique et y intégrant une petite affordance. L'IA ambiante est conçue avec retenue, le seuil d'interruption étant fixé à « l'utilisateur nous en sera reconnaissant ».

Ce que cela signifie pour les deux prochaines années

Les deux prochaines années, la conception de produits d'IA sera déterminée par celui qui parviendra le premier à se passer de chat. Les équipes qui persistent à intégrer des panneaux de chat dans leurs applications seront distancées par celles qui proposent la manipulation directe, la sortie structurée, les interfaces utilisateur génératives, l'IA intégrée et l'IA ambiante.

Un nouveau vocabulaire de conception est déjà en train d'émerger. Les termes « blocs intégrés », « artefacts génératifs », « assistance ambiante », « actions structurées » et « édition directe » intègrent le vocabulaire des concepteurs de produits, tout comme les mots « carte », « modal » et « tiroir » y sont entrés il y a quinze ans. Si vous ne maîtrisez pas ce vocabulaire d'ici fin 2026, vous risquez de livrer deux produits inadaptés par trimestre.

Le changement le plus important est conceptuel. L'IA n'est pas une fonctionnalité ajoutée à un produit, mais un matériau avec lequel on construit, et le chat n'en est qu'une application. Un concepteur qui ne connaît que le chat ne peut concevoir qu'un seul type de produit. C'est pourquoi l'affirmation selon laquelle le chat est une interface utilisateur inadaptée à la plupart des produits se confirme de mois en mois.

Le chat n'est pas mort. Le chat est pertinent pour les rares emplois qui nécessitent une conversation, mais pour tout le reste, l'avenir se dessine au gré des tâches, et non des échanges. Si votre produit est une messagerie instantanée intégrée à une interface utilisateur, vous n'avez pas besoin d'une meilleure interface, mais d'une meilleure surface de communication : c'est précisément ce que nous faisons chez /hire.

If your product is a chat box bolted onto a real interface, you do not need a better prompt, you need a better surface, and that is the work we do at /hire.

Get Started

More from Brainy Papers

Keep reading