design trendsMay 9, 202612 min read

目前大多数人工智能产品都不适合使用聊天界面

聊天是默认的AI界面,但对于大多数任务来说并不合适。解决方案是直接操作、结构化输出、生成式用户界面、内联AI和环境AI。

By Boone
XLinkedIn
chat is the wrong ui

对于大多数人工智能产品而言,聊天界面并非理想的用户界面。每个在实际界面角落添加“与我们的人工智能对话”面板的团队都犯了同样的错误,而错误不在于模型本身,而在于界面设计。

对话式界面之所以成为默认选项,是因为 ChatGPT 让十亿人能够熟练地与文本框对话。这种熟练度是真实存在的。因此,认为所有人工智能功能都应该是文本框的结论是类别错误。

聊天只是一种工具。对于大多数人工智能功能而言,它并不合适。正确的解决方案是直接操作、结构化输出、生成式用户界面、内联人工智能和环境人工智能,而目前领先的产品正是那些率先领悟到这一点的产品。

聊天界面如何成为默认选项

聊天界面之所以成为默认选项,是因为它是基于语言模型开发的最经济的界面。文本输入和文本输出只需一天即可完成集成。任何其他方案都是真正的设计难题。

第二个原因是演示效应。 ChatGPT 的发布让聊天线程成为“我们现在拥有人工智能”的视觉速记符号,产品团队纷纷采用看起来现代的界面形状。

第三个原因是伪装成谦逊的懒惰。团队说“让用户问任何问题”,是因为他们不想对人工智能应该做什么做出任何承诺。一个空白的文本框在设计上就相当于耸耸肩。

这些原因都与用户无关。它们关乎速度、形象和规避风险,这就是为什么最终的产品会让实际使用者感到无奈。

聊天的真正用途

聊天适用于特定场景,你应该清楚地知道这些场景是什么。例如,用户尚不清楚自己想要什么的开放式探索。又如,需要经过多次交流才能最终确定答案的多轮协商。再如,用户无法用单一的结构化形式清晰表达目标的模糊意图。

ChatGPT 的主界面是正确的。Claude.ai 的主界面也同样正确。当你遇到棘手的架构问题,需要借助其他工具时,Cursor 的聊天面板就是一个不错的选择。

这三款产品的共同之处在于,聊天界面本身就是产品的核心,而非附加组件。聊天是核心功能,用户来这里就是为了参与对话,而屏幕的其他部分则服务于对话。

一旦聊天不再是核心功能,而沦为屏幕角落的辅助工具,你就用错了用户界面。这时,替代方案就显得尤为重要,而这些替代方案才是关键所在。

聊天的缺点

聊天不擅长处理任何具有已知形状的任务。如果人工智能的任务是填写表单,聊天就不合适。如果人工智能的任务是编辑特定段落,聊天也同样不合适。如果人工智能的任务是建议下一个字段、下一行或下一个像素,那么聊天就不合适。

聊天速度慢。每次聊天都是一次往返:输入、发送、等待、阅读、再次输入。在普通用户界面中只需点击一下就能完成的任务,在聊天中却要经历三轮,这不仅浪费用户的时间,也损害了用户的尊严。

聊天不擅长并行处理。对话是单线程的,而大多数实际工作都是同时进行多项任务。用户可能同时编辑三个部分、比较两个选项并查看一个预览,而聊天线程会将所有这些信息压缩成一个序列。

聊天不擅长建立信任。你无法预知人工智能即将执行的操作,直到它执行为止,而那时更改已经出现在文档中。直接操作可以让用户在执行之前看到操作步骤,而聊天则将操作隐藏在句子中。

体素合成图,左侧为一个标有“CHAT”的聊天气泡面板,右侧为一个更大的直接操作面板,面板上有一个Tab键图标悬停在可编辑内容上。两个面板均以柔和的珊瑚色和奶油色渲染,背景为深色的Brainy工作室背景,并带有微妙的青色边缘光。
体素合成图,左侧为一个标有“CHAT”的聊天气泡面板,右侧为一个更大的直接操作面板,面板上有一个Tab键图标悬停在可编辑内容上。两个面板均以柔和的珊瑚色和奶油色渲染,背景为深色的Brainy工作室背景,并带有微妙的青色边缘光。

五种非聊天替代方案

有五种界面模式几乎总是比聊天更适合产品人工智能。直接操作、结构化输出、生成式用户界面、内联 AI 和环境 AI,大致按其适用频率排序如下:

  1. 直接操作:用户抓取内容,AI 辅助抓取。

  2. 结构化输出:AI 返回 UI 渲染的文本对象,而非段落。

  3. 生成式用户界面:AI 构建答案界面,而非编写答案。

  4. 内联 AI:AI 作为上下文相关的操作,存在于现有界面中。

  5. 环境 AI:AI 无需独立用户界面即可运行,仅在需要时才会出现。

这些技术各自承担着聊天功能无法完成的任务。在 2026 年推出最佳 AI 功能的产品团队通常会结合使用其中两到三种技术,而且几乎从不优先使用聊天功能。

直接操作,Cursor 的 Tab 键功能胜出

Cursor 的 Tab 键自动补全功能是直接操作的最佳范例。用户正在输入代码,模型预测下一步编辑操作,用户只需按一下 Tab 键即可确认。没有聊天,没有提示,没有讨论串,也没有等待室。

用户输入的不是问题,而是代码。人工智能观察代码并提供下一步操作建议,用户只需按一下 Tab 键即可继续操作。这种循环模式适用于大量人工智能功能。

直接操作之所以有效,是因为它保留了用户现有的操作模式。用户已经知道如何编写代码、点击像素、拖动图层、编辑单元格,人工智能会根据用户的操作习惯,以建议的形式融入到这种操作模式中,用户可以自行决定接受或忽略这些建议。

Notion 的内联人工智能对散文也采用了这种模式。Figma 最近的人工智能重命名和人工智能重构功能则将这种模式应用于图层。这种模式的应用范围远远超出代码本身,只要用户已经参与到工作中,人工智能就应该加入进来,而不是另起炉灶,开启新的对话。

结构化输出,Linear 用来跳过聊天的模式

Linear 的自然语言命令会将类似“为分配给我的授权流程创建一个错误,截止日期为周五”这样的句子转换成一个包含标题、负责人、标签和截止日期的 Linear 问题。用户输入文字,产品渲染出一个问题。

输出是结构化的。没有对话,没有澄清问题,也没有 AI 角色。模型返回了一个类型化的对象,用户界面则将其显示为它原本的样子——一个问题卡片。

结构化输出几乎适用于所有“用文字在我的产品中执行操作”的功能。用户可以享受自由输入的速度,产品可以凭借自身的数据模型获得精确性,而 AI 则完全隐形,因为它正在做正确的事情:将一种形式转换为另一种形式,并且不会干扰用户。

Granola 的“转录而非聊天”模式同样应用于会议。其产品是一个转录界面,而非聊天记录,人工智能从转录中提取结构化信息,例如行动项、决策和后续事项。用户直接使用这些信息,无需与人工智能就会议内容进行任何对话。

体素合成图像展示了五个贴有标签的卡片并排摆放在深色工作室的地板上,画面以柔和的珊瑚色和奶油色调为主,并带有微妙的青色边缘光。每张卡片的形状各不相同,分别代表五种不同的界面模式之一。
体素合成图像展示了五个贴有标签的卡片并排摆放在深色工作室的地板上,画面以柔和的珊瑚色和奶油色调为主,并带有微妙的青色边缘光。每张卡片的形状各不相同,分别代表五种不同的界面模式之一。

生成式用户界面,v0 和 Claude Artifacts 改变了游戏规则

生成式用户界面是指人工智能返回的是界面,而非文本。v0 接收用户提示,并返回一个可预览和复制的 React 组件。Claude Artifacts 接收请求,并返回渲染后的图表、可运行的应用程序或对话中可用的文档。

这种思维模式的转变非常显著。人工智能不再回答问题,而是提供一个能够回答问题的小型软件。用户看到的不是一段关于数据的文字描述,而是一个可以悬停并筛选的数据图表。

生成式用户界面之所以有效,是因为大多数答案以界面形式呈现比以散文形式呈现更合适。用户想要的不是仪表盘的描述,而是仪表盘本身;用户想要的不是数据摘要,而是表格。

这种模式拥有最长的发展周期。未来两年产品人工智能的发展将取决于团队如何积极地将生成式用户界面作为默认响应格式,以及他们如何让用户能够清晰地保留、修改和嵌入人工智能生成的工件。

内联人工智能和环境人工智能,人工智能融入用户的工作之中

内联人工智能存在于用户已打开的界面中,作为附加到他们正在处理的内容上的上下文操作。Notion 的内联人工智能模块允许用户选择一个段落并请求转换,转换结果会替换原有的选择。 Arc 的迷你 AI 界面会伴随用户阅读的页面,并将结果显示在同一标签页中。

这种模式的精髓在于“AI 是一种动词,而非一个场所”。用户无需导航到 AI,而是直接在眼前的内容上调用 AI。操作完成后,用户仍然停留在同一个界面,继续浏览相同的内容。

环境 AI 指的是 AI 无需自身用户界面即可存在。它时刻观察、做好准备,在需要时出现,其余时间则保持静默。Cursor 的标签页补全功能部分属于环境 AI,Granola 则主要属于环境 AI,而 GitHub Copilot 的最佳功能也属于环境 AI。

合适的环境 AI 就像一位善于察言观色的好同事。它不会主动自我介绍,也不会询问是否需要帮助,而是在你需要帮助的那一刻,及时提供哪怕是最微小的实用建议。

体素合成图像展示了三个发光的体素卡片,分别用单个字形标注着“开放”、“改进”和“谈话”,它们呈三角形排列在昏暗的Brainy工作室地板上,画面以柔和的珊瑚色和奶油色调为主,并带有青色边缘光,暗示着只有在特定情况下,聊天才是合适的选择。
体素合成图像展示了三个发光的体素卡片,分别用单个字形标注着“开放”、“改进”和“谈话”,它们呈三角形排列在昏暗的Brainy工作室地板上,画面以柔和的珊瑚色和奶油色调为主,并带有青色边缘光,暗示着只有在特定情况下,聊天才是合适的选择。

何时聊天才是最佳选择

聊天功能只有在满足以下三个条件时才能真正发挥作用:用户尚不清楚自己想要什么,答案需要经过多次讨论才能最终确定,以及对话本身就是用户寻求的价值所在。

治疗机器人、探索性研究助手、深夜还在苦苦等待的代码架构师、头脑风暴伙伴,以及 ChatGPT 和 Claude.ai 的主要界面都符合这三个条件。用户来这里是为了交流,交流本身就是工作,聊天是合适的选择。

如果你的功能无法满足所有这三个条件,那么聊天可能就不是合适的界面。请诚实地进行测试。如果用户清楚自己想要什么,聊天就显得太慢;如果答案可以用结构化的形式表达,聊天就显得太模糊。

坦白地说,可能只有百分之十的 AI 功能需要将聊天作为主要界面。其余 90% 的用户需要五种备选方案之一,以及一位能够区分这些方案的设计师。这意味着大多数聊天界面与最终交付的产品并不匹配。

决策框架

在决定 AI 功能应采用何种形式时,请使用此表。此表并非详尽无遗,仅供初步筛选。

| 任务 | 合适的界面 | 不合适的界面 |

|---|---|---|

| 编辑用户面前的内容 | 直接操作或内联 AI | 聊天面板 |

| 通过文字在产品中执行操作 | 结构化输出 | 聊天线程 |

| 提供用户可探索的数据作为答案 | 生成式 UI | 聊天中的段落 |

| 观察用户的工作并实时提供协助 | 环境 AI | 始终开放的聊天 |

| 帮助用户大声思考 | 聊天 | 内联 AI |

| 协商模糊的目标 | 聊天 | 单次表单 |

| 将文字转化为结构化的操作 | 结构化输出 | 带确认信息的聊天 |

| 构建答案界面 | 生成式用户界面 | 聊天中的 Markdown |

该框架坦诚地指出了各种权衡取舍。聊天功能适用于列表中八项任务中的两项,其余六项则属于其他替代方案。这个比例与目前最佳 AI 产品所采用的比例相符。

你经常看到的失败模式

几乎每次“我们在产品中添加了 AI”的发布都会出现四种失败模式。它们都是可以预见的,也是可以避免的,而且都始于聊天功能。

第一种是聊天功能本身的问题。团队选择聊天作为界面,然后试图用聊天功能处理从表单填写到数据探索再到在线编辑的所有事情。产品最终变成了一个附加在复杂应用程序上的文本框,用户被迫将每个操作都转换成一个句子。

第二种是延迟问题。每次聊天都是一次往返,用户必须等待。用户输入文字,点击发送,等待加载图标出现,阅读一段文字,再次输入文字,而对于本应只需点击一下就能完成的任务,聊天过程却极其繁琐。

第三个问题是上下文丢失。聊天线程无法识别用户正在查看的内容,也无法了解用户30秒前的操作。用户不得不反复解释每一个步骤,而人工智能的回答也显得千篇一律,因为它无法了解用户的操作过程。

体素合成图展示了四张标注着“锤子”、“延迟”、“上下文”、“噪声”的卡片,它们以网格状排列在昏暗的Brainy工作室地板上。卡片上的单个字形分别代表“锤子”、“延迟”、“上下文”和“噪声”,采用柔和的珊瑚奶油色和青色调,并带有微妙的边缘光,暗示着外接聊天人工智能的四种故障模式。
体素合成图展示了四张标注着“锤子”、“延迟”、“上下文”、“噪声”的卡片,它们以网格状排列在昏暗的Brainy工作室地板上。卡片上的单个字形分别代表“锤子”、“延迟”、“上下文”和“噪声”,采用柔和的珊瑚奶油色和青色调,并带有微妙的边缘光,暗示着外接聊天人工智能的四种故障模式。

第四个问题是环境噪音。当团队决定将聊天功能融入日常使用时,它会以建议、弹窗和通知的形式出现,而这些内容用户并未主动要求。产品似乎在自我干扰,用户最终会学会完全忽略人工智能的提示。

所有这些问题都表明,从一开始就选择聊天功能是错误的。解决方案几乎从来都不是改进提示,而是采用不同的界面。

如何设计替代方案

设计聊天后 AI 主要在于尊重用户现有的界面,并将 AI 缩小尺寸以适应其内部结构。首先要了解用户想要完成的工作,找到 AI 可以简化操作的步骤,然后将 AI 以最恰当的方式精准地放置在那里。

直接操作的设计是通过观察用户的手部动作。用户在哪些地方已经进行拖拽、点击、输入和选择操作?AI 会辅助这些动作,而不是用聊天框取而代之。

结构化输出的设计是通过将 AI 的回答映射到产品的数据模型来实现的。模型返回一个类型化的对象,UI 渲染该对象,中间没有文字层。

生成式 UI 的设计是将 AI 的响应视为一个小型软件。内联 AI 的设计是通过梳理用户可能需要转换或补全的每个位置,并在那里提供相应的提示。环境 AI 的设计则遵循克制原则,将干扰的阈值设定为“用户会感谢我们”。

这对未来两年意味着什么

未来两年人工智能产品设计的格局将取决于谁能率先摆脱聊天的束缚。那些仍然在实际应用角落里堆砌聊天面板的团队,将会败给那些提供直接操作、结构化输出、生成式用户界面、内联人工智能和环境人工智能的团队。

新的设计词汇正在形成。“内联模块”、“生成式组件”、“环境辅助”、“结构化操作”和“直接编辑”正像十五年前“卡片”、“模态框”和“抽屉”一样,逐渐成为产品设计师的工作词汇。如果你在2026年底之前还不能熟练掌握这些词汇,那么你每个季度都会有两次发布错误产品。

最大的转变在于概念层面。人工智能不再是添加到产品中的一个功能,而是一种构建产品的基础材料,聊天只是这种材料的一种形式。只了解聊天界面的设计师只能设计一种类型的产品,因此,随着时间的推移,“聊天界面并不适合大多数产品”的说法越来越有道理。

聊天界面并没有消亡。它只适用于那些真正需要对话的少数工作,而对于其他所有工作而言,未来的发展方向取决于工作本身,而不是聊天窗口。如果你的产品只是一个附加在现有界面上的聊天框,你需要的不是更好的提示,而是更好的界面,而这正是 /hire 的工作内容。

If your product is a chat box bolted onto a real interface, you do not need a better prompt, you need a better surface, and that is the work we do at /hire.

Get Started

More from Brainy Papers

Keep reading