亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

生成式AI體驗中的新興用戶界面模式

从历史中学习,设计未来的方向。

你有没有被一位已经知道你点什么咖啡的咖啡师迎接过?不需要详细说明每一个方面——温度、冲泡时间、水量、咖啡豆的产地、研磨粗细、烘焙程度等——就能拿到你的咖啡,这种体验很棒。这展示了我们现在在使用AI时所经历的领域。

这篇文章不是关于咖啡;它关注的是用户互动如何变化和适应,以及生成式AI用户交互可能如何根据先前的GUI趋势和新的生成式AI互动趋势而演变。我们将探讨上下文整合、用户管理、信任和生态系统等趋势对于AI用户体验的价值。

从指令到对话

让我们回到计算机历史的黎明时期,当时使用计算机意味着在命令行界面(CLI)中输入精确的命令。想象一下记住打开文件或复制数据的确切命令有多难,更不用说找到你的“作业”文件夹。并不是每个人都有成为程序员的天分。为了使计算机更易于使用,改变是必要的。

1964年引入了ELIZA,这是早期对自然语言处理的一种尝试,通过识别关键词并用预设回复与用户进行基本对话。虽然具有开创性,但ELIZA的对话远没有那么灵活,也难以扩展。

在同一时期左右,Xerox PARC正在开发图形用户界面(GUI),后来在1984年由苹果带给大众,随后微软也随后跟进。GUI彻底改变了计算机的使用方式,用图标、菜单和窗口取代了复杂的命令,可以通过鼠标来操作。这一创新让计算机在日常任务中变得易于使用且直观,为技术在我们生活中的普及奠定了基础。

不同的类型界面示例。例如,ChatGPT的主要交互方式是通过文本,它将来会怎样发展呢?

看看上面的例子图像。我们正在见证一种平行进化,就像您所见,用户提示基本上是用自然语言编写的小程序,结果的质量取决于我们如何编写提示。就像早期计算从命令行界面的复杂性转变到图形界面的简单性,使技术更加普及,我们正看到生成式人工智能中出现类似的趋势,将复杂的输入打包成更简单、更用户友好的界面,后台依然保持复杂性。

这些UI和潜在提示词对于Stable Diffusion WebUI、Midjourney和DALL·E 3展示了不同的方式来图形化展示一个复杂图像扩散的过程。

图像生成器,如上所示,包括Stable Diffusion WebUIMid Journey,DALL·E 3,需要的提示精确度也各不相同。虽然 Mid Journey 和 DALL·E 更容易上手,但 Stable Diffusion 能提供更具体的输出。我们对用户了解得越多,就越能提供既简单又符合他们需求的体验。

上下文打包

上下文绑定通过将相关的信息组合成单一命令来简化交互,解决了传达复杂指令以达到预期结果的难题。这通过一次对齐用户意图和机器理解来提高效率和输出品质,从而消除了手动编写用户提示的必要。

我们已经看到这种情况在各种生成式AI工具中出现,例如Edge中的样本提示、Google Chrome的标签管理器以及Stable Diffusion中的触发词。触发词是提示中的特殊标记,可以使用文本反转、LoRa模型或其他改进进行微调。

在上下文捆绑中,“对话式”AI并不总是意味着真正的对话。它关乎用户想要实现的目标,而不仅仅是依赖于基于文本的提示。上下文捆绑为用户提供了一个快速获得所需输出的方法,而无需进行冗长对话。用户体验不再依赖于通用的对话界面,而是由特定的数据和更专业的体验驱动。

这些具体示例有Miro Assist等,Clay AI公式生成工具等,和SCOPUS AI等。它们都通过将相关信息整合成特定的单一命令来简化交互。

另一种扩展上下文捆绑的方式是让用户定义这些捆绑包的属性。用户可调整的偏好和个性化设置被整合到上下文中,让用户在产品使用过程中体验到更加高效和相关的互动之后。

上下文捆绑不仅仅是简化对话那么简单;它更是帮助用户直接实现他们的目标,无论这些目标是通过搜索查询、摘要还是其他特定任务来达成。它将复杂的指令转化为简单的用户友好型交互,尤其对简单或重复的任务特别有帮助。但对于更开放的任务,比如探索或需要逐步细化的目标,这时就需要持续的用户反馈机制或反馈环路了。

用户审核

尽管在使AI互动更直观方面取得了进展,但仍存在很多地方用户必须细化输出以实现其特定目标。特别是在研究、头脑风暴、创作创意内容、调整图像或甚至是编辑等工作时,情况更是如此。随着上下文窗口的不断扩大和多模态功能的增强,这使得引导用户处理复杂性变得更加重要。

无论意识到与否,我们人类都在不断地整理我们对世界的体验和感受(如上图所示)。这种整理可能表现为例如在对话中突出或选择某些感兴趣的关键词,或者在书中手动高亮。在观察用户使用ChatGPT进行头脑风暴时,我注意到类似的行为,即高亮某些内容。用户当时不能与这些高亮内容互动,而是用其中的部分内容指导他们的下一步行动。这表明,虽然最初的输出可能无法完全满足用户的需求,但它提供了具体的行为指引,帮助用户下一步。让用户更容易整理和细化他们的输出内容,这样既可以让用户获得更好的体验,也能提高机器生成结果的质量。

示例包括ClipdropChatGPTHeyPiGoogle Circle,和Github Copilot

在上述图像中,inpainting、交错对话和高亮互动都是出现的例子有,展示了用户如何精选特定的信息部分,以创造更相关的上下文从而获得更好的结果。

以撰写一份详尽报告为例。用户的研究旅程通常从广泛的调研开始。这导致发现需要深入研究的关键点。随着他们搜集和评估信息,他们逐渐整理并综合成他们的最终作品。在这个过程中,突出或选择特定内容的瞬间起到了关键的锚点作用,引导AI提供更相关的结果和上下文。这一路径需要让用户能够保存和查阅高亮内容的方法。

用户需要保存特定的高亮,并利用这些高亮提升他们的体验。这需要深入了解用户的成果和需求,并建立反馈机制来收集这些信息。

用户筛选过程表明,为了有效支持复杂的创意任务,生成式人工智能需要做到不仅理解,还需要预见用户与信息交互的细微方式。通过识别并响应这些“用户信号”,AI 工具可以提供更贴合用户需求的帮助,从而提升整体的用户体验和成果。

设计恰到好处的信任

虽然生成式人工智能已经让用户与技术的互动变得更加轻松,信任仍然是广泛采用的显著障碍。这一点在过去是真实的,现在依然如此。解决信任问题对新AI工具的推广和使用至关重要。

在众多框架中,有两个框架特别引人深思:[UTAUT 接受与使用技术统一理论(UTAUT,点击了解更多)] 和 [Fogg 的行为模型(FBM,点击了解更多)。

作为一个有用的简化说明:UTAUT 建议,使用意愿受到性能预期、努力期望、社会影响因素和便利性条件的影响。比如说,某个人可能会决定开始使用客户管理工具,因为他们相信它能有效帮助他们达成销售目标(性能预期),他们发现该应用程序直观易用(努力期望),他们的同事和导师也使用并推荐它(社会影响因素),并且他们的公司数据库可以通过该工具访问(便利性条件)。

一个平行的理论,FBM(注:全称为简化行为模型),将行为简化为动机、能力和触发因素的组合。例如,买咖啡是因为想要咖啡因,手里有钱且附近有咖啡店,再加上咖啡店的招牌作为提示。

生成式人工智能减少了实现结果所需的感知努力。据许多人反映,生成式人工智能帮助他们克服了激活惰性。然而,让用户尝试并持续参与,信任起着至关重要的作用。

在设计信任时,有许多类似上面提到的视角和框架。在这里我们将进一步简化这一概念,认为信任可以由以下因素形成:过往的经历、风险承受能力、互动的一致性程度以及社交环境。

之前的经验: 我们必须认识到用户是有背景的。他们带着由过往经验创造的上下文进入新的体验。为了影响这种信任的基础,我们只需遵循不重复造轮子这一原则。熟悉的界面和交互使用户能够将过去的信任转移到现在。在这样的信任基础上建设要比与之对抗容易得多。以对话式AI为例来说,与其让用户输入提示,我们可以通过利用对话中的潜意识模仿倾向来影响用户如何互动。

风险承受能力: 要理解用户希望避免负面结果,关键是了解他们不会承担哪些风险。我们可以通过提高透明度、强化用户控制、获取用户同意和确保合规性来影响风险承受能力。提高用户体验的质量可以利用美学可用性效应来降低用户的负面预期。但是,特定于产品的策略通常会更有效。例如,考虑一个用于医生诊断的对话式AI,其风险容忍度非常低。误诊将给医生和患者带来极其严重的后果。确保输出包含参考信息、提示解析和不同观点可以帮助降低风险。

交互一致性: 交互既是输出也是用户到达该输出的方式。用户不应该对不同的词语、情境或行为是否具有相同含义感到困惑。用户不应怀疑不同的词、情境或行动是否具有相同的含义。为了提高交互一致性,确保从布局到按钮文本的内部和外部一致性。在对话式AI的背景下,交互一致性可能表现为响应格式一致且对话中的词语含义相同。如果用户请求某个主题的摘要,不应在一次交互中显示为文章,另一次则显示为项目列表,除非用户特别要求。

社会层面: 可能是最显眼的一层。社会层面可以包括来自可信赖来源(如经理)的背书,或者在可信赖的网络(如连接预批准的企业软件)中提供支持。社会层面可以通过社会认同策略影响,并在互动中创造社会认同的契机。在内部数据库的LLM使用背景下,这可能意味着突出用户及其直接团队的成就。指出该系统能够访问内部数据,有助于进一步建立起信任,表明该系统在这个社交圈子里得到了认可。

在设计人工智能体验时,值得考虑哪些因素应首先关注。通过理解和设计这些信任因素,人工智能体验可以更好地符合用户的期望和需求,从而提高整体的采用率和接受度。解决信任问题不仅有益,而且对于生成式人工智能工具的未来整合和接受至关重要。

上下文生态系统

这篇文章涵盖了上下文捆绑、用户策划内容以及设计信任的新趋势。整体而言,生成式人工智能已经彻底改变了生产效率,通过降低普通用户开始任务的门槛,这就像图形用户界面(GUI)的发展历程一样,降低了用户的使用门槛,带来了好处。然而,现代用户体验已远远超越了窗口和指针的时代。那么,生成式人工智能的下一站又会是哪里呢?

GUI通过支持多个程序界面,促进了更深入和高效的用户交互。这使用户能够无缝切换在不同的任务之间——例如,在一款应用中做会计,在另一款应用中做演示报告。在不同上下文中进行管理和操作突显了将各种用户意图和应用程序连接起来所带来的生产力提升。

最近的例子包括 Edge、Chrome 和 Pixel 助手集成了 AI 功能,让用户可以利用生成式 AI 与软件互动。在这种情况下,LLM 不仅限于之前的对话窗口,它还能理解软件。

回望过去,我们看到了GUI如何为用户创造了一个可以创作的数字画布。比起物理世界,它的优势在于提高了效率,增强了扩展性,提升了生产力。生成式AI很有可能也会走上类似的途径,让AI成为我们的合作伙伴,让我们的日常生活变成一种共享体验。未来可能就是一个增强的生态系统了,在这个生态系统里,对话式和生成式AI工具将会连接起各种专门代理,形成一个连贯的工作流程。这种生态系统的方式会进一步加深与用户的互动,让使用体验更加集成和高效,在各种数字和现实环境中。

未来的趋势不仅仅是对话或陪伴体验。类似于我们今天所见,生成式AI将直接生成输出。目前用户与输出互动,但平台的创作者和所有者最终是AI。随着我们与以人类为中心的AI产品的成熟,下一步将是创造一个空间,让AI和用户可以共同工作。我们已经在类似Grammarly的老工具中看到过,在新兴的生成式工具如Github Copilot中也看到了。我们看到生成式AI作为助手与用户一起工作,用户最终创建并拥有他们的工作空间。随着我们的技术和舒适度不断提升,我们可能会看到生成式AI在管理我们日常生活的数字和物理方面(如物联网)中发挥更大的作用;不仅增强现实,还重新定义我们对生活和工作效率的看法。

生成式AI互动的发展正在重演人机交互的历史。随着我们创造更好的体验,让交互变得更简单并结合上下文,让用户定制体验,并扩展已有的生态系统,这将让生成式AI更值得信赖,更易获取和使用,对每个人都有益。

如果你有兴趣了解这个话题的话,这里有一些你可以进一步阅读的资源:

點擊查看更多內容
TA 點贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優質文章

正在加載中
  • 推薦
  • 評論
  • 收藏
  • 共同學習,寫下你的評論
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦
今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與 放棄機會
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

舉報

0/150
提交
取消