亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

為什么我們對AI的使用存在缺陷。以及AI工作者如何提供幫助。

AI工作者将生成式AI从玩具和小众应用转变为真正的生产力工具。让我们更仔细地看看这些流程及其应用。这可能会彻底改变我们的商业模式。
CEO来信

今年一月,全球最大的公司的首席执行官们在达沃斯会面。这些领导者反复提到的一个关键短语是:在2024年,我们不仅仅会讨论AI,而是最终实施具有真正影响力的平台:这些AI平台将从根本上改变我们工作的方式、进行研究的方式、提供客户服务的方式以及创造收入的方式。几乎每位领导者都承诺在2024年进行大规模投资。

现在,我们的2024年已经不再那么年轻了。无论如何,它已经成长到能够看到自己在AI方面所取得的成就:

嗯。呃。啊哈。除了科技公司之外,还没有发生太多事情。

当然,当然,每个人甚至他们的妈妈都用ChatGPT等工具来写信、文章、帖子、Python函数,甚至生成图片和视频。此外,还有成千上万的新聊天机器人被用于客户服务。所有这些都有潜力提高生产力。

这么说,可能提高3%。甚至可能是5%。在整个经济中。

很好。很好。真的很好。

但远非一场变革。

为什么呢?为什么AI没有产生显著的影响?

因为AI尚不成熟?

不!因为我们还没有准备好。

我们用错了!

上述提到的两个大型工作申请领域(日常助手和一级支持)确实很酷,甚至很重要,但它们不会从根本上改变我们的商业模式。

AI动物园里的狮子王

让我们回顾一下基于AI的系统在白领任务中的发展历程,看看它们能做些什么。

AI工人和AI系统的timeline。图片 credit: Maximilian Vogel

简短说明一下传统的、基于意图匹配的对话AI系统。尽管这些系统仍在使用,但现在已经不再被开发了。这些是老式的助手,通常无法理解你,因为它们基本上需要人类为每个问题和答案编写脚本。人们会在电话中对它们大喊大叫,并在车里威胁它们进行性暴力。这些是最差的聊天机器人。真的。

当谈到生成式AI(genAI)系统时,许多系统现在只能作为增强型生成式AI(augmented genAI)提供——因为纯生成式AI系统由于自身的问题已经被排除在相关应用的候选名单之外。增强型生成式AI系统可以利用幻觉控制和RAG(检索增强生成)基于文档、数据库和API可靠地回答用户的问题。我自己也帮助开发了一些这样的系统:它们非常出色。至少目前是这样。

一个虽小但决定性的限制在于增强型生成AI系统:它们只能解决一些小任务:回答用户查询、分类和提取文档、撰写答案等,所有上述提到的零工任务。

我们大多数白领工作者的工作方式不同:我们会在一项任务上工作数小时、数天、数周,有时甚至是数年。 我们能够通过相对复杂且多层次的流程来达到结果。我们习惯了等待客户的回复或领导的决策,然后将这些新信息无缝地整合到任务中。我们的任务不是“回答用户的问题”,而是:

  • 教四年级代数
  • 在法庭上为一名事故司机辩护
  • 为一种新产品策划并执行市场推广活动
  • 优化我们食品部门的物流流程
  • 对一个网站进行视觉和内容更新
  • 处理所有进来的保险索赔
  • 减少我们办公室照明的能耗
  • 为一份复杂的RFQ编写报价单

所有这些流程只能通过一系列由信息分类、提取和生成组成的单独活动来实现。这时,代理型AI就派上用场了。从原则上讲,我们谈论的是能够通过多个步骤实现目标的代理。它们可以等待数天,仍然保持案件的最新状态。它们可以与各种技术和人类的对应方进行沟通并检索数据。

传统生成式AI与代理式AI。图片提供:Maximilian Vogel。

草虫与蚂蚁:第一代AI代理与AI工作者

当然,代理型AI(Agentic AI)并非只有一种形式,而是有多种。在这里,我将重点介绍其中两种最突出和最重要的形式:

1) 跳蚤(ReAct代理): 第一代AI代理,被称为ReAct代理,在任务处理上完全自由。你可以几乎问它们任何问题。它们首先为特定任务制定计划(例如“阻止气候变化”,“毁灭世界”,“计划去新加坡的商务旅行”),然后自行执行各个步骤(例如航班计划或晚上安排),这些步骤包括模型查询、API查询、网络搜索,以获取或生成所需的数据。这个想法真的很酷,非常接近AGI(通用人工智能)。

2) 蚂蚁。 我们将这种形式称为 AI 工人AI 工人 相比代理来说,面临的问题和解决方案空间要小得多。 例如,一个工人可以通过与承运商沟通来找到丢失的货物,但不会发布招聘广告并评估申请人。另一个工人则可以专门做后者。它们是专门化的。它们遵循产品所有者发布的预定义计划,不会不断自行制定解决问题的计划。这为它们提供了一种框架,一种类似外骨骼的支持结构。处理过程可以在这种框架内进行。

乍一看,蚱蜢比蚂蚁更令人着迷。但仅仅是一时的:令人遗憾的是,ReAct 代理根本不起作用。除了可能有趣的测试案例外,它们几乎没有任何有意义的结果。其中一个原因可能是它们在处理各个步骤时会累积越来越大的错误。因此,目前第一代自由AI代理在模型中就像GPT-2的代理版本一样。你不能真正将这种技术用于商业应用。但GPT-2之后是GPT-3。也许我们可以通过完整的代理工作流实现反向传播。这可以使工作流的创建成为可以训练的任务。我计划在2025年底实现。

传统代理型AI vs. AI工人。图片提供:Maximilian Vogel

一个AI工人是如何工作的?

疯狂的是:AI 工人就像专业的白领工作人员一样工作。

假设一位客户向我们提交了保险索赔:“你好,我们家发生了大雨事件:一楼的部分区域已经被洪水淹没并损坏。这里……”AI 工作者并不会思考如何最好地解决这个问题。相反,他严格遵循一个预定义的流程:

  • 他阅读客户邮件,查看附件,如发票和损坏图片。
  • 他创建一个索赔。
  • 他检查是否是重复索赔。
  • 他检查客户是否在他所在的保险公司投保。
  • 他们的保险政策是什么。

等等,大约15到20个步骤。

每个任务包含3到5个子步骤。工人严格按照公司的指示进行操作。在评估文档、提取信息、分类和评估等各个子步骤中,他会运用自己的智能。整个流程对他来说始终是一样的。他只是一个工人。

现在你可能会觉得……这太无聊了! AI 可以更具创意。并且考虑它自己如何解决问题。当然,它可以这样做。但这正是在大多数情况下我们不需要和不希望看到的,甚至对于人类文员也是如此。

我们希望保险公司的员工和AI工作者能够根据定义清晰的规则行事,因为这样……

  1. 我们依照合同和规定行事。
  2. 我们尽量避免或减少客户的投诉。
  3. 我们节省资金,并仅对合理的索赔进行赔偿。
  4. 我们有一个一致的、可重复的、可验证的过程,可以由软件支持。

AI工人的作用不是在于它能更好地或更具创意地解决问题,而是更加可靠(没有拼写错误或转录错误),而且最重要的是,速度快得多、成本低得多。

而这正是我们70%的白领工作实际上是如何运作的:我们解决问题,但不会为每个案例重新发明问题解决过程:我们遵循课程、程序指令、开发模型、操作说明、法律法规。我们将这些应用到具体的案例中。而这正是AI工作者能为我们做的事情。速度比人类快100倍。

AI工作者的构成

一个AI工人是什么样的?一个AI工人可以经历任何长度的过程链,包括各个步骤和子步骤。他可以根据特定的输入数据和分类选择特定的流程,例如,如果需要,可以向客户请求缺失的数据,否则跳过此步骤并直接处理。

保险索赔处理中的AI工作者。图片提供:Maximilian Vogel

一个步骤通常看起来是这样的:AI提取数据(或根据文本或图像输入生成数据),对信息或案例进行分类或评估特定问题的数据。然后根据分类选择处理通道,这通常最初由确定性过程主导:读取、写入、计算数据等。在某些点,AI再次发挥作用,从文档中提取陈述,评估内容等。

代理型AI:AI工作者如何处理任务。图片提供:Maximilian Vogel

幻觉控制: AI 工人的一个重要成就就是幻觉控制。在某些情况下——即使输入会触发这种情况——我们也必须确保模型不会产生幻觉。产生幻觉意味着给出完全荒谬和意想不到的答案——例如,向投保人承诺会解决他的索赔问题,不管他的保单是否一切正常,也不管他是否能正确地证明一切。

我们通过在过程中使用AI或确定性方法生成分类和值(如损失金额、覆盖范围等)来实现幻觉控制。然而,我们不希望模型直接向保单持有人写最终通知,而是基于模板库确定性地生成通知:选择一个模板并用过程中获得的值填充它。

这里也可能有反对意见:听起来又很无聊,模型自己也能写邮件。类似之前的回答:当然可以,但我们不希望那样。我们希望它无聊且安全。 大型保险公司中的保险代理人员也使用模板为客户提供适当的理由充分、正确且符合法律规定的答案。

好的,那怎么实现呢?

构建一个AI工作者并不难。现在有很多框架可供你构建应用程序:它们从不同的角度应对这一挑战:

AI 工人作为代码
Langchain (LangGraph)LlamaIndex (工作流)AutogenCrew AIHaystack (代理) 是一些框架,允许以结构化的方式构建和控制代理型AI。这些框架在功能范围和复杂性方面差异很大。当然,你始终需要查看是否为真正想要实现的功能购买了过多的开销。

关键功能包括:

  • 分支和循环
  • 持久性和状态保持,暂停和恢复
  • 人机协作
  • 工作流调试
  • 流式处理包括令牌流式处理

LlamaIndex 工作流。图片来源:LlamaIndex

进一步阅读以探索这些框架:LangGraph vs. Autogen vs. Crew AI

AI 工作者作为基础设施
主要云服务提供商的基础设施组件,例如 AWS Step FunctionsAzure Logic Apps,采取了完全不同的方法。AWS Step Functions 是用于 Lambda 函数的可视化工作流服务,而 Azure Logic Apps 是微软生态系统中的类似工具。

在这里,工人基础设施的组件可以被有效地链接和编排,以事件驱动的方式运行。原则上,工人组件被部署到单独的虚拟基础设施实例中,并通过条件连接进行链接。

AWS Step Functions。图片来源:Amazon

对比 一步函数和逻辑应用。

AI 工作者作为提示和响应:函数调用
OpenAI 的函数调用将模型、工具和系统连接起来。本质上,你可以向模型提供函数,并接收回选定的(即预测的)函数和参数。这种方法与上述方法类似,但方向相反。在这里,模型决定工作流程。其他主要的模型提供商(如 MetaMistralGoogle)也采用了类似的方法。

DIY AI工人
如果你有一个好的Python开发者和一个不错的提示工程师,你也可以自己把所有东西组合起来:你将原始数据输入到提示模板中,然后传递给模型,模型会返回一个包含结构化数据的JSON。这个结构化数据用于工作流控制和数据处理。

从开发模型的角度来看,通常将模型调用视为一个复杂的函数调用,在这种调用中,您将提示模板的数据作为参数传递,并获得一个结构化的数据对象作为返回值。

基于Python和提示模板DIY AI工人。图片提供:Maximilian Vogel

AI工人的应用领域有哪些?

与传统的聊天机器人或其他传统的生成式AI应用相比,AI工作者可以应用于更广泛的应用场景。 当前,这仍然局限于白领工作。并且局限于具有结构化处理流程的工作。

然而,这影响了大量工作岗位。高盛去年预测,在工业化国家中,有3亿个工作岗位会受到GenAI的影响,这可以被视为一个较低的估计。实际上,全球受此影响的工作岗位数量可能接近5亿到10亿,影响往往相当显著。

我们将看到生产效率大幅提高,工作重心也将从常规任务转向开发、监控以及与AI工作者的互动等领域。

下图中举例说明了几个实例。

AI工人的应用领域。图片提供:BIG PICTURE

我亲爱的各位AI爱好者,我非常兴奋地期待着agentic AI领域将如何继续发展。如果你知道一个前沿的agentic AI实现,请在评论区留下链接。

非常感谢 Kirsten Küppers 对本文的启发和支持!

关注我在 Medium (⇈) 或 LinkedIn 获取有关生成式 AI、AI 工人和提示工程的更新和新故事。

點擊查看更多內容
TA 點贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優質文章

正在加載中
  • 推薦
  • 評論
  • 收藏
  • 共同學習,寫下你的評論
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦
今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與 放棄機會
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

舉報

0/150
提交
取消