亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

為了賬號安全,請及時綁定郵箱和手機立即綁定

該用哪個AI代理框架呢?(CrewAI、LangGraph、Magentic-One還是純代碼實現)

随着大型语言模型的进步,现在人工智能模型能够通过推理来解决问题了。一开始我们觉得这些模型无法完成我们的工作,因为它们看起来像是搜索引擎的聊天机器人版本,我们能够用简单的推理欺骗这些模型,但这种情况越来越难以实现。如今这些大型语言模型不仅能通过步骤思考,还能完成比回答问题复杂得多的任务。

图1 AI代理框架图

大型语言模型是通过从前一个或多个标记预测下一个标记来进行训练的。标记可以是单词、字符或称为子词的字符组。基于这种结构,OpenAI 开发了名为 ChatGPT 的聊天机器人。该聊天机器人能够回答问题,并且由于它是在从互联网上抓取的海量数据集上进行训练的,所以它拥有广泛的知识。随着不断的改进,它的推理能力也越来越强,从而变得越来越好。于是,一个想法应运而生。如果我们给这样的大型语言模型提供工具,让它能够感知环境并采取行动来实现特定目标,将会怎样呢。这种结构被称为AI代理或AI智能体。

图2 AI代理的组成部分

Nvidia将AI代理定义为可以利用大型语言模型来分析和解决特定问题、制定解决该问题的计划,并在一系列工具的帮助下执行该计划的系统。AI代理的组件包括记忆、规划、提示词、知识库和工具。

1. 回忆:

  • 正如我们所知,代理程序完成复杂任务的方法是,首先将任务拆分成小任务,然后使用工具来完成这些小任务。为此,模型需要记住它之前的操作。

2. 计划:制定相关计划

  • 复杂的问题常常需要分步思考的方法。

III. 提示信息

  • 提示信息是告诉LLM它的目标、行为举止和行动计划的指示。

4. 知道.

  • 如果没有对该领域的了解,代理程序无法解决甚至理解任务。因此,要么让LLM具备该领域的知识,要么我们就开发一个可以从数据库中提取知识的工具。

5. 工具

  • 可执行的功能或服务、API,允许代理程序完成其任务。

但AI代理真正的力量在于不同代理之间的协作。这种结构被称为多代理系统。在这种系统中,就像一个团队,它包含具有特定技能和任务的多个成员。越具体的角色和目标,效率越高。代理人可以有不同的角色,每个角色都为团队的总体目标贡献自己的力量。

这张图片是由必应生成的

大型科技公司不断改进多模态和文本生成模型的发展,使得定制预训练模型变得既没有必要又过于昂贵。因此,未来不久,AI解决方案开发可能集中在三大重点领域。

  • 60% 流程设计
  • 35% 微调
  • 5% 提示工程(指语言模型中的提示工程方面)

尽管AI代理代表了人工智能社区的巅峰,它们最出色的表现是在每个代理被赋予特定角色并在明确的流程中运作。利用AI代理框架是最有效的实现这种结构化协作的方式。

许多框架已经出现,旨在让所有人都能轻松使用AI代理。在这篇文章里,我将介绍这些框架:crewAI、langgraph、autogen(majestic的一个扩展插件),最后我们将看看如何不借助任何框架来构建一个代理。

1. CrewAI

crewAI 是由 João Moura 创建的开源多代理编排框架。这个基于 Python 的框架利用具有特定角色的自主的 AI 代理,协同工作作为一个紧密协作的“团队”来执行任务。

crewAI 的口号是:“数小时内成为多代理专家高手”。它是最易上手的框架。这样做有利有弊。由于是高层次框架,构建总体结构变得容易得多。另一方面,不了解框架内部运作,调整流程变得更难,可能的问题也更难发现和解决。

使用crewAI框架创建一个智能代理需要四个属性。

  • 角色

定义船员在船员队伍中的角色职能。

  • 目的 (目标在这里可能指的是目的或目标,具体取决于上下文)

代理人希望达到的个人目标

  • 背景

解释代理人角色和目标的背景,丰富互动与合作的方式。

  • 工具

代理可以利用的一系列能力和功能,用于完成任务。

使用CrewAI框架,只需输入几行简单代码就能快速启动代理。非常适合初学者和想要快速完成任务的人,无需复杂的设置过程。

CrewAI,一个可扩展的数据驱动框架,在处理大规模系统方面表现出色,并提供了一个便于与现有系统轻松集成的简单API。它还支持可部署在云平台上(如AWSAzure),但对自定义模型的支持有限,这对于必须与开源模型合作的公司来说非常重要,且相比之下,它在灵活性方面不及Autogen。另一个缺点是它不支持流式功能调用,这可能是一个大问题。

2. LangGraph**[注:LangGraph为特定技术领域中的专有名词,此处保留原文。]**

或者:

2. LangGraph**[注:LangGraph是一种特定的技术术语,此处保留原文以保持一致性。]**

LangGraph 是一个基于 Langchain 库构建的框架,利用其中的各种功能和工具。LangGraph 使用图(graphs)来创建多代理或单代理结构。图表示架构的整体流程走向。LangGraph 是一个工具,用于通过创建组件间交互的图状表示来可视化和管理涉及语言模型的复杂关系和工作流。

图3 代理图

与crewAI相比,LangGraph是一个相对底层的框架。因此它比crewAI更难实现。但是,底层结构让我们能够调整流程并生成更复杂的流程,以满足我们的工作需求。尽管该框架以其易用性、可扩展性以及与TensorFlow、PyTorch和Keras等流行AI库的集成而闻名,它对亚马逊、Azure等分布式系统的支持相对有限。

LangGraph 还提供了 LangSmith,用于监控您的 LLM。使用 LangSmith,您可以监控您的代理生成的内容及其路线规划。实现起来非常简单。只需将您的 LangSmith API 密钥添加到环境配置中,即可监控您图中的所有输入和输出情况。但请注意,这些监控数据会被存储在互联网上,对于某些用例可能不可行。对于这些用例,您可以选择更复杂的 LangFuse。

图4 LangSmith监控图像

3. 自动生成器之一

AutoGen 是由微软开发的一个框架,而 Magnetic-one 是 AutoGen 最新发布的扩展。它具有一个 Orchestrator,负责任务规划和协调四个专门代理:WebSurfer、FileSurfer、Coder 和 ComputerTerminal。通过这些代理的协作,可以完成 IT 行业中的各种任务。

图5:Magentic-One 代理程序

磁性一包括如下成员:

  • 调度器:主要负责任务分解、规划、指导其他代理执行子任务、监控整体进度并在必要时采取纠正措施的代理。
  • WebSurfer:一个基于LLM的代理,擅长指挥和管理基于Chromium的网络浏览器的状态。对于每个请求,WebSurfer执行诸如访问网址、进行搜索、与网页互动(如点击、输入)、读取操作(如总结、回答问题)等操作,然后报告网页的新状态。WebSurfer依靠浏览器的无障碍树和标记集提示信息来完成其任务。
  • FileSurfer:一个基于LLM的代理,它可以通过Markdown格式的文件预览应用程序读取本地文件内容,还可以执行常见的导航任务,如列出目录内容并浏览它们。
  • Coder:一个基于LLM的代理,专门从事编写代码、分析从其他代理收集的信息并创建新成果。
  • ComputerTerminal:提供访问控制台 shell 来执行程序并安装新库。

Magentic-One 是模块化且灵活的,支持各种语言模型的轻松集成。该系统在像 GAIA、AssistantBench 和 WebArena 这样的基准测试中表现出色,无需对核心进行修改。例如,GAIA 包含超过 450 个非平凡的问题,每个问题都有明确的答案,需要不同程度的工具和自主程度来解决。该框架还包括针对危险自主行为的安全措施。

图 6 GAIA 排行榜

尽管所有代理默认使用的是多模态大模型GPT-4o,但Magentic-One不依赖特定模型,允许集成不同的大模型以支持不同的功能或满足不同的预算需求。可以集成不同的大模型,但出于显而易见的原因,我们强烈建议使用强大的推理模型。

4. 纯净代码代理

来自 Giphy 的动图

最终的方法是完全从头开始构建纯代码代理,完全不使用任何框架。这种做法提供了高度的定制化,特别是在简单的流程中尤其明显。然而,随着流程复杂性的增加,实现起来会变得极其困难。从零开始构建可能是一个很好的学习机会,但是它非常耗时,并且在出现问题时,将不会有社区支持。

最后的比较

从各种渠道来看,每个框架似乎都有自己的优势。

· 对于软件开发:LangGraph,非常适合用于代码生成和复杂多代理编码工作流程的场景。

· 最适合初学者:CrewAI—易于使用,非常适合AI新手,无需复杂的设置。

· 最适合处理复杂任务:LangGraph — 非常灵活,专为有经验的用户打造,支持自定义逻辑和流程编排。

· 开源LLM:LangGraph — 与开源LLM集成良好,并支持多种API,不像某些框架那样有那么多限制。像CrewAI这样的也可以。

· 最好的社区支持: AutoGen 的社区支持帮助您解决一些不太常见问题。

· 从单词开始:CrewAI——设置快捷且直观,适合演示或需要快速创建代理角色的任务。Magentic-One 也不错,但社区支持不够。

· 成本效益高:Magentic-One — 自带预装配置和通用方法,可能帮助您节省初期投入。

来源

[1] 关于LLM Agents的介绍,https://developer.nvidia.com/blog/introduction-to-llm-agents/

[2] CrewAI主页,https://www.crewai.com/

[3] 什么是crewAI? https://www.ibm.com/think/topics/crew-ai

[4] 关于多智能体系统开发的LangGraph、Autogen 和 Crewai 的比较研究,https://medium.com/@manasabrao2020/comparative-study-of-langgraph-autogen-and-crewai-for-development-of-multi-agent-system-detailed-2aa8ebdc8e88

[5] Magentic-One、AutoGen、LangGraph、CrewAI 和 OpenAI Swarm:哪个多 AI 代理平台最好?https://medium.com/data-science-in-your-pocket/magentic-one-autogen-langgraph-crewai-or-openai-swarm-which-multi-ai-agent-framework-is-best-6629d8bd9509

[6] AI 代理框架文章,https://medium.com/@ga3435/ai-代理框架-2022fe43e78a

[7] 一篇比较研究:LangGraph、Autogen 和 CrewAI 构建多代理系统,https://pratikbarjatya.medium.com/comparative-study-of-langgraph-autogen-and-crewai-for-building-multi-agent-systems-0e7e47f9078e

[8] LangGraph 主页 (网站),https://www.langchain.com/langgraph

[9] LangSmith 主页,https://www.langchain.com/langsmith

第10点,比较定制代码代理和基于框架的方法,点击这里阅读更多:https://timothy-urista.medium.com/comparing-bespoke-code-agents-and-framework-based-approaches-92bb609ab711

磁单极子:一个通用多智能体系统,用于解决复杂任务,https://www.microsoft.com/en-us/research/articles/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks/

[12] LLM代理是什么,它是如何工作的?,这篇文章https://medium.com/@aydinKerem/what-is-an-llm-agent-and-how-does-it-work-1d4d9e4381ca

[13] GAIA排行榜页面,https://gaia-benchmark-leaderboard.hf.space/

【14】2024 年构建 AI 代理的五大框架,https://www.analyticsvidhya.com/blog/2024/07/ai-agent-frameworks/

[15] 2024年6月最流行的AI代理平台快速回顾,https://medium.com/@ceo_44783/a-quick-review-of-the-most-popular-ai-agent-frameworks-june-2024-ce53c0ef809a

[16] 探索 LangChain、LangGraph 和 Crew AI:革新语言模型及团队效率的工具,https://medium.com/@maheshhkanagavell/exploring-langchain-langgraph-and-crew-ai-tools-to-revolutionize-language-models-and-team-71cb80a15e63

[17] 微软的Magnetic-One:新的多AI代理框架,https://medium.com/data-science-in-your-pocket/microsoft-magnetic-one-new-multi-ai-agent-framework-7fd151b81cd7

[18] LangGraph- 使用 LangGraph 创建由 LLM 驱动的 AI 代理,https://www.udemy.com/course/langgraph/?couponCode=LETSLEARNNOW

點擊查看更多內容
TA 點贊

若覺得本文不錯,就分享一下吧!

評論

作者其他優質文章

正在加載中
  • 推薦
  • 評論
  • 收藏
  • 共同學習,寫下你的評論
感謝您的支持,我會繼續努力的~
掃碼打賞,你說多少就多少
贊賞金額會直接到老師賬戶
支付方式
打開微信掃一掃,即可進行掃碼打賞哦
今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與 放棄機會
微信客服

購課補貼
聯系客服咨詢優惠詳情

幫助反饋 APP下載

慕課網APP
您的移動學習伙伴

公眾號

掃描二維碼
關注慕課網微信公眾號

舉報

0/150
提交
取消