AI短期内不会衰退,尤其是因为有像GPT-4o和Claude这样的免费且强大的LLM。
许多初创公司已经在使用它来构建酷炫的产品并吸引庞大的受众。
今天,我将介绍17个在发布后走红的强大LLM工具。这些示例可能会给你自己的项目带来一些灵感。
让我们开始吧。
顺便说一下,我是Latitude的一部分,我们正在构建一个开源的提示工程平台。你可以查看我们的公共GitHup仓库。
你可以做很多酷炫的事情,比如:
⚡ 在平台上创建并迭代提示。
⚡ 运行评估以检查您的提示与大语言模型的配合情况。
⚡ 自动优化基于大语言模型的功能的输出。
我非常有信心,你一定会喜欢它的!
1. GPT Crawler - 从 URL 创建你自己的自定义 GPT。
使用 GPT Crawler,你可以爬取任何网站以生成知识文件,从而从一个或多个 URL 创建你自己的自定义 GPT。
目标是使文档网站变得互动,人们可以更简单地通过聊天界面找到他们想要的答案。
观看这个快速演示!
您需要配置爬虫,然后只需运行它。爬取完成后,您将获得一个新的 output.json
文件,该文件包含了所有爬取页面的标题、URL 和提取的文本。
你现在可以直接上传到ChatGPT,通过创建一个新的GPT。上传完成后,这个GPT助手将拥有所有文档中的信息,并能够回答关于它们的无限问题。
它正式成为ChatGPT中的助手。
如果你想知道 Mitosis 是如何编译这些组件的,那就看看这个快速教程。
他们在GitHub上有18.4k星。
2. Personal AI - 你的专属甜心AI。
PI 是一个由 Inflection AI 创建的 AI 聊天机器人,旨在提供有用、有趣且引人入胜的对话。我非常喜欢它的引导部分!
我用过GPT和Gemini,但Pi似乎更像人类。你可以和Pi聊关于它自己以及生活中的一般话题,就像和朋友聊天一样。
你也可以让它用语音传达。我喜欢它的原因是它的用户界面非常简洁,感觉很平静,你可以做各种各样的事情。
他们还提供一个桌面应用,可以免费下载。
你可以观看视频(AI语音)。
它不是开源的,但功能非常强大。
3. Vanna - 与您的SQL数据库聊天。
Vanna 是一个 MIT 许可的开源 Python RAG(检索增强生成)框架,用于生成 SQL。
基本上,它是一个Python包,使用检索增强来帮助你使用LLMs为数据库生成准确的SQL查询。
它非常适合像我这样的开发者,我们不太喜欢写SQL查询!
Vanna 的工作分为两个简单的步骤——首先在你的数据上训练一个 RAG 模型
,然后提问以获取可以自动运行在数据库上的 SQL 查询。
你不需要知道这一切是如何运作的就能使用它。
你只需要 训练
一个模型,该模型存储一些元数据,然后用它来 提问
。
使用以下命令开始。
pip install vanna
进入全屏模式 退出全屏模式
为了方便一点,他们构建了用户界面,你可以将其作为自定义界面的起点。查找所有 接口,包括 Jupyter Notebook 和 Flask。
你可以阅读Vanna文档,如果你想了解训练后的运行情况,可以尝试这个Colab笔记本。
观看此 演示 以了解完整操作流程!
他们在 GitHub 上有 9.5k+ 星,并且是用 Python 构建的。
4. AI Dungeon - 你来指导的文字冒险游戏,而AI让它栩栩如生。
AI Dungeon 是我迄今为止看到的最酷的大型语言模型应用场景之一。它很有创意,也有很多选项。
他们只专注于冒险,因此没有规则或目标。
AI Dungeon 是一个基于文本的、由 AI 生成的奇幻模拟游戏,充满了无限可能。与大多数由游戏设计师创造世界的传统游戏不同,在 AI Dungeon 中,你可以引导 AI 为你的人物创造世界、角色和场景。
观看官方预告片 :)
你可以带领军队抵抗外星人的入侵,或者成为一名酷炫的侦探调查女王被暗杀的案件。
你可以在 play.aidungeon.com/discover 发现 200 多个可玩的场景。
如果你不知道,场景基本上是玩家可以用来开始新冒险的模板。
你可以根据你的选择来过滤它们,比如选择可玩/可读的、多项选择的或第三人称的等等。
他们创建了一个完整指南来回答你所有的疑问。
你可以在 platstore 和 苹果商店 找到官方应用。它们的下载量超过100万次,这使得它们非常可信。
你甚至可以使用像 Sora (即将推出) 这样的工具来改进这一点。
它们不是开源的,但值得一看。
5. Chat2DB - 由AI驱动的数据管理平台。
Chat2DB 是一个以 AI 为主的数据库管理、开发和分析工具。
它的核心是AIGC(人工智能生成代码),可以将自然语言转化为SQL,将SQL转化为自然语言,并自动生成报告,将效率提升到另一个层次。
即使不了解SQL的人也可以使用它快速查询业务数据并生成报告。
例如,在你进行数据库开发时,它可以帮助你直接用自然语言生成SQL语句,提供SQL优化建议,分析SQL性能,生成SQL执行计划,还可以帮助你快速生成SQL测试数据、系统代码等。虽然术语很多,但实际上非常强大 :)
它们对多数据源支持非常好,可以轻松集成包括 PostgreSQL、MySQL、MongoDB 和 Redis 在内的多达 17 种不同的数据库类型。
你可以下载或在线试用。
让我们看看一些令人兴奋的功能:
⚡ 智能报告。
⚡ 数据探索。
⚡ SQL 开发。
你可以阅读官方文档中的快速入门指南。
他们在 GitHub 上有 14k+ 星,并且发布了 v3.2
版本。
6. Mem - 魔法笔记应用。
Mem 是一个帮助你保持条理的AI笔记应用。
你可以使用他们的AI助手来总结见解或根据他们的笔记起草内容。还有一个自动标签的概念。
它不是免费的(这是一个重大缺点),但你可以填写表格来获取大幅折扣。
这是仪表板的外观。搜索功能非常方便,还有很多有用的特性。
让我们看看还能用 Mem 做些什么。
⚡ 你可以使用 Mem Chat,通过深入理解你的笔记来撰写内容。
⚡ 你可以使用AI来创建新的收藏夹。
⚡ 你可以从你喜欢的应用中挑选东西。
⚡ 搜索超出你的关键词。
我已经附上了一个教程来帮助你了解如何使用Mem。
它不是开源的,但你可以在他们的博客上找到所有内容。
7. Character AI - 与AI角色聊天,就像与真人对话一样。
Character AI 是一个全栈人工智能工具,让用户通过与AI角色互动来自定义体验。
你可以像与真人交流一样与这些虚拟角色聊天。
有许多过滤器和人物角色可以尝试。他们的社区非常庞大,拥有大约30万+成员。
你可以创建一个简单的角色。
当然,如果现有的角色不符合你的要求,也可以添加一个自定义的角色。
我找到了一个有趣的官方幕后视频给你看。
你应该自己探索一下,以获得整体概念。
它不是开源的。
8. Prompt Perfect - 优化您的提示。
这是一个优化提示的工具。使用大语言模型来优化将再次用于大语言模型的输入,这挺酷的。
PromptPerfect 是一个提示优化工具,旨在提升大型语言模型和大型模型结果的质量。使用 PromptPerfect 时,你需要输入一个提示并根据需要自定义各种设置。
这些设置包括最大提示长度、优化的迭代次数以及输出质量。如果你使用像GPT-4、Claude和Midjourney这样的模型,这会非常有用。
一些令人兴奋的功能包括:
⚡ 自动调音的概念。
⚡ 转换为精确的提示。
⚡ 根据你的目标受众来改进内容。
⚡ 同时制作图像。
你可以做很多事情。只需探索所有功能。
它有一个每天10次请求的免费计划,但不是开源的。
9. Heygen - 使用AI创建酷炫的视频。
使用 Heygen,你可以快速从文本生成制作完成的视频,只需几秒钟,即可生成由 AI 生成的头像和语音。
HeyGen 可以做多种与视频生成相关的事情,并且在视频制作领域的生成式AI方面处于领先地位。因此,它拥有一个出色的AI头像生成器、基于AI的文本转语音功能和AI语音克隆工具。这些工具被整合到一个简洁的用户界面中,让创作者能够更高效地完成更多工作。
它通过三个简单的步骤完成。
观看快速演示!
它存在于很多语言中。
他们还提供了 ChatGPT 脚本编写器,你可以使用它来更快地创建视频。
他们最近获得了6000万美元的融资,所以发展很快。
它们不是开源的,但绝对值得一看。
10. Micro Agent - 一个能为你编写(真正有用的)代码的AI代理。
类似于GitHub Copilot和ChatGPT这样的AI辅助编码工具并不能生成非常可靠的代码,它们往往在出厂设置下无法正常工作,你可能会发现其中存在bug、边缘情况,甚至会引用不存在的API。
这可能导致一个令人沮丧的循环:尝试生成的代码,发现问题,回到AI寻求修复,然后重复这个过程。
调试所花费的时间可能会抵消最初使用AI工具节省的全部时间。
Micro Agent 使用 AI 来缓解不可靠代码生成的问题。
给它一个提示,它会生成一个测试,然后迭代代码直到所有测试用例通过。
你可以使用以下命令进行安装。
npm install -g @builder.io/micro-agent
# 接下来,在提示时设置你的 OpenAI API 密钥,或者使用以下命令手动设置。
micro-agent config set OPENAI_KEY=<你的 token>
# 然后你可以运行以下命令开始一个新的编码任务
micro-agent
进入全屏模式 退出全屏模式
Micro Agent 会提示你描述你想要的功能,生成测试,并开始用你偏好的语言编写代码以通过这些测试。一旦所有测试都通过了,你将拥一个功能完整且有测试支持的功能,可以立即使用。
让我们来看看一些最令人惊叹的应用场景:
⚡ 30秒演示 Micro Agent 为一个将字符串数组中的字母异位词分组的 TypeScript 函数生成测试和代码。
⚡ 使用 Micro Agent 生成一个简单的 HTML 到 AST 解析器(这在两次迭代中就实现了)。
⚡ 单元测试匹配。
⚡ 视觉匹配(实验性)。
⚡ 与 Figma 集成。
Micro Agent 还可以与 Visual Copilot 集成,直接连接到 Figma,以确保设计到代码的最高保真度!
视觉副驾直接连接到Figma,协助进行像素完美的转换,精确的设计令牌映射,以及在生成的输出中精确使用您的组件。
然后,Micro Agent 可以使用 Visual Copilot 的输出,对代码进行最终调整,以确保它通过 TSC、lint、测试,并完全符合你的设计,包括最终的微调。很神奇吧 :)
你可以阅读 文档 和 官方博客,在那里团队讨论了关于微代理的方方面面。
它是开源的,在GitHub上有2.1千颗星。
11. EditGPT - 使用强大的AI编辑器改进您的写作。
EditGPT 帮助你用强大的AI编辑器校对、编辑和改进你的写作。
还有一个 EditGPT 插件可以直接在 ChatGPT 网站上使用。它让你看到你的输入和 ChatGPT 输出之间的差异。
这个过程不允许你直接编辑文本,如果你想要重新提交你不满意的部分会有点麻烦。新的编辑器允许你直接编辑文本,甚至可以保存你的提示。
有很多选项可以让你的消息表达得更清楚。
有一个免费层级,每月提供10k字,但每次请求限制为1k字。
它不是开源的,但支持20多种语言。
12. Fireflies - 自动化你的会议记录。
作为一名开发者,我并不喜欢开会,但如果你参加的会议太多,那么这正适合你!
Fireflies 帮助您的团队转录、总结、搜索和分析语音对话。自动化您的会议记录!
观看这个快速演示!
它们提供了大量的实用功能:
⚡ 自动获取会议纪要、行动项和 transcripts。
⚡ 使用AI驱动的搜索查找任何内容。
⚡ 与你的同事合作。
⚡ 从会议中自动化工作流程。
⚡ 一个实时的知识库,供整个团队使用
此外,你可以通过多种方式捕获并转录会议。
有很多功能,但AI相关的功能仅包含在高级计划中。
好的一点是他们的计划很实惠,并且提供一个免费层级的计划,包含800分钟/存储,这已经足够用了。
13. Web ChatGPT - 具有互联网访问权限的 ChatGPT。
这导致通过网络浏览为ChatGPT生成的相关网页搜索结果提示。这意味着它会将相关网页结果添加到您给ChatGPT的提示中,以实现更准确和及时的对话。
你可以在 Chrome、Edge 和 Firefox 上找到该扩展。
观看快速演示!
它拥有超过150万用户,原因在于三个简单的功能:
⚡ 获取你查询的网页结果。
⚡ 还提供一个免费的一键式 ChatGPT 提示库,包含数百个高质量的提示。
⚡ 使用 ChatGPT、Claude、Bard 和 Bing AI,在搜索结果旁边获取由 AI 驱动的搜索答案。
它不是开源的,但有一个很好的应用场景。
14. Private GPT - 无需互联网即可对您的文档提问。
PrivateGPT 是一个生产就绪的AI项目,允许你使用大型语言模型(LLM)的力量询问关于你的文档的问题,甚至在没有互联网连接的场景下也能使用。
100% 私密,意味着数据在任何情况下都不会离开你的执行环境。
API 分为两个逻辑块:
a. 高级API,它抽象了RAG(检索增强生成)管道实现的所有复杂性:
- 文档摄入:内部管理文档解析、拆分、元数据提取、嵌入生成和存储。
- 使用摄入文档的上下文进行聊天和完成:抽象上下文的检索、提示工程和响应生成。
b. 低级API,允许高级用户实现其复杂的管道:
- 嵌入生成:基于一段文本。
- 上下文片段检索:给定一个查询,返回从已摄入文档中最相关的文本片段。
你可以阅读安装指南开始使用。
PrivateGPT 现在正在发展成为通向生成式AI模型和基础组件的门户,包括完成、文档导入、RAG管道和其他低级构建块。
他们在 GitHub 上有 53k+ 星,并且发展迅速。
15. Perplexica - 搭载AI的搜索引擎。
你肯定在你的旅程中听说过Perplexity AI,Perplexica是它的开源替代品!
Perplexica 是一个由人工智能驱动的搜索工具或搜索引擎,它深入互联网寻找答案。它不仅搜索网络,还能理解你的问题。
它使用先进的机器学习算法,如相似性搜索和嵌入,来优化结果,并提供引用来源的清晰答案。
使用 SearxNG 保持最新并完全开源,Perplexica 确保你始终获得最新信息而不损害你的隐私。
如果你想知道架构方面的内容,可以阅读关于关键组件的介绍。
我也推荐阅读这些组件如何协同工作的更详细的解释:如何这些组件协同工作。他们通过一个用户提问的例子来清晰地解释:空调是如何工作的?
。
一些功能包括:
⚡ 一些搜索工具可能会提供过时的信息,因为它们使用爬虫抓取的数据转换成嵌入式数据并存储在索引中。与它们不同,Perplexica 使用 SearxNG 这个元搜索引擎来获取结果,并重新排序以获取最相关的来源,确保你始终获得最新的信息,而无需每天更新数据的负担。
⚡ 你可以使用 Ollama 来利用本地的大语言模型,例如 Llama3 和 Mixtral。
⚡ 它有一个副驾模式,使用SearxNG搜索而不是仅仅依赖上下文,它会访问最相关的匹配项,并直接从页面上尝试找到与用户查询相关的来源。
⚡ Perplexica 当前有 6 种专注模式:
- YouTube 搜索模式。
- Wolfram Alpha 搜索模式。
- Reddit 搜索模式。
- 学术搜索模式。
- 写作助手模式。
- 全模式(搜索整个网络)。
你可以在YouTube上观看完整的演示!
他们在 GitHub 上有 12.5k+ 星,并且发布了 v1.8
版本。
16. Email Triager - 使用AI以你的风格撰写邮件。
EmailTriager 会自动学习你如何处理邮件和草稿,并在后台为你准备好回复。请参阅下面附带的演示!
它会自动学习你的过去邮件,并直接在 Gmail 中显示草稿,如果你担心改变你的邮件工作流程。
正如我之前所说,EmailTriager 是唯一一个能够真正学习像你一样分类和撰写邮件的邮件助手。
这是旧方法和新方法显示的结果。
它不是开源的,并且没有免费层,这是一个重大缺点。但在我看来,如果你经常写邮件,每月10美元是值得的。
17. Udio - 使用AI生成音乐。
Udio 可以帮助你通过指定主题、流派和其他描述符从简单的文本提示中创建音乐,然后你可以看到它们转化为高质量的曲目。
观看这个演示并听听一些令人印象深刻的音乐。我非常喜欢!插上耳机 :)
一旦你创作了你的杰作(或者只是你喜欢的一首歌),就在 Udio 上发布,让大家一起欣赏。
当然,你可以将你的创作导出到一个DAW,或者上传你自己的音频来体验Udio出色的AI编辑工具。
这是仪表板的外观。
他们还提供了逐步教程。要获得更多信用,你只需要观看10秒的音乐,并告诉他们你更喜欢哪一首。除非歌曲不好,否则对我们双方来说都是双赢的局面。
如果你想要一个YouTube教程,我推荐你看这个!
它不是开源的,但我已经爱上了这些歌曲 :)"
你找到足够好的东西了吗?
我花了很长时间进行研究,所以如果你有任何很棒的想法或工具想要分享,告诉我一声。
AI 已经在改变世界,开发者也需要适应这些变化。
祝你度过美好的一天!下次见。
如果你喜欢这个内容, 请关注我获取更多 :) |
---|
关注Latitude获取更多类似内容。
Latitude 关注共同學習,寫下你的評論
評論加載中...
作者其他優質文章