> 自媒体 > (AI)人工智能 > Auto-GPT实测报告——虽不完美,但却是最有前景的AI路线
Auto-GPT实测报告——虽不完美,但却是最有前景的AI路线
来源:阿尔法工场
2023-07-14 16:23:43
514
管理

电视盒子信息

Auto-GPT找到了所需要的数据,但是也仅给出了分析出的Top5的盒子的参数和价格,并没有列出数据来源和评判标准。同时也没有做市场分析,只是单列出了数据和配置,没有针对所收集到的数据进行额外分析。

可以说虽然Auto-GPT降低了对Prompt的依赖性,但是对初始任务的描述详细性仍然要求较高。

2.测试二任务:自动写作。

这个测试中,Auto-GPT被定义为作家,要求写一个以赛博朋克为背景的科幻小说的大纲。

Auto-GPT完成的非常出色,其在文件夹中分别生成了几个文件:“赛博朋克大纲”、“对话”、“赛博朋克调查”、“世界背景”、“人物性格”、“人物目标及其背景”等等文件。每份文件中都详实地记下了其文件名的内容,而且每个内容都是基于同一个世界观下生成的。

Auto-GPT的长期记忆功能帮助了Auto-GPT可以始终保持在相同的背景设定里而不偏离。虽然没有完成整篇文章,但是故事脉络已经非常清晰,甚至已经可以说是在“创作”一些新文字了。

03 Auto-GPT当前的问题

1.开销极高

Auto-GPT是基于GPT-3.5和GPT-4而建立起来的。而GPT-4的单个token价格为GPT-3.5的15倍。

假设每次任务需要50个step(较好状况下),每个step会花费6K tokens的GPT-4 使用量,Prompt(提示词)和Completion(回答)的平均每一千tokens花费是0.05美元(因为实际使用中回答使用的token远远多于提示词),汇率为1美元 : 6.8人民币,那么花费就是50*6*0.05*6.8=102人民币。

GPT-4 API访问价格

GPT-3.5 API访问价格

注意,这仅仅只是理想状况下,而且假设了使用时Auto-GPT没有出现其他的问题(后续会提到),单次任务的成本就为100余元。这个成本显然是不可以被大规模应用的。

2.常见死循环现象

在执行任务的时候,Auto-GPT会将任务细化并分解。但是一旦遇到了一些GPT-4都无法处理的问题时,就会陷入自我循环,每一个step执行完后的动作都为“do_nothing”,而且下一个动作仍为这个。

但是每次都会将相同的Prompt交给GPT-4处理从而造成了极其大量的资源浪费现象。而且从目前来看并没有什么很好的解决方案。

Auto-GPT陷入死循环中常见表现

除了这种do_nothing类型的死循环外,还可以经常发现Auto-GPT的另一种死循环,即生成的python脚本执行的时候无法正确完成任务。

接着GPT-4就会尝试修复脚本,再重新执行。通常的修复可能分为很多步让人很难发现问题所在。但是通常来说这种修复都是不起作用的,就又会陷入另一种死循环。

3.执行速度过慢

从实测的第一个问题来看,还有一个非常大的问题就是响应速度过慢。GPT-4的生成token的速度就比GPT-3.5慢许多,再加上脚本执行其它指令(比如Google)所消耗的时间就更长了。

本次统计出Top5的电视盒子,Auto-GPT共耗时8分钟,进行了20个steps完成了总结。但是联网的AI工具除了Auto-GPT还有其它的AI工具可以完成,例如New Bing。

虽然Bing无法自我搜索网络评论并鉴别是否为虚假评论,而且数据来源比较狭窄,但是New Bing的响应只花了8秒,还提供了参考链接供读者自行参考,比起Auto-GPT更加直观。

04 总结

AGI,即通用人工智能,最重要的一个特点就是脱离人工监督可自行完成任务,并且可以完成一些“创意任务”。而Auto-GPT正是在当前条件比较有限的前提下对AGI做出的一个有益尝试。

通过主任务生成子任务(也有人叫子智能体)的方法而让AI通过LLM脱离人类监督自行完成任务可能是未来的发展方向之一。

当前的问题是LLM的能力还是比较弱,对当前的状态把握的还不够好,从而经常让自己陷入死循环需要人类的介入。而且虽然向量数据库成功赋予了AI中长期记忆的可能性,但是对于后续的任务缺无法继续沿用此前的记忆了。

执行速率也可以通过调整架构提升,例如将逐项执行的子智能体转换为可以异步同时执行的模式,大幅提升效率,每一步不强依赖于上一步,就可以极大提升运行效率。又可以像Bing一样快速获取信息,还可以自行分析获取内容达到超过New Bing的效果。

在可预见的未来,这种自动生成子智能体的AI会进一步发展,为复杂问题的解决给出一种新式的答案。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
人工智能的发展:OpenAI 创始人离职的启示
关于创造的Open AI是否会解雇CEO曼的讨论引起了网友们的关注。据了解,早..
GPT-4最新使用体验:普通任务版
当地时间 3 月 14 日,OpenAI 正式发布 GPT-4。据介绍,GPT-4是一个多模..
OpenAI进军内容审核行业,学校已在用ChatGPT筛选色情描述了..
克雷西 发自 凹非寺量子位 | 公众号 QbitAI学校的图书管理员,已经开始用..
ChatGPT:阶级分化的加速器,打工人的兴奋剂
2022年底,ChatGPT这个AI产品突然火了。铺天盖地的新闻报道和各路专家进..
女子接完骗子电话,卡上却多了15万,咋回事?
来源:浙江公安 接了个电话跟着对方一番操作结果发现银行卡上突然多了15...
苹果是怎么做到“拍照稀烂,录像无敌”的?看看ChatGPT是怎么说的..
苹果是怎么做到“拍照稀烂,录像无敌”的?拍照多年被安卓旗舰吊打,硬件..
华人AI芯片独角兽8枚芯片撑起3个GPT-4内存达1.5T英伟达不敢想象..
什么是GPT-4?GPT-4是一种基于深度学习的自然语言生成(NLG)模型,它可..
GPT-4顶替老板\u0026程序员,这个GitHub项目火上热搜第一..
萧箫 发自 凹非寺量子位 | 公众号 QbitAI让GPT-4运转一个软件公司,就能..
特别会写中文!免费不限,有了Slack + Claude,ChatGPT瞬间不香了..
1 Claude 简介• Claude 是一款开源的深度学习模型,由 Anthropic 最近发..
关于作者
醉看夕阳(普通会员)
文章
621
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40369 企业收录2981 印章生成216707 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索