> 自媒体 > (AI)人工智能 > GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定
GPT-4最强竞品突然升级10万token,啃论文代码演示全搞定
来源:新智元
2023-05-17 20:01:08
507
管理

编辑:编辑部

【新智元导读】GPT-4 32K还没用上,ChatGPT最强竞品已经秒读「了不起的盖茨比」了。

在GPT-4 32K还在内测阶段,OpenAI的劲敌直接把上下文长度打了上去。

就在今天,初创公司Anthropic宣布,Claude已经能够支持100K的上下文token长度,也就是大约75,000个单词。

Claude 100k,倍儿香!

前段时间,在OpenAI的开发者社区中,许多人讨论GPT-4 32K正在推出。

已经解锁这一版本的网友,让其访问了数百个来自卸载HyperWrite用户的数据点,GPT-4便准确地告诉他接下来该做怎样的改进。

他称赞道,GPT-4 32k是世界上最好的产品经理。

Claude还可以是你的「代码伴侣」,分分钟就能做个演示。

比如,上传一个240页的Langchain API文档,让它基于这个文档,用Anthropic的语言模型做一个Langchain的简单演示。

此外,Claude 100k还能处理大约6小时的音频量。

比如说,AssemblyAI把一个卡马克的播客的内容转录成了58k个token量的文本,然后用Claude进行了总结和问答。

官网也给出了具体价格:

Claude Instant

Prompt:$0.00163 / 1K tokens

Completion:$0.00551 / 1K tokens

Claude-v1

Prompt:$0.01102 / 1K tokens

Completion:$0.03268 / 1K tokens

网友实测

这么重磅级的更新,一定少不了网友的体验。

有网友称100k简直难以置信,能够处理多篇完整的论文,部分完整的代码库,甚至一本250页的小说。

英伟达科学家Jim Fan表示,这是Anthropic抛出的杀手锏。未来在上下文长度的军备赛正快速升温。

对于支持100k的意义,网友称,泰裤辣!这很好地展示了为什么长文本对LLM很重要。

就连Sam Altman称我们要的是32k token。

前段时间,来自DeepPavlov、AIRI、伦敦数学科学研究所的研究人员发布了一篇技术报告,使用循环记忆Transformer(RMT)将BERT的有效上下文长度提升到「前所未有的200万tokens」,同时保持了很高的记忆检索准确性。

论文地址:https://arxiv.org/abs/2304.11062

该方法可以存储和处理局部和全局信息,并通过使用循环让信息在输入序列的各segment之间流动。

不过,虽然RMT可以不增加内存消耗,可以扩展到近乎无限的序列长度,但仍然存在RNN中的记忆衰减问题,并且需要更长的推理时间。

实际上,RMT背后是一个全新的记忆机制。

具体操作方法是,在不改变原始Transformer模型的前提下,通过在输入或输出序列中添加一个特殊的memory token,然后对模型进行训练以控制记忆操作和序列表征处理。

与Transformer-XL相比,RMT需要的内存更少,并可以处理更长序列的任务。

当然,在最终实现百万token之前,Claude 100k已经是相当大的起步了。

参考资料:

https://www.anthropic.com/index/100k-context-windows

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
GPT-4 越来越笨?准确率从 97.6% 降至 2.4%
出品|开源中国斯坦福大学和加州大学伯克利分校合作进行的一项 “How Is C..
GPT-4两句话复刻DeepMind最快排序算法?马库斯:过于讽刺..
编辑:润【新智元导读】网友用GPT-4复现了AlphaDev的排序算法优化,让Dee..
再次进化!GPT4.0:识图+算税,已成功摆脱Chat?
在ChatGPT展现了惊人的实力之后,离发布仅仅四个多月,OpenAI又扔下了一..
ChatGPT-4发布,哪些人会失业?人工智能来抢饭碗...
人工智能来抢饭碗怎么办?哈喽大家好,我是艾迪。上线两个月全球用户数破..
与吴军老师聊两句,ChatGPT真的没有啥突破?
你好,我是王煜全,这里是王煜全要闻评论。这几天,在计算机领域曾经有不..
ChatGPT爆火,未来的机器人时代会是什么样?
最近,有一个叫ChatGPT的词频频出现在眼前,这几天微博上关于ChatGPT的热..
OpenAI 2022年亏损翻番,开发和人工成本高昂 |元宇宙2048周报..
行业趋势01 | 河南省首支元宇宙基金揭牌河南文旅数字科技私募股权投资基..
别再嫌弃ChatGPT写情书套路了 国内应用连表白都不会
TechWeb 文/周小白最近,一款上知天文、下知地理,会写诗、会作词,能改..
字节跳动CEO:要深入学习理解GPT-4,思考结合场景创造价值..
梁汝波 大型多模态模型GPT-4的推出,引发国内互联网巨头的广泛关注。3月1..
关于作者
御赐铲屎官..(普通会员)
文章
589
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40369 企业收录2981 印章生成216707 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved 浙ICP备19035174号-7
1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索