> 自媒体 > (AI)人工智能 > “chatGPT”到底是什么啊?
“chatGPT”到底是什么啊?
来源:桃园愚人1
2023-05-18 14:15:58
402
管理

#挑战30天在头条写日记#

“chatGPT”到底是什么啊?

chatGPT是一个智能对话应用,也称聊天机器人,可以回答用户的各种天南海北的问题。

chatGPT背后的技术被称为“大型语言模型”(Large Language Model,简称LLM),是人工智能技术中,属于深度神经网络的技术。

从原理上来说,我觉得chatGPT像是一个知识的压缩器:它把很多知识浓缩在里面,然后你可以通过对话问答的方法把知识取出来。如果把浓缩知识的过程称为“压缩”,那取出知识的过程就是“解压缩”。从这个意义上讲,chatGPT是一个知识的“压缩-解压缩器”。

本来知识的表现形式,是我们看得懂的文本,经过机器的重新编排,存储在一个称为“神经网络”的东西里,也就是今天我们所说的 “模型”。人的大脑有一张“神经网络”,是由很多相互连接的神经元构成。

机器学习技术参照了这个名字,也叫“神经网络”,实际就是许许多多彼此连接的数据节点,其中,大型语言模型拥有的数据节点少则几百亿个、多则上万亿个。

知识被重新编排后,就用这些数据节点的参数以及节点之间的关系来表示,不再是一篇篇可读的文本。“解压缩”就是把知识从网络中恢复出来,变成我们可读的文本。而“解压缩”的钥匙,就是我们问chatGPT的问题。

问题:能不能再解释得详细一点?为什么chatGPT能回答问题?

回答:

我用“搜索引擎”来做对比,有利于说清楚问题。

网上的知识非常多,以网页或数据库的形式存在。搜索引擎首先要去抓取网页,上千亿的网页,就是获取知识的过程,这是搜索的第一个功能。

然后,搜索引擎要浓缩这些网页,它会把文章拆成一个一个的词,以词为单位来重新组织文章,就是制作“倒排表”,“倒排表”就是每个词后面跟着一串它出现过的文档编号,这样查询时可以快速找到哪些文章包含了查询词。这是搜索引擎的第二个功能“索引”。

再然后,当用户来查询的时候,输入一个或几个词,包含这些词的文章是相当多的,那就要给文章排序,尽量让用户想要的结果排在前面。这就是搜索引擎的第三个功能“排序”。

搜索引擎就有这样三个主要功能:获取知识——抓取;编排知识——索引;把你想要的排前面——排序。还有其他很多细节,大致是这样。

可以说,搜索引擎也是一个知识的“压缩-解压缩器”。类似的,我们也可以按照“获取知识-编排知识-呈现知识”这样三个方面来理解chatGPT。

在“获取知识”方面,chatGPT有三个阶段。在第一阶段,研发团队收集大量的网页或者数据库,用里面的文本信息作为训练模型的“语料”,这个量很大,按单词个数来算能达到上万亿。在第二阶段,模型优化阶段,会有专门设计的一些问答数据,这个数量很少,但对模型效果很关键。第三阶段,当模型的效果足够好、可以对用户开放之后,chatGPT可以通过和用户的对话来获取数据,研发团队还开发了插件,方便合作方将各种数据库接入chatGPT,来丰富其指定场景下的知识,这个数据量可以是海量的。

在“编排知识”方面,chatGPT和搜索引擎不同,它把知识揉得更碎,文本变成了数字编码、以节点参数和节点之间的关系的形式来存储,知识就好像“融化”在网络里;当用户来问时,chatGPT会用同样的方式把用户的问话也变成数字编码,输入神经网络,这样就触发了神经网络中的相关信息,回收信息后,再经过一个和揉碎相反的过程——就是解码,就形成了返回的文案。

在“呈现知识”方面,用户用日常对话来获取知识,而不是使用搜索引擎时的查询词。返回的结果也不同,搜索引擎会返回一组网页,而chatGPT给的是通顺的文案。chatGPT还能对信息做梳理,总结成结构化的文案,这是让人印象深刻的地方。至于答案中信息的相关性和重要性等,可能已经被考虑在神经网络的参数里,具体机制我不懂。

另外的区别是,chatGPT还可以和你做多轮问答,有根据上下文调整答案的能力。这取决于它能编码的长度,就是能把多长的问题放到网络中去。

当然,你用日常问话去问搜索引擎也行,但是返回的结果往往很不好,为了改善搜索结果,搜索会在下拉框里补充一些提示词。这当然和千变万化的日常对话没法比。

总而言之,作为知识的“压缩-解压缩器“,chatGPT确实是一次技术上的飞跃。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
聚焦每日新资..(普通会员)
文章
389
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40329 企业收录2981 印章生成184229 电子证书781 电子名片48 自媒体19907

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索