> 自媒体 > (AI)人工智能 > ChatGPT的“前世今生”是什么?未来又将走向何方?
ChatGPT的“前世今生”是什么?未来又将走向何方?
来源:工银瑞信基金
2023-11-30 13:29:29
261
管理

近期,ChatGPT的更新再度引发市场热潮。想必这个产品大家都不陌生,很多人也都有使用过。而最新版本的GPT4是将各大模块进行了集成,可以在任务中选择并组合使用各种工具,包括数据分析、网页浏览和DALL·E 3。那么,我们今天就一起来深入了解一下,看看它的前世今生是什么样的,未来又将走向何方?

一、前世:ChatGPT的核心——Transformer 架构

首先,在了解ChatGPT之前,大家肯定会好奇一个问题,就是它为什么那么能聊?

核心其实很简单,More is different,量变到质变,多即不同。这其实也恰好吻合了凝聚态物理的核心思想。ChatGPT的开发归功于OpenAI,但其技术基础实际上源于谷歌在2017年的一项创新。那一年,谷歌发布了一篇论文,介绍了一种新型的神经网络架构——Transformer Architecture。这种架构专为处理自然语言而设计,最初主要被应用于语言翻译领域。

为什么Transformer架构用来处理自然语言会很有优势呢?

我们都知道,人类大脑的运作依赖于数十亿神经元所构成的复杂网络,这些神经元通过节点(Node)相互连接,共同参与信息的传递和处理。神经网络架构正是模仿了这种人脑的思维模式。在这些架构中,节点间的连接模式各异,以适应不同类型的任务。例如,图像处理通常采用卷积架构(Convolution Architecture),而早期的语言处理则采用了循环神经网络(RNN)架构。RNN架构将语言视为马尔可夫链(Markov Chain),即每个词仅与其前一个词唯一相关。然而,这种处理方式并不完全符合人类语言的实际运作规律。例如,中文等语言的语法规则相对模糊,没办法用简单的线性关系来描述。

RNN vs Transformer

图片来源:网络,截至2023.10

而Transformer架构的创新之处在于,它不将语言处理视为简单的马尔可夫链。相反,它允许每个单词与之前的所有单词建立联系,并通过大量训练来优化不同节点间的权重分配。这种方法更贴近于人类语言的模糊性和经验性特征。比如一个外国人跟我们讲中文,哪怕他讲得乱七八糟,词也乱用,我们也能猜出来他想表达什么。根据我们在中文方面的充足经验,大脑对中文的处理已经趋近完美,所以这句话我们很容易理解。那为什么我们看很多外国人都是一个样子很难分辨呢?这就是因为我们的经验不够,对于外国人面部识别的节点权重分配不到位的原因。

$工银科创板50ETF联接A(OTCFUND|011614)$

$工银科创板50ETF联接C(OTCFUND|011615)$

二、今生:OpenAI都做了什么?

在ChatGPT的开发过程中,OpenAI在Transformer架构的基础上进行了大量复杂且繁琐的数据训练,使ChatGPT经历了多个版本的迭代,每个版本都在不断完善其语言处理能力。最初,它主要学习网络上的数据,但这导致了一些问题,如生成的内容偏向于粗俗和暴力。为了解决这一问题,后续版本采用了更加有针对性的数据源,并通过人工干预来不断纠正和优化AI的回答。

ChatGPT的训练过程

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
真相残酷,ChatGPT的狂欢与中国无关,因为AI芯片差距二十年。..
近日,ChatGPT火爆异常,一度被认为即将替代脑力工作,因为ChatGPT可以重..
ChatGPT iOS版现已全面推出,用户体验升级引热议
为了满足广大用户的需求,ChatGPT现已推出其iOS版,让您的智能对话体验更..
分析人工智能chatgpt的发展现状与前景
ChatGPT是一种人工智能聊天机器人,它基于Transformer算法,通过对大量的..
OpenAI 危机四伏,ChatGPT 每天烧 70 万美元,还能撑多久?..
人工智能是当今科技领域最热门的话题之一,也是未来社会的重要驱动力。然..
当工业4.0遇上ChatGPT(014)
随着科技的不断进步,人工智能(AI)被广泛应用于各个行业中,汽车制造业也..
浪潮信息:公司源1.0大模型结构与GPT-3类似,参数量增加40%..
2月14日,服务器厂商浪潮信息(000977)在深交所互动平台上回复投资者问..
终极“揭秘”:GPT-4模型架构、训练成本、数据集信息被扒出..
本人所创作的文章,只在今日头条首发创作,未发布在其他平台,请勿搬运使..
关注坠亡姐弟母亲,坚持终得正义。
今天,全国再次掀起了对姐弟坠亡案的关注。下面介绍一下坠亡姐弟妈妈的故..
ChatGPT开始联网,订酒店、看股价都可以!谷歌之后,这下该苹果慌了?..
每经记者:蔡鼎 图片来源:推特阿尔特曼表示,OpenAI正在提供一个网页浏..
关于作者
天泰悠然(普通会员)
文章
375
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40329 企业收录2981 印章生成186663 电子证书795 电子名片49 自媒体20815

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索