> 自媒体 > (AI)人工智能 > 读书|首部揭秘ChatGPT内部原理的权威之作
读书|首部揭秘ChatGPT内部原理的权威之作
来源:文汇网
2023-07-13 14:02:42
305
管理

《这就是ChatGPT》

[美] 斯蒂芬·沃尔弗拉姆 著

WOLFRAM传媒汉化小组 译

图灵|人民邮电出版社出版

这是国内首部由世界顶级AI学者、科学和技术领域重要的革新者、“第一个真正实用的人工智能”搜索引擎WolframAlpha发明人斯蒂芬·沃尔弗拉姆的ChatGPT诚意之作。ChatGPT是OpenAI开发的人工智能聊天机器人程序,于2022年11月推出,能够自动生成一些表面上看起来像人类写出的文字的东西,是一件很厉害且出乎大家意料的事。那么,它是如何做到的呢?又是为何能做到的呢?本书介绍了ChatGPT的内部机理,然后探讨了为什么它能很好地生成我们认为是有意义的文本。

ChatGPT的基本概念在某种程度上相当简单:首先从互联网、书籍等获取人类创造的海量文本样本,然后训练一个神经网络来生成“与之类似”的文本。特别是,它能够从“提示”开始,继续生成“与其训练数据相似的文本”。

正如我们所见,ChatGPT中的神经网络实际上由非常简单的元素组成,尽管有数十亿个。神经网络的基本操作也非常简单,本质上是对于它生成的每个新词(或词的一部分),都将根据目前生成的文本得到的输入依次传递“给其所有元素一次”(没有循环等)。

值得注意和出乎意料的是,这个过程可以成功地产生与互联网、书籍等中的内容“相似”的文本。ChatGPT不仅能产生连贯的人类语言,而且能根据“阅读”过的内容来“循着提示说一些话”。它并不总是能说出“在全局上有意义”(或符合正确计算)的话,因为(如果没有利用Wolfram|Alpha的“计算超能力”)它只是在根据训练材料中的内容“听起来像什么”来说出“听起来正确”的话。

ChatGPT的具体工程非常引人注目。但是,(至少在它能够使用外部工具之前)ChatGPT“仅仅”是从其积累的“传统智慧的统计数据”中提取了一些“连贯的文本线索”。但是,结果的类人程度已经足够令人惊讶了。

正如我所讨论的那样,这表明了一些至少在科学上非常重要的东西:人类语言及其背后的思维模式在结构上比我们想象的更简单、更“符合规律”。ChatGPT已经隐含地发现了这一点。但是我们可以用语义语法、计算语言等来明确地揭开它的面纱。

ChatGPT在生成文本方面表现得非常出色,结果通常非常类似于人类创作的文本。这是否意味着ChatGPT的工作方式像人类的大脑一样?它的底层人工神经网络结构说到底是对理想化大脑的建模。当人类生成语言时,许多方面似乎非常相似。

当涉及训练(即学习)时,大脑和当前计算机在“硬件”(以及一些未开发的潜在算法思想)上的不同之处会迫使ChatGPT使用一种可能与大脑截然不同的策略(在某些方面不太有效率)。

还有一件事值得一提:甚至与典型的算法计算不同,ChatGPT内部没有“循环”或“重新计算数据”。这不可避免地限制了其计算能力——即使与当前的计算机相比也是如此,更谈不上与大脑相比了。

我们尚不清楚如何在“修复”这个问题的同时仍然让系统以合理的效率进行训练。但这样做可能会使未来的ChatGPT能够执行更多“类似大脑的事情”。当然,有许多事情大脑并不擅长,特别是涉及不可约计算的事情。对于这些问题,大脑和像 ChatGPT 这样的东西都必须寻求“外部工具”,比如Wolfram语言的帮助。

但是就目前而言,看到ChatGPT已经能够做到的事情是非常令人兴奋的。在某种程度上,它是一个极好的例子,说明了大量简单的计算元素可以做出非凡、惊人的事情。它也为我们提供了 2000多年以来的最佳动力,来更好地理解人类条件(human condition)的核心特征——人类语言及其背后的思维过程——的本质和原则。

作者:斯蒂芬·沃尔弗拉姆

编辑:周怡倩

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
OpenAI 最短发布会推出满血 o1,新 Pro 会员费用高达 1452 元/月,体验完我..
就在刚刚,OpenAI 的「圣诞大礼包」来了。整场直播堪称 OpenAI 史上最短..
马斯克加码诉讼OpenAI 或带来行业洗牌
近日,美国知名企业家马斯克对美国开放人工智能研究中心(OpenAI)提起的..
OpenAI 计划自研 AI 芯片,以减少对英伟达的依赖
据路透社报道,OpenAI 正在与博通(Broadcom)合作开发其首款定制 AI 推..
潞晨科技推出视频生成模型Open-Sora 2.0,性能接近OpenAI Sora..
IT之家 3 月 13 日消息,今日,潞晨科技宣布推出 Open-Sora2.0,并全面开..
OpenAI 提案要求禁用 DeepSeek,呼吁打压中国 AI
来源:APPSO作者:发现明日产品的DeepSeek 的到来,确实让 OpenAI 感到很..
人去世后! 各个平台的账号怎么办?
文章开头,说一个悲伤的故事。上个月,一位网友去世近 10 年的父亲,突然..
出示“收款码”竟被盗刷?手机这个功能,赶紧打开→..
近日,湖南警方通报了一起令人警醒的“二维码”盗刷案件。从事手机销售的..
上海百万粉丝女网红报警:人财两空!“榜一大哥”身份曝光……太炸裂→..
百万粉丝女主播在与“榜一大哥”曹某长达九个月的“恋爱”中竟被诈骗了80..
7旬老太网恋“联合国工作人员”,1个月被骗111万!警方披露细节,真想不到..
#7旬老太网恋1个月被骗111万#的话题冲上热搜!深圳铁路公安处深圳站派出..
关于作者
杨子(普通会员)
文章
878
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40394 企业收录2981 印章生成234933 电子证书1036 电子名片60 自媒体46963

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索