人人都懂ChatGPT第一章：ChatGPT 与自然语言处理-脚本导航

> 自媒体 > （AI）人工智能 > 人人都懂ChatGPT第一章：ChatGPT 与自然语言处理

人人都懂ChatGPT第一章：ChatGPT 与自然语言处理

来源：MobotStone

2023-06-30 16:56:52

741

管理

如果用户与 ChatGPT 对话的轮次过多，一般来讲模型仅会保留最近几轮对话的信息，此前的对话信息将被遗忘。

ChatGPT 在接收到用户的提问输入后，输出的文字并不是一口气直接生成的，而是一个字、一个字生成的，这种逐字生成，即生成式（Generative）。如下图所示。

基于强化学习的 NLP

ChatGPT 模型是基于统计的，然而它又利用了新的方法，带人工反馈的强化学习（Reinforcement Learning with Human Feedback，RLHF），以此取得了卓越的效果，把 NLP 的发展带入了一个新阶段。

几年前，Alpha GO 击败了柯洁。这几乎可以说明，强化学习如果在适合的条件下，完全可以打败人类，逼近完美的极限。当前，我们依然处在弱人工智能时代，但局限于围棋这个领域，Alpha GO 就是一个强人工智能，它的核心就在于强化学习。

所谓强化学习，就是一种机器学习的方法，旨在让智能体（agent，在 NLP 中主要指深度神经网络模型，就是 ChatGPT 模型）通过与环境的交互来学习如何做出最优决策。

这种方式就像是训练一只狗（智能体）听哨声（环境）进食（学习目标）。

一只小狗，当听到主人吹哨后，就会被奖励食物；而当主人不吹哨时，小狗只能挨饿。通过反复的进食、挨饿，小狗就能建立起相应的条件反射，实际上就是完成了一次强化学习。

而在 NLP 领域，这里的环境要复杂得多。针对 NLP 模型的环境并非真正的人类语言环境，而是人为构造出来的一种语言环境模型。因此，这里强调是带人工反馈的强化学习。

基于统计的方式能够让模型以最大自由度去拟合训练数据集；而强化学习就是赋予模型更大的自由度，让模型能够自主学习，突破既定的数据集限制。ChatGPT 模型是融合统计学习方法和强化学习方法的，它的模型训练流程如下图所示：

这部分训练流程将在第 8-11 节展开讲。

NLP 技术的发展脉络

实际上，基于规则、基于统计、基于强化学习这三种方式，并不仅仅是一种处理自然语言的手段，而是一种思想。一个解决某一问题的算法模型，往往是融合了这三种解决思想的产物。

如果把计算机比作一个小孩，自然语言处理就像是由人类来教育小孩成长。

基于规则的方式，就好比家长 100% 控制小孩，要求他按照自己的指令和规则行事，如每天规定学习几小时，教会小孩每一道题。整个过程，强调的是手把手教，主动权和重心都在家长身上。对于 NLP 而言，整个过程的主动权和重心，都在编写语言规则的程序员、研究员身上。

基于统计的方式，就好比家长只告诉小孩学习方法，而不教授具体每一道题，强调的是半引导。对于 NLP 而言，学习重心放在神经网络模型上，但主动权仍由算法工程师控制。

基于强化学习的方式，则好比家长只对小孩制定了教育目标，比如，要求小孩能够考试达到 90 分，但并不去管小孩他是如何学习的，全靠自学完成，小孩拥有极高的自由度和主动权。家长只对最终结果做出相应的_奖励或惩罚_，不参与整个教育过程。对于 NLP 来说，整个过程的重心和主动权都在于模型本身。

NLP 的发展一直以来都在逐渐向基于统计的方式靠拢，最终由基于强化学习的方式取得完全的胜利，胜利的标志，即 ChatGPT 的问世；而基于规则方式逐渐式微，沦为了一种辅助式的处理手段。ChatGPT 模型的发展，从一开始，就在坚定不移地沿着让模型自学的方向发展进步着。

ChatGPT 的神经网络结构 Transformer

前面的介绍中，为了方便读者理解，没有提 ChatGPT 模型内部的具体构造。

ChatGPT 是一个大型的神经网络，其内部结构是由若干层 Transformer 构成的，Transformer 是一种神经网络的结构。自从 2018 年开始，它就已经成为了 NLP 领域的一种通用的标准模型结构，Transformer 几乎遍布各种 NLP 模型之中。

如果说，ChatGPT 是一幢房子的话，那么，Transformer 就是构建 ChatGPT 的砖头。

Transformer 的核心是自注意力机制（Self-Attention），它可以帮助模型在处理输入的文字序列时，自动地关注到与当前位置字符相关的其他位置字符。自注意力机制可以将输入序列中的每个位置都表示为一个向量，这些向量可以同时参与计算，从而实现高效的并行计算。举一个例子：

在机器翻译中，在将英文句子 "I am a good student" 翻译成中文时，传统的机器翻译模型可能会将其翻译成 "我是一个好学生"，但是这个翻译结果可能不够准确。英文中的冠词“a”，在翻译为中文时，需要结合上下文才能确定。

而使用 Transformer 模型进行翻译时，可以得到更加准确的翻译结果，例如 "我是一名好学生"。

这是因为 Transformer 能够更好地捕捉英文句子中，跨越很长距离的词汇之间的关系，解决文本上下文的长依赖。自注意力机制将在第 5-6 节展开介绍，Transformer 结构详解将在第 6-7 节展开介绍。

总结NLP 领域的发展逐渐由人为编写规则、逻辑控制计算机程序，到完全交由网络模型去适应语言环境。ChatGPT 是目前最接近通过图灵测试的 NLP 模型，未来GPT4、GPT5将会更加接近。ChatGPT 的工作流程是一个生成式的对话系统。ChatGPT 的训练过程包括语言模型的预训练，RLHF 带人工反馈的强化学习。ChatGPT 的模型结构采用以自注意力机制为核心的 Transformer。

0

赏礼

赏钱

0

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

最近很火的chatGPT，看他自己怎么回答

2023-06-30 16:57

chatgpt可以取代我们工作的哪些方面

2023-06-30 16:55