> 自媒体 > (AI)人工智能 > 人工智能聊天机器人——ChatGPT
人工智能聊天机器人——ChatGPT
来源:Xzxxxxxx
2023-06-19 21:40:28
461
管理

ChatGPT是一个人工智能聊天机器人,由OpenAI开发并于2022年11月发布。它是基于OpenAI的GPT-3.5模型(一种改进的GPT-3模型)进行微调的任务专用GPT。它可以以对话的方式与用户交互,回答后续问题,承认自己的错误,挑战错误的前提,拒绝不恰当的请求。它是InstructGPT的兄弟模型,InstructGPT是一种能够根据提示中的指令提供详细回答的模型。

ChatGPT使用了人类反馈强化学习(RLHF)的方法进行训练,与InstructGPT的方法相同,但在数据收集方面有些许不同。首先,使用监督式微调训练了一个初始模型:人工智能训练师提供了他们扮演用户和AI助手双方的对话。训练师可以使用模型生成的建议来帮助他们编写回答。然后,将这个新的对话数据集与转换为对话格式的InstructGPT数据集混合在一起。为了创建强化学习的奖励模型,需要收集比较数据,即由质量排序的两个或多个模型回答。为了收集这些数据,取出AI训练师与聊天机器人进行的对话。随机选择一个模型生成的消息,采样几个替代完成,并让AI训练师对它们进行排名。使用这些奖励模型,可以使用近端策略优化(PPO)对模型进行微调。这个过程进行了几次迭代。

ChatGPT是从2022年初完成训练的GPT-3.5系列中的一个模型进行微调的。ChatGPT和GPT-3.5都是在Azure AI超级计算基础设施上进行训练的。

ChatGPT局限性:ChatGPT有时会写出看似合理但错误或无意义的回答。修复这个问题很困难,因为:(1)在RL训练期间,目前没有真实来源;(2)训练模型变得更加谨慎会导致它拒绝可以正确回答的问题;(3)监督式训练会误导模型,因为理想的答案取决于模型知道什么,而不是人类演示者知道什么。ChatGPT对输入措辞或多次尝试相同提示非常敏感。例如,在给定一个问题的一种措辞时,模型可能会声称不知道答案,但在稍微改变措辞后,就可以正确回答2。模型经常过度冗长,并过度使用某些短语,例如重申它是由OpenAI训练的语言模型。这些问题源于训练数据中的偏差(训练者更喜欢看起来更全面的较长答案)和众所周知的过度优化问题
0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
OpenAI准备向其第一批次的百万个客户出售DALL-E服务
这是一个必要的解决方案,但却是一个肤浅的办法。OpenAI 通过筛选过滤用..
我给梵高当Tony:这三款AI绘图工具,就离谱
本文约2500字,建议阅读5分钟AI生成图像完成,并不代表创意就结束了。又..
记者调查:ChatGPT风口下的灰色“生意经”
当地时间5月18日,人工智能开发机构OpenAI在美国发布了适用于iPhone的免..
杨绛:没事不要和异性聊天,偶尔聊一下是朋友,天天聊就是暧昧..
图片来源于网络最近一个相熟的姐姐正在因为这个问题和老公闹别扭。两个人..
男子在老婆坐月子期间与年轻女子出轨,大尺度聊天记录曝光..
据悉,这起事件的男主角名叫张某,他在老婆怀孕期间就与一位年轻女子关系..
美女老师的香艳聊天截图,太疯狂了
美女老师的香艳聊天截图,太疯狂了 文/叶雨秋举报一两个,一般会查实、处..
网友:ChatGPT取代老胡 激怒胡锡进三度炮轰:人工智能打不败我..
下面这张图片,是网络大V、央媒《环球时报》前总编辑胡锡进在不到24小时..
京东副总裁何晓冬:GPT-3后,人机对话与交互何去何从?| CCF-GAIR 2020..
另外,我们可以通过在连续空间里面投影我们的知识,再把这个知识的点和整..
一文讲透产品经理如何用好ChatGPT
ChatGPT,特别是4.0版本的出现,对各行各业产生了极为深远的影响。但人类..
关于作者
杨子(普通会员)
文章
386
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40329 企业收录2981 印章生成186761 电子证书796 电子名片49 自媒体20815

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索