> 自媒体 > (AI)人工智能 > 如何“喂食”和训练ChatGPT,让它变得更像人?
如何“喂食”和训练ChatGPT,让它变得更像人?
来源:集微网
2023-05-25 15:25:18
296
管理

集微网消息,像chatGPT这样的大型语言模型总是提供一些看似正确合理的内容。这些聊天机器人,很多都是基于生成式人工智能技术,经过训练就能够通过在互联网上搜寻相关信息,组装出连贯的答案来回答用户的问题。它可以写出令人信服的学生论文、权威的法律文件和可信的新闻故事。对此,金融时报特约专栏作者做了专门分析。

但是,由于公开的数据包含错误信息和虚假信息,一些机器生成的文本可能并不准确真实。这促使人们争相开发工具来确定文本是由人还是由机器起草的。科学界也在努力适应这个新时代,现场讨论是否应该允许聊天机器人撰写科学论文甚至提出新的假说。

区分人工智能和人类智能的重要性与日俱增。本月,瑞银(UBS)分析师透露,ChatGPT是有史以来增长最快的网络应用,今年1月份月活跃用户达到1亿。对此有些部门认为,亡羊补牢,为时已晚。周一,国际文凭组织(International Baccalaureate)表示,只要学生标明引用,就允许他们使用chatGPT写论文。

这项技术的创造者坦言了它的局限性。OpenAI首席执行官萨姆•奥尔特曼(Sam Altman)去年12月警告称,ChatGPT“在某些方面足够出色,从而造成了无所不能的假象......我们在稳健性和真实性方面还需继续改进。”该公司正在为其输出的内容开发加密水印,这是一种机器可读的标点符号、拼写和词序序列;并且正在打磨一种“分类器”来区分合成文本和人类文本,并使用两者的例子来训练它。

斯坦福大学的研究生埃里克·米切尔(Eric Mitchell)认为分类器需要大量的训练数据。他和同事们一起提出了DetectGPT,这是一种“零样本”发现两种文本差异的的方法,不需要聊天机器人事先学习。相反,该方法使聊天机器人转向自身探测自己输出的内容。

它的工作原理是这样的: DetectGPT询问聊天机器人对一个样本文本的“喜欢”程度,用“喜欢”这一简写代表该样本与它自己创建的文本的相似程度。然后DetectGPT略微改变样本措辞,进一步“扰乱”文本。其假设是,相较于更改后的机器文本,聊天机器人对更改后的人类文本的“喜欢”程度更加多变。研究人员声称,在早期的测试中,该方法在95%的情况下能正确区分人类作者和机器作者。

需要注意的是: 该研究结果尚未经过同行评议;这种方法虽优于随机猜测,但在所有生成式人工智能模型中的效果并非同样可靠。对合成文本进行人工调整可能会愚弄DetectGPT。

这对科学来说意味着什么?科学出版是研究的生命线,将思想、假设、论点和证据注入全球科学经典。一些人已经迅速将ChatGPT当成研究助手,有几篇论文将人工智能列为合著者,引发争议。

Meta公司甚至推出了一个名为Galactica的科学文本生成器。三天后就被撤回了。所有的错误回答中,还有一段虚构的熊在太空中旅行的历史。

蒂宾根马普智能系统研究所(Max Planck Institute for intelligence Systems)的迈克尔•布莱克(Michael Black)教授在推特上表示,Galactica公司关于对他研究领域的多项询问给出的回答令他感到“困扰”,其中甚至将假论文归于真正的研究人员。“在所有情况下,Galactica的答案都是错误或带有偏见的,但听起来却很正确和权威。我认为这非常危险。”

这种危险来自于似是而非的文本溜进了真正的科学文献,使文献中掺杂着虚假的引文,并永远扭曲经典。现在《科学》杂志完全禁止机器生成的文本;《自然》杂志允许在声明的情况下使用,但禁止将其列为合著者。

文章最后指出,人们大多不会查阅优质期刊来指导自己的科学思考。如果狡猾的人有这样的倾向,这些聊天机器人可以按需喷出大量包含虚假引用的伪科学,解释为什么接种疫苗没有效果,或者为什么全球变暖是个骗局。这些误导性材料被发布在互联网上后,可能会被未来的生成式人工智能吞噬,进而产生新一轮的谎言,进一步污染公共话语。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
微软和Open AI:合作还是竞争?揭秘两大人工智能巨头背后的博弈..
导读:人工智能(AI)是当今世界最具影响力和前景的技术之一,在这个领域..
OpenAI 自我“揭短”:论文揭示 GPT-4V 仍有缺陷!
但时间过去了 6 个月,OpenAI 一直未公开该模型的图像功能,对此有报道称..
人民银行发布风险提示:谨防仿冒“征信中心”等欺诈链接..
来源:人民网 原创稿人民网北京7月21日电 (记者罗知之)据中国人民银行官..
Open AI说:给我一句话,我能编出一本书
阅读理解只有小学生水平,GPT-2写假新闻却是一把好手。你也许听说过会作..
ChatGPT能帮忙炒股?美金融界开始用AI研究美联储官员讲话:4天后大概率加息..
摩根大通预计美联储4天后大概率还将加息25个基点,而这一预测来自AI。据..
LeCun眼中的GPT-3:对世界的运作一无所知
萧箫 发自 凹非寺量子位 报道 | 公众号 QbitAI“有些人对大型语言模型(..
教你如何制作炫酷中文GUI!
打开软件后,新建Standard字库,Encoding选择16 Bit UNICODE,然后点ok。..
来自硅谷第3期 企业级ChatGPT开发入门实战直播21课-8
如图2-9所示,以对话机器人的流式架构阐述Transformer学习的第三境界。图..
当ChatGPT学会写作,作家建议:多进行真实连接,滋养内心和文学..
舒婷贾平凹贾平凹谈到自己上一次来赤水河畔,是十多年前,“这次再来,我..
关于作者
婆罗花开(普通会员)
文章
561
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40350 企业收录2981 印章生成210473 电子证书900 电子名片56 自媒体30867

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索