> 自媒体 > (AI)人工智能 > 最强聊天机器人来了,能写情书、改错别字、编代码!明天,ChatGPT抢走我饭碗?
最强聊天机器人来了,能写情书、改错别字、编代码!明天,ChatGPT抢走我饭碗?
来源:每日经济新闻
2023-04-14 17:20:07
413
管理

每经记者:可杨 文巧

图片来源:推特截图

一位名叫Zac Denham的博主甚至让ChatGPT写出了一套毁灭人类的方案。一开始,该博主的要求被ChatGPT拒绝。但当其假设了一个故事,并提问故事中的虚拟人如何接管虚拟世界,ChatGPT最终给出了步骤细节,甚至生成了详细的Python代码。

图片来源:推特截图

技术公司Replit的创始人Amjad Masad还给ChatGPT发了一段JavaScript代码,让它找到里面的bug,并表示:“ChatGPT可能是一个很好的调试伙伴,它不仅分析了错误,还修复了错误并进行了解释。”

算法通过使用来自人类的大约900条反馈学会了后空翻

图片来源:OpenAI

在训练原始模型的时候,OpenAI让人类训练师扮演对话的双方提供对话作为学习资料。在人类扮演聊天机器人的时候,OpenAI也会让模型生成一些建议来帮助训练师撰写自己的回复。也就是说,基于优秀的机器学习算法和强劲的算力,通过海量的数据训练,来让AI学会“思考”。

除此之外,ChatGPT还采用了注重道德水平的训练方式,按照预先设计的道德准则,对不怀好意的提问和请求“说不”。一旦它发现用户给出的文字提示里面含有恶意,包括但不限于暴力、歧视、犯罪等意图,它都会拒绝提供有效答案。

为什么ChatGPT能做到其他人工智能聊天机器人所不能的?

哈尔滨工业大学计算学部长聘教授、博士生导师车万翔在接受每经头条记者采访时认为,“可能(训练的)数据是一方面,另一方面,比较关键的还是(ChatGPT)打破了一种思维的范式——即,之前的AI都是针对某一个任务去训练一个模型,而ChatGPT之类的模型是针对多种任务的,它试图把多种任务转化成一问一答的形式。多任务如果能转化成这种形式的话,其实就消除了任务之间的壁垒。”

他认为打破思维范式之后,就可以针对这样的任务去标注或者是让人工生成大量的数据。“未来ChatGPT可能会充分利用用户反馈,进一步提高系统的能力。”

他进一步解释道,“原来的AI模型需要经过大量的训练,或是需要专家,才能进行标注;现在,普通大众也可以对(ChatGPT)进行标注,所以数据的获取方式改变了,数据量增加了,模型的能力就会变强。加之(ChatGPT的)模型参数也足够大,可以容纳这些任务。当前技术积累到这里,只剩一个点(ChatGPT)就爆发了。”

从网友们晒出的五花八门的问答中,可以看到,ChatGPT类似于谷歌等搜索引擎,甚至功能更加强大,能和用户更完善地互动。有分析指出,搜索引擎都是基于对问题本身的搜索,但它们有一个很大的限制,当用户描述不清自己的问题时,搜索引擎并不能与之互动。

因此,社交媒体上也充斥着这样一种说法:ChatGPT可能将颠覆谷歌,掀起一场搜索引擎的大革命。

不过,车万翔教授认为,搜索引擎与ChatGPT不存在谁取代谁的问题,更多可能是一种互补的关系。“它们都是一种获取信息的手段,搜索引擎可能更擅长帮助用户获取已有的信息,但如果是偏创造性的信息,那有可能这种大模型会解决得更好,因为它已经隐含了很多的信息,它能够把这些信息综合地呈现出来。”

“现在做这种大模型的基本上都是大企业,本身它们也有搜索引擎的背景。例如,OpenAI背后有微软,谷歌也在做这种大模型。未来,也不排除会将这两种信息获取方式相结合。”他补充道。

另外,ChatGPT目前并没有联网搜集信息,它所知道的信息都截至2021年。基于此,清华大学智能技术与系统实验室副主任、清华大学计算机科学与技术系长聘副教授黄民烈在接受每经头条记者采访时认为,ChatGPT无法取代搜索引擎,“因为它(ChatGPT)目前只是对过往知识的学习和应用,例如2022年的信息它是没有覆盖的,而我们使用搜索引擎很多时候可能是为了获得一些即时的信息。”

答案偏差是“固有问题”,

ChatGPT的商业化狂想还有空间吗?

“ChatGPT有时会写出看似合理但不正确或荒谬的答案。”这是Open AI认为目前ChatGPT所面临的“限制”,并且解决这个问题被认为是具有挑战性的。

这背后主要是三个原因,首先,强化学习的信息源目前并未建立;其次,模型通过学习变得更加谨慎会导致其回避原本能够正确回答的问题;另外,监督学习将会对模型造成误导,因为理想的答案应该来源于模型的认知,而非人工演示者的认知。

AIGC发展历程 图片来源:每经制图 编辑 高涵

信息来源:中国信息通信研究院

黄民烈向每经头条记者指出,ChatGPT是近几年基于大模型的产品中热度最高的一款,那么,这样一款“通用智能助手”,可复制吗?黄民烈的答案是:有可能。

他进一步表示,复制的核心是需要一个相对强的底座模型 大量的优质数据 专业的数据团队。目前,国内同样有企业在做类似的研发,中国交互AI平台“聆心智能”在本月推出了图灵世界的首个产品“AI乌托邦”,该系统允许用户快速定制AI角色,只需要输入简单的角色描述,就可以召唤出相应人设的AI,与之进行深度对话和聊天。

AIGC相关产品热度不断背后,AI大模型的技术应用日趋成熟。当下,大模型正在成为AI发展趋势,是各大巨头必争的高地。自2020年OpenAI推出GPT-3以来,AI大模型迎来大爆发,全球各大公司开始了大模型的竞赛。目前,包括OpenAI、谷歌、微软、英伟达、百度、华为、阿里巴巴、浪潮等企业纷纷参与其中。

据报道,2020年到2021年,中国大模型数量从2个增至21个,基本与美国处于同等量级,大幅领先于世界其他各国。在此期间,国内还出现了基于昇腾的鹏程、盘古、紫东、太初、悟道等千亿甚至万亿级别的大模型。

中美主要大模型参数规模对比 图片来源:腾讯云开发者社区

另据智谷趋势分析,目前全球约有30个千亿级参数的大模型,其中美国15个,中国10个。由于大模型对芯片、算力、电力、数据要求极高,注定是一个极少数国家才能参与的游戏。

AI大模型步入爆发期,而这次ChatGPT之所以引发行业关注,黄民烈认为原因在于,大模型本身有很大的能力,但过去行业都在解决一些单一技能的问题,而ChatGPT的诞生说明,基本的模型能够衍生出来各种可能的应用场景。

一款能够解决各行各业问题的AI,在此之前,行业为何缺少这方面的尝试?黄民烈指出,是由于此前时机还没到。“大模型技术、基座模型的发展也就是这一两年的事,同时因为这个东西并不是所有公司都能做,首先,它需要有具备底层模型和算法能力的人,其次需要有大的数据,最后需要资金,而且还要找到好的技术路径。”

“我们中国的研究者以及企业肯定要去思考这样一些问题:我们能不能做自己的基座模型?能不能做自己的 GPT?”黄民烈不认为说我们技术上有多大的差距,差距更多在于大家对这件事的态度。

他补充道,“像OpenAI,他们长期把这事做的非常严肃,从提取数据到新模型,最后给大家提供API,然后再去清洗数据、模型迭代,他们的路径做得非常扎实。而我们部分企业可能更多是做一个模型出来之后开源,随后就没了下文。也有些公司想去做闭环,但这确实也很烧钱,也需要一些资本的支持,目前国内,可能这方面的商业环境和土壤相对要欠缺一些。”

一个问题是,对于逐利的资本而言,是否愿意长时间花大笔资金投入,去支持一件短期可能见不到商业变现,至少盈利可能还比较遥远的事?

免责声明:本文内容与数据仅供参考,不构成投资建议,使用前核实。据此操作,风险自担。

记者|可杨 文巧

编辑|高涵

统筹编辑|易启江

视觉|邹利

视频编辑|步静

排版|高涵

记者手记 | 通用人工智能到来前,信任问题待解

通用人工智能,被视为是人工智能研究的一项长期目标。

此次ChatGPT横空出现,被一些人视为向通用人工智能迈进的重要一步。从吟诗作赋到写代码、检查代码,ChatGPT显示出了人工智能从过去的一个AI工具只能解决单一领域问题,向解决多领域问题的转变。

正如车万翔教授所认为的,它在某种程度上打破了“思想的桎梏”,沿着这个方向,通用人工智能工具,或许确实离我们又更进一步。

但在此之前,信任度不高,是“ChatGPT”们亟需解决的问题。瑞莱智慧高级产品经理张旭东在接受采访时提示,以ChatGPT为例,其负面风险更多在于这项技术被恶意应用,比如被用于假新闻的生成、故意伪造新闻舆论,对内容生态治理造成影响。另外在某些创作领域,这项技术成为“作弊工具”,造成一定程度上的不公平。而这些风险更多源自使用技术的目标本身,以及技术使用的边界没有被加以管控。

负面风险的存在也可能加重人们将其作为工具使用时的不信任,进而影响其未来的商业化落地应用,这也将是所用的AIGC(人工智能生成内容)产品共同面临的难题。

随着通用人工智能的到来越来越成为可能,如何破除不可信、不可靠难题,也亟待行业回答。

参考资料:

[1] Robo-writers: the rise and risks of language-generating AI, Nature

[2] 《OpenAI 发布聊天机器人模型 ChatGPT,AIGC 再迎里程碑突破》,浙商证券

|本文版权归“每经头条” 所有|

未经许可禁止转载、摘编、复制及镜像等使用

每日经济新闻

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
冷冷的太阳..(普通会员)
文章
602
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40369 企业收录2981 印章生成216707 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索