一、什么是ChatGPT?
ChatGPT是生成式AI,就是能生成全新内容的AI,比如全新的文字、图片,全新的代码、声音、视频,AI已经具有一定的创造力了,而且它创造出来的东西很逼真。
最近OpenAI发布了升级版GPT-4,整个AI产业才算真正迎来了拐点,因为它是人工智能首次跨过了常识这道门槛,所谓常识就是你看到了一个很烫的锅,你会知道要戴手套才能把它拿起来,学会常识,需要人工智能,不仅能够看懂眼前画面里的各种东西,还得知道社会规范是什么、物理常识是什么、化学常识是什么,而且还得把看到和知道的一切都融会贯通,而这种能力到了GPT-4真的开始一步步实现了,比如在OpenAI的宣传视频里,常识这个东西,在过去十年里一直被AI界认为是无法跨越的巨大鸿沟,但现在这道鸿沟居然就这么被跨过去了,而只要跨过了常识这一步之后,我们突然发现AI真的变得很聪明了,比如GPT-4可以直接阅读到有图片的论文,再比如可以在各种通用考试里取得很高的分数,GPT-4在SAT数学科的考试里满分800分的卷子能拿700分,在SAT阅读和写作考试里,满分800分能拿710分,在GRE写作考试里,满分6分的卷子可以拿4分,在GRE VERBAL考试里,满分170分的卷子居然可以拿169分,也就是说在大多数的北美学术能力测试里,他现在都能考过85%的考生了,而且不仅是考试,现在他对于完成人类工作任务的能力上也有了飞跃,在OpenAI发布会里有这样一个场景,就是工程师只需要在草稿本上用纸笔画出一个非常简单的网页草图,然后拍照并上传,接着就是Magic moment,GPT-4在10秒左右就直接生成了网站代码,然后接下来部署一下,一个网页就出来了,要知道这个工作量在过去至少是一个产品经理,一个UI设计师,一个前端工程师3人3天的工作量,现在居然只要一个大学生,甚至中学生花两个小时自学一下就能够全部搞定。
GPT-4其实是去年8月份就训练完的模型,OpenAI一直优化了半年多才把它放出来,这就意味着今天让所有人都这么震撼的技术成果其实半年前就已经实现了,也就是说在我们还惊艳于GPT-4各种牛叉的此时此刻,下一个更夸张的GPT-5版本可能已经接近训练完成状态了,甚至可能已经在发布倒计时了,只能说这次技术进步来得真的太快,指数效应被体现得淋漓尽致,去年12月份的参数也才持有1750亿个,而过了三个月后,一个一百万亿参数的模型就已经可以完全开放给大众使用了,这两者的数量对比用这张图可以看得很清楚。
从脑科学的角度,一百万亿这个数字是很重要的里程碑,这个数字也正是人类大脑开始涌现出人类级别智力的开端,这个涌现是复杂性科学术语。现在GPT-4能实现100万亿参数这个规模是人类历史上AI模型第一次和大脑的神经元链接数达到一个数量级,我们人类的大脑皮层包含了大约140-160亿个神经元,我们的小脑包含了大约550-700亿个神经元,这其中负责思考的大脑皮层里,每一个神经元又平均有3万多个突触,大脑皮层的神经元链接总数大约是210万亿-240万亿,210万亿和100万亿这两个数字相差已经很小了,于是在这个参数级别上AI开始涌现出通用智能也不是不可能的,GPT-5就有可能达到人类大脑神经元连接数的100倍以上了,GPT-4是从文本到图片打通,GPT-5应该可以开始把文本、图片到视频全打通,然后GPT-6可以进一步打通三维立体世界,在这么发展下去,人工智能可能就可以开始理解四维、五维甚至11维的宇宙,到那个时候,他就彻底进入人类无法驾驭的信息领域了,它能够生产出来的东西,其内涵我们可能也完全不得而知了,AI的写作能力、编程能力、绘画能力、推理能力、编剧能力全面超过人类专业人士应该只是时间问题,这方面红杉资本之前,已经出过一个报告了,他们认为AI在写作代码这些方面能力全面超越人类,大概要到2030年,现在看来,这个预测过于保守了。
二、GPT-4在哪些方面升级了?
①图片输入;②回答的准确性大幅加强;③更高的字数限制;④更好地规避违禁内容;⑤降低成本。
三、ChatGPT的适用领域有哪些?
1、微软就把ChatGPT融入到它的搜索引擎Bing里头,现在叫New Bing。谷歌就把LaMDA模型和PaLM模型都融入到了Bard的里头,几乎差不多也算半个搜索工具了。http://You.com、百度、360等等,这就相当于一个传统的搜索引擎变成了能跟你对答对话的机器人了。
2、还有一个非常适用的领域就是办公。
①Notion就是个挺大的记笔记的软件,微软推出了Notion AI,microsoft 365 Copilot,把GPT-4就嵌到了像是Excel、Word、PowerPoint、Outlook等等的办公软件里头,比如你在One Note里面记了个笔记,你可以在Word里头让AI帮你自动生成内容和总结,内容创作可以让AI给你调取想法、大纲、图片、文案,这种辅助功能非常适用,你要是调整好这段文字加详细了之后,这个PowerPoint又自动能帮你生成一个对应的PPT,像Excel里边你一堆数据,你就可以直接问它这是有什么特点,能不能给我做一个什么展示报告等等。智能摘要总结挺实用,Copilot可以自动帮你把邮件分类,直接画出来重点,甚至可以几句话直接就帮你把这个邮件总结出来,回邮件的话,你告诉它大概的意思,它可以帮你搞一个有礼貌的版本,邮件里涉及到一些数据,你只要告诉它从哪个Excel里来的,它还能自动帮你把这些东西都提炼到邮件里,而且还可以像论文带标注的那样把所有的来源都给你整理好,方便你去检查。
②国内的钉钉推出的AI功能,就像中文版Copilot的感觉,名字叫斜杠,其实是你只要输入一个斜杠就能召唤智能助手了,钉钉跟Outlook有点像,它也可以智能摘要,斜杠就能帮你生成摘要,发生了什么,哪些有结论,扫一眼就知道了,还可以帮你自动生成个表情包、标题、配图、文案、排版都能搞,一篇推文几分钟就可以给你弄出来了,开个视频会议,还可以让斜杠帮你安排日程,做会议记录,还可以在群里生成个应用,比如投票。办公领域,大多数都是标准化有范式的,比如新闻报道、项目报告、邮件、简历,都有套路,这正好是AI的强项,在办公的场景里,使用者大概率知道自己想要什么,那你就可以在AI这个基础上精调,而不会过分地去依赖AI产生的内容,它只是在这些像标准化、流程化或者被人重复了无数次的工作当中,去进行低灵活度地创造,所以能够帮你节省时间,而不是说就直接替你把活给干了,不过还真的有公司让AI当CEO,国内游戏公司网龙任命它的高管唐钰(数字虚拟人)出任公司的轮值CEO。
3、生成式AI还有一个应用方向就是图片生成,主流的有Midjourney、Open AI的DALL·E2、Stable Diffusion。图形处理器的王者是Photoshop,Adobe也推出了自己家的图像生成模型叫Firefly,它是把图像生成和图像处理再一结合。
4、视频生成的AI,比如Runway,还有音频方向。
5、还有一个应用方向是金融,Bloomberg彭博用数十年海量的数据500亿的参数训练出来的一个金融的专家BloombergGPT,同花顺的AI,在AI圈特别流行的应用叫做AutoGPT(自主机器人),它是一个大牛直接在Github上面放了一个开源的项目,它就是接入了GPT-4的接口然后就可以做出来一个自主运行的机器人。
6、还有一个应用方向是教育,虚拟老师教人语言,多邻国就接入了GPT-4叫做Duolingo Max,电商领域的Shopify就接入了ChatGPT来帮助商家去写那些详细的产品介绍。
7、还有编程方向,必备的编程神器Github Copilot。
四、人工智能的历史
1、1950年聊天机器人出现,计算机科学之父、人工智能之父的艾伦·图灵发表了一篇具有划时代意义的论文,他提出了模仿游戏(也就是图灵测试)当你不面对面的跟人家文字聊天,你能不能准确地判断出来对方是一个人还是个机器人,如果你要是很难分辨出来,那就一定程度上可以说这个机器它是智能的。
2、1966年的时候,MIT实验室里就发明出来一个聊天机器人叫Eliza,开发者给Eliza的设定是个心理治疗师,具有少说少错的特点。
3、1995年,Eliza又出来了一个后辈叫ALICE,日常的对话都可以对上了。Eliza和ALICE的原理都是基于Pattern Matching模式匹配,听到一个关键词,它就会调取一个已经预设好的预案。
4、语言学习里边新的流派出现了,这个也是人工智能里边非常重要的一部分,就是机器学习,就是让机器去学习,就是说我不给你人为规定一些规则和回答了,就给你一大堆现成的例子,让你自己取学习,找规律。2001年有了一个SmarterChild(更聪明小孩)的机器人,可以算得上ChatGPT的大前辈了。直到2007年的时候,它被一家巨头公司微软收购了。
5、到了2010年的时候,机器学习里边的一个领域开始闪光了,叫做人工神经网络,人的大脑其实是超过100亿个神经元通过网状链接来判断和传递信息的,虽然这每个神经元都很简单,但是它们组合起来就可以判断非常复杂的信息,所以这个人工神经网络,其实就是想模拟人脑这种形式,输入信息之后,就会经过若干个隐藏神经节点的判断,就跟神经元似的,然后给你输出结果。其实这个神经网络的思想早就有了,可以追溯到1960年代,但是它需要两样东西做支撑,大量的数据和强大的算力,而这些在之前都是不具备的,所以这个神经网络的事就是纸上谈兵。
6、到了2010年代互联网时代,数据肯定是有了,算力也是持续指数级别的提升,才让神经网络开始能应用起来,这个模式特别适合解决人们一看就知道就凭直觉那种事儿,比如你看到一张脸,你就能迅速知道他是谁,用神经网络、机器学习就能慢慢摸索出规律,现在它的应用已经非常广了,不光是人脸识别,像声音识别、自动驾驶,包括前几年下围棋打败柯洁的AlphaGO就是用这招练出来的。回到文字领域它的发展就不太顺,因为这个机器学习它一般用的是循环神经网络就是RNN来处理文字的,它主要的方式就是按顺序一个词一个词看,一个词一个词处理,问题就是它没法同时进行大量的学习,而且你的句子也不能太长,要不然你学到后面的时候前面都忘了。
7、直到2017年,谷歌出了一篇论文,提出来了一个新的学习框架叫做Transformer,具体的机制就比较复杂了,它可以让机器同时学习大量文字,很多自然语言处理模型,其实就是建立在它的基础架构之上的,谷歌那个BERT里头的T,包括ChatGPT的T都是指这个Transformer。
8、2015年,包括马斯克、彼得·蒂尔在内几个大佬一起注资了10亿美金成立了一家非营利组织叫OpenAI(也就是ChatGPT的母公司)来进行AI方面的研究,它非营利就是说它纯粹是为了推动这项技术的发展,所以它的研究成果包括专利都是对外公开的,马斯克,他的特斯拉在AI方面也需要大量的投入研究,搞自动驾驶什么的,所以就为了避免特斯拉跟OpenAI这两家公司的利益冲突,他就在2018年也就是OpenAI成立的第三年退出了董事会,就拜拜不玩了,现在这个OpenAI其实跟马斯克已经关系不大了,而OpenAI这些大牛呢,也确实很厉害,2018年发表了一篇论文,介绍了一个新的语言学习模型就是GPT,之前的语言学习模型基本都是需要人去监督的,或者人为给它设定一些标签,但是GPT就基本不怎么需要了,就把一堆数据放进去,他就一顿学,就给学明白了。
9、OpenAI在2018年6月推出了第一代GPT,接着在2019年11月又增加了训练的数据量推出了GPT-2,机器学习拼的就是一个是模型,一个是参数量,模型就是决定了机器怎么学,同样的数据我进去,我学得比谁都快,比谁都好,那你就厉害。而参数量它其实就需要大量的计算,所以说白了就是要砸钱,就算是模型再好,它也得靠砸钱去训练和验证,这两者缺一不可。OpenAI团队对我这个模型是很有信心,那下一步不就缺钱了吗?而你每进步一点都可能需要上升一个数量级的数据去支撑,这些都需要钱去支持,比如Google的DeepMind就是研究出来AlphaGO的那个公司,OpenAI这个非营利组织迫于资金压力,OpenAI就在2019年从非营利组织转型了,它没有直接变成一个营利组织,变成了一个收益封顶的营利组织,就是任何投资人的投资回报都不能超过100倍,超过100倍的部分投资人就拿不到回报了,就都归OpenAI自己了,这时候微软就冲了过来,注资10亿美元,这笔投资对双方都是双赢的,OpenAI这边,一是拿到了钱,第二,微软也给它建了一个全球第五的超级计算机,大大提升了它训练效率,微软也得到了OpenAI的技术和团队,这样的话OpenAI的成果就别想再公开了,OpenAI得到了超能力和算力支持,就准备开始大力出奇迹,它之前那个一代的时候只有1.2亿个参数,到了GPT-2是15亿个,GPT-3直接上升了100倍,变成了1750亿,效果果然就真的非常好,已经有一点现在这个ChatGPT的意思了,你问它什么它都能答出来。
10、在2022年3月推出了GPT-3.5,之后又对对话进行了优化,在2022年11月推出了ChatGPT,它其实就是一个非常极其简单、粗糙的聊天界面,两个月内,ChatGPT的月活就突破了一亿人,扩张速度肯定是史上最快。
11、2023年1月份,微软宣布给OpenAI再注资100亿美元,估值达到了290亿美元,微软要先保证投的100亿能收回来,然后微软持有OpenAI49%的股权,还有100倍投资回报的上限。2月7日,微软举办发布会,宣布要把ChatGPT融入到自己的搜索引擎Bing里边,微软就把它叫做“Copilot for the Web”(网络助手)。
五、ChatGPT的不足
它训练那些数据只截止到2021年,也就是说最近发生的事它都不知道。
微软针对ChatGPT这个问题的解决方案:微软把它跟Bing一结合,逻辑类的可以用ChatGPT,如果需要信息或者新闻,我拿Bing这么一搜就OK了。这个聊天功能必须用它自己家那个Edge浏览器才能用。
六、在这么势不可挡的AI发展浪潮之下到底有多少工作岗位会消失掉?
利用AI的暗黑方法,就是接下来在很多对AI无感的公司,尤其是非科技公司,未来一两年其实可能是打工人混日子的黄金时期,因为懂AI的下属用十分之一的时间就可以把工作做得比原来更好,但是不懂AI的老板还会给他们升职加薪,这意味着让老板尽可能慢的了解AI能力,同时让自己尽可能快的了解AI的能力将成为职场里的新博弈,人类是具有逆向思维的创造力的,不过这种投机取巧能混一时,混不了一世,在这股AI浪潮袭来之后,过去很多专注于完成工作任务的白领岗位的确会大量消失。
1、什么是工作任务?
比如给一个产品写促销文案,给PPT画一个插图,给项目做一个执行日程,或者给网上写一段前端代码,这些都是任务,而我们现在大多数传统公司里最大的问题就是创造了太多只负责完成任务的工作岗位,这些工作岗位的工作内容,其实完全配不上从业者受过的高等教育,这不就是所谓的“面试造航母,工作拧螺丝”,这种诡异的错位在即将到来的AI新时代迟早会被彻底摧毁,这方面的内容其实Open AI在3月21日还专门发过一篇论文,专门探讨GPT未来在不同岗位的渗透率,麦肯锡的统计发现,今天白领的工作内容里创造和决策的时间占不到7%,贡献专业技能的时间占不到14%,沟通交流的时间大概占16%,处理意外的时间占12%,这些时间全部加起来大概占到一半,那么另外一半时间就是用来做信息收集、信息处理还有做一些重复的可流程化和自动化的工作内容,工作本身是不会消失的,大那是整个社会可能会重新定义大量的工作,而那些重新定义后的工作,在不同模块的占比,也可能会出现变化,就是在所有工作时间里,创造和决策花的时间加上学习和研究花的时间会占到50%以上,然后沟通协作和处理意外可能会占据另外的40%,最后有10%的时间大家会用来告诉AI软件该干嘛。它属于自然语言编程,就是直接用人与人交流的语言去指导机器帮我们做网站、剪视频、写文章、生成研究报告,甚至自动做用户访谈,这意味着一个人就可以完成几十个人的工作任务了,但问题的关键还不在这里,问题的关键是完成这么多的任务到底是为了实现什么样的最终目的呢?研究如何实现目的,才是未来大部分工作需要干的事情。
2、AI时代的新工作需要什么新能力?
麦肯锡之前的一份报告里总结出了4大类、13组、56项技能,包括思辨、灵活性和统筹规划这样的认知能力,数据、算法、AI工作原理有了解的数字能力,人际沟通能力,其实都在我们通常认为的综合素质的范畴里,但是唯独没有一项,就是自我领导力,在大学是选修课,但在AI助手无比强大的未来,自我领导力就可能会成为大多数人的必修课,因为AI再强大,它也需要一个主人。GPT对教育的冲击在未来几年会变得非常明显,GPT-4的出现让我们对中国中小学教育整个教学体系产生了巨大的危机感,探讨GPT到来之后,我们急需要为现有的教育体系打的各种补丁,虽然现行的教育体系在人类智力秒杀机器的过去200年里,它一直都是非常work,但是今年以来,在短短的几个月时间里,我们就突然进入了机器智力超过人类智力的新时代,这很显然使得过去200年一直很work的教育方式突然就不work了。
3、什么样的新教育方式在接下来的十年还能有用呢?
个性化教育、项目制教育、社会情感教育,还有中国新萌芽的跨学科教育,这里面有很多全新的教育理念是可以帮助现在的孩子在AI时代成为受益者而不是受害者,所以尽管我们短时间内改变不了中国现行的教育体系,但至少可以看清楚它的不足,可以积极的去给他打补丁。
七、OpenAI在今年3月21日发布一篇论文,这篇论文是用OpenAI、OpenResearch、UPenn三家机构联合发布的,用的是美国劳工部的职业性质数据库,O*NET作为数据来源,研究对象是大语言模型,也就是LLM,对工作市场冲击,这应该也是OpenAI官方第一次公开的研究他们的技术抢工作的问题。
1、这次OpenAI研究出了什么东西呢?
情况并没有很糟,虽然他们预测未来80%的美国工作岗位会受到冲击,但这里面大部分的工作在可见的未来AI的暴露率Exposure只有10%左右。
2、这个暴露率是什么意思?
官方的定义是它表示用了GPT之后,是否会使人类执行这项任务所需的时间减少至少50%,理解这个定义其实很重要,这意味着因为即便一个工作的暴露率是100%,也只不过意味着AI会大幅度提升这个工作的效率,而不是AI会彻底取代这个工作,未来会大量消失的只有工作任务,而不是工作本身,从报告里我们也可以看出来,工作和工作之间的暴露率差别确实很大,这份报告里最招人眼球的就是薪酬越高的工作,未来的AI暴露率也会越高,比如他们发现数学家、税务师、金融量化分析师、作家、网页设计师、区块链工程师、法律助理、政策分析师,这些岗位的AI暴露率未来都会超过90%,这里面有些岗位比如税务师、法律助理暴露率高,但是数学家、作家、网页设计师,这些工作的暴露率会变得这么高,绝对是出乎所有人预料的。创造力是人类面对机器的一个大壁垒,但现在看来这个壁垒说没就没了。
3、ChatGPT是怎么突然就有了推理和创造力?
如果要分析这背后的技术原理,的确有点复杂会涉及到大量术语,这一轮的大语言模型LLM涌现了一个非常特殊的现象,叫做思维链,思维连并不是一种技术,它就是一种现象而已,我们可以把思维链的展开,比作一个人讲故事的过程,想象一下你正在和一群朋友讲故事,为了讲出一个好故事,你就需要确保情节紧密相连,角色有趣,符合逻辑,同时你还需要每过一段时间就让听众对故事有新的期待,让他们不至于走神,要做到这一点,我们的大脑就要像一个思维链一样,不断地在去串起各种回忆、想法、知识,然后把他们弄成一条链,类似的大型语言模型在处理文字输出时,也会通过不断发散和组合各种语言概念,然后构建出连贯和有创意的回答内容,这就是我们把他叫做思维链的原因,这条链串得越好,上下文的链接越紧密,故事就会显得越流畅,语言流畅这件事今天人工智能大模型已经做得非常好了,之所以能做到这一点,就是因为有思维链,这种思维链的现象其实在2021年OpenAI研发GPT-3的时候就出现了,当时研究人员意识到思维链的出现,其实就代表人工智能有了思考能力,因为有了它,AI模型接触到任何一个单词都可以一下子联想到跟这个单词相关的各种概念,比如它看到杯子就会联想到喝水、喝可乐,是玻璃的就会摔碎,是铁的就不会摔碎,可以拿来砸人,是圆柱形,也可以是方柱形,是容器可以跟茶壶搭配,这其实就很像人类念头产生的过程,有了这种基础能力,AI就有可能回答出来在互联网上从来没有出现过的答案,不管是人类的创作过程还是人类的思考过程,跟AI思维链的运作过程已经有点像了,区别在于机器可以比人的联想广度和速度更高,这可能使得它们瞬间能够联想出更多的东西,能够在同一时间推敲出更多种组合,而且只是文字,AI思维链现象在图像生成、数学解题等各种领域也全都出现了,所以最近这一年,AI才会突然在推理、写作、设计这种工作任务上同时表现出这么强的能力,高暴露率的工作,OpenAI这次其实也列出了他们认为暴露率很低的34个职业,这里面就包含了厨师、洗碗工、水泥工、运动员、管道工、矿机操作员等等,这些都是体力劳动岗位。如图:
4、不能被AI替代的那些工作,听起来都很接地气,那是不是说这份论文进一步证明了这次AI革命,革的是脑力劳动者的命,未来大部分人得去干体力劳动呢?
这的确是最近不少媒体得出的结论,但其实这个结论是错误的,因为这片论文里暴露率的意思是AI会使人类做任务所需的时间减少50%,所以高暴露率的工作不仅不会被淘汰,反而在未来可能让从业者的薪酬变得更高,职位的确可能大量减少,但剩下的新型脑力劳动者在未来效率会变得极其高,只不过这些新型的脑力劳动者需要面临一场角色的大转变,比如过去一个做网页设计师的人有了AI工具的帮助,未来可能会升级成营销设计师,一个营销设计师不仅要能设计网页,还要能够生成手绘,剪辑视频,撰写营销文案,搞定前端代码,还能设计公司虚拟人的形象,反正这一切几乎AI工具都可以帮他完成,所以他们的核心工作变成了判断哪些任务需要完成、定义不同任务完成的标准,这些都是更加高阶、更加抽象的技能,更关键是营销设计师必须花大量的时间去研究自己的设计到底要打动谁,这群人在生活里看什么内容、聊什么话题、喜欢什么电视节目这些东西,因为打动消费者才是营销设计师真正要实现的目的,这就是他需要从一个任务执行者转变成一个目标实现者,在AI浪潮来袭的时候,对于转得过来的目标实现者来说,AI是他的助手,但对于转不过来的任务完成者来说,AI就是他的阻力,接下来的5到10年,现实可能就是很残酷的,因为必然有很多人脑子是转不过来的,而那些转得过来的人,也可能需要学习一些全新的技能。
5、要成为一个目标实现者,需要什么新的技能呢?
这方面OpenAI在论文最后也出了它的答案,尽管说得不全面,他们认为科学思维和批判性思维将是人类在职场上区别于AI的两种最差异化的能力。
6、什么是科学思维?
就是基于证据,逻辑和推理,敢于一直持怀疑态度,去不停地去验证假设的一种思考方法,它需要我们能够不断通过观察去识别问题,提出假设,设计实验,然后验证数据,所以科学思维是一种不拍脑袋,不迷信,不盲从,强调务实求真的思考方式。
但相对而言,批判性思维的训练在中国的整个教育体系里就比较缺乏。
7、什么是批判性思维?
是一种在分析问题和做出决策时,能运用独立思考和辩证法来看问题的能力。拥有批判性思维的人会经常通过自省,从正反两面不断质疑自己的观点,他们不会使用非黑即白的二极管思考方式,而且经常能够理解“两害相权取其轻”这句话的涵义,这种思考方式非常适合于用来处理复杂问题,比如有时你连问题在哪里、是什么都不知道的时候,就非常需要批判性思维,在新一轮AI革命已经不可避免的今天,如何尽快有效的训练中国年轻人的批判性思维能力,真的是我们整个教育体系都要认真反思的大问题了。
相关文章
猜你喜欢