GPT 非常详细且精准地描述出了图片上的内容,并且有思维条理的解释了为什么这张图会让人觉得好笑。
而在文字问答方面,GPT-4 也有非常大的提升,它在专业领域上的回答,全方位碾压了老版本。
比如,在统一律师考试( Uniform Bar Exam )中,GPT-4 可以超过 90% 的人类考生,而老版本只能超过 10% 的人类考生,相当于一个是考第一名,一个是考倒数第一名。
在 GRE 数学考试中 GPT-4 可以考 163 分( 170 分满 )超过 80% 的考生,老版本只能超过 25% 的考生。
在 GRE 语文( 阅读与填空 )考试中 GPT-4 可以考 169 分( 170 分满 )超过 99% 的考生,而老版本只能超过 63% 的考生。
单从这两门的分数来看,GPT-4 到了可以申请哈佛、麻省理工、斯坦福大学的水平。
更多考试对比
不只是知识渊博,GPT-4 相较于老版本,还可以成为更好的导师。
如果你提出一个问题,老版本的 ChatGPT 会一股脑的回答,而 GPT-4 可以像一名真正的人类老师一样一步一步引导、鼓励你思考并获得答案。
同样的问题问老版本 ChatGPT 的回答如下:
新老版本的回答都是正确的,并且对答案的解释程度相仿,区别不大。
所以,我们问了一些更需要 “ 创造性 ” 或是 “ 思考 ” 的问题,比如:
关于最近一次特斯拉投资者大会上 “ 实现全球可持续能源 ” 的计划,你觉得是可行的吗?为什么可行?
GPT-4 的答案如下图,虽然 GPT-4 的知识库还没有覆盖半个月前的那场投资者大会,但它给出的思路与特斯拉投资者大会上的思路惊人地相似。
而老版本 ChatGPT 的回答就逊色了很多,没有条理,还有一堆车轱辘话,没有建设性观点。
老版本 ChatGPT 的回答如下:
两个回答的主体思路相仿,但 GPT-4 对问题的回答更加细致有条理,并且含有更多专业词汇与内容。
我们又继续问了一个最近在国内互联网上比较火的社会现象问题:
现在越来越多的白领不想坐在写字楼里上班,而是想辞职去干体力活,你觉得原因是?
ChatGPT-4 的回答是:
ChatGPT-4 的回答明显比老版本的回答要维度更宽、思考更深,老版本的回答有些浮于表面,而新版本则是 “ 更具有深度思考 ”。
我们又继续问了一个关于互联网文化的问题:
为什么人们热衷于把某个网络热梗不断地进行抽象?
ChatGPT-4 的回答是:
老版本 ChatGPT 的回答是:
结果跟前几个问题有些像,ChatGPT-4 相较于老版本,更具富含逻辑,更能深度剖析问题,似乎在试图解构问题中的互联网文化。
总的来讲,这次发布的 ChatGPT,无论是基础功能、想象空间、逻辑能力、思考能力,都比之前强了一大截。
距离老版本 ChatGPT 颠覆我们的认知,才没过去几个月,这个发展速度,我们只能说是:
恐怖如斯。
相关文章
猜你喜欢
成员 网址收录40385 企业收录2981 印章生成229459 电子证书1008 电子名片58 自媒体46096