一觉醒来,GPT-4刷屏了,这个场面怎么说呢,有点混乱。吃瓜群众一边津津乐道,一边瑟瑟发抖。
津津乐道的是那些革命性的新功能,瑟瑟发抖的是硅基人距离取代碳基人又前进了一步。
看这成绩,最牛掰的是生物奥林匹克竞赛考试和GRE考试,都击败了99%的参考者。
律考也很厉害(Uniform Bar Exam),排位能达到前10%。而GPT-3.5参加律考,只能排到倒数10%。
刷其他题也不含糊,比如SAT数学,可以考到700分(相当于92%分位),而GPT-3.5的水平是590分(大约相当于70%分位)。
结合上一项识图能力,我觉得更加终极的考试场景是↓
你拍一张“黄冈密卷”给它,它就直接把答案给你写出来了
接下来,我把ChatGPT的模型换成GPT-4,再问同样的问题,这次答案看着靠谱了许多,看来做了不少功课。
我在ChatGPT里试了一下GPT-4模式,确实有点卡,而为了防止广大热心吃瓜群众过多请求,官方还做了限制:每四个小时,最多响应100条信息。
而且因为图片输入的模式只是预览,所以ChatGPT的GPT-4模式也只能输入文本。
GPT-4模式还有个问题:它的训练数据集跟GPT-3.5一样,还是截止到2021年9月。
也就是说,GPT-4有个更聪明的脑子,脑回路更清晰,但是它的知识结构还是跟以前一样的。书读的不多,还是那些陈芝麻烂谷子。
好了GPT-4的瓜,我们就先吃到这里吧。
总体感受是,现在说人工智能的奇点已到,还为时尚早,但大家太需要一个突破口了,所以才会“全民练模型,人人GPT”。
但我们真的需要那么多大模型吗?
大模型太多,客户场景有点不够用了
相关文章
猜你喜欢