明敏 萧箫 发自 凹非寺
量子位 | 公众号 QbitAI
科大讯飞版ChatGPT产品,提前交卷了!
就在昨夜,讯飞骤然向开发者提供了内测通道,取名为讯飞星火认知大模型对外开启内测。
还有个神奇的英文名字Spark Desk,据说有“火花桌面智能助手”的意思。
当然,科大讯飞大模型能力究竟如何,最好还是能实测后再说。
所以第一时间拿到内测邀请的我们,也连夜完成了测试。详情如下:
浅测讯飞大模型登录进去后,首先看到的是讯飞星火认知大模型的自我介绍:
我能学习和理解人类的语言,进行多轮对话、回答问题和高效地帮助人们获取知识和灵感。
△我们去了图片ID水印,可能导致截图文字不清楚(还望大家理解)
再来一个脑筋急转弯试试。
讯飞星火的回答非常一本正经:首先表示“玉皇大帝是否存在这个事情不是我AI可以下结论的”,这个问题驴唇不对马嘴,玉皇大帝住哪的设定和现代科学没有关系。
但你要非要我说点啥,我只能说或许玉皇大帝可能在地球上空吧。
不过这段回答里也有个小bug,即在东亚宗教信仰里天界包括天堂和神界(?)
实际上,在一些弱智吧问题里,讯飞星火的表现往往是懂了但没完全懂。
比如它知道焚书坑儒的事,但是又解释不清楚衍生出来的地狱笑话。
提的要求它都基本满足了,不过紫菜汤为啥曾是渔民的希望?是我理解不了AI的深意了。
换成周杰伦的风格呢?
表现也还不错,马上替换了后三句的内容。怀念童年也是周董歌里经常出现的主题了。
如果它接错了,提醒下能改正回来,也表现出了一定的多轮对话能力:
那么再看看数学能力?
基本的加减法、鸡兔同笼应对起来都很轻松了。
不过在高数方面还是有点困难,让它求解:f(x)=x(x-1)(x-2)(x-3),f’(0)=?
即便在我们提醒它算错了情况下,修正起来也比较困难(正确答案为-6)。
除了有一个小bug(函数外不能return)外,简单修改后可以运行。
分析基本逻辑问题也OK:
当然也被绕到过沟里,回答出了“贾母找人搬机器”的瞎话:
以上就是我们对讯飞星火的一个浅浅测试。
能力水平已经看到了,而大模型本身让人好奇的,还有它的技术细节~
提前扒扒它的“模型底细”毕竟讯飞大模型还没正式发布,所以我们试着先从它自己这里“探探口风”。
看看能不能通过问相关问题,提前摸出一些关于它的资料来。
先是名字由来。讯飞星火认知大模型给出了技术向、公司向和文化向三个方面的回答,有议论文内味了:
所以,讯飞大模型是否和ChatGPT一样,用了RLHF呢?它自己的回答竟然是没有:
用户也不能通过指令直接让它访问某个网站,查询特定信息,应该是加了某些限制:
换而言之,就是还在继续迭代,估计在正式发布前还会更新一版模型。
目前来看,科大讯飞的这个讯飞星火认知大模型,表现已算不错。
而且要知道,讯飞原计划给出的交卷时间是5月6日,现在突然发布内测,相当于不仅没跳票,还“反向跳票”了一波。
这样来看,除了科大讯飞在这NLP和认知智能方面确实有很深的技术积累以外,也说明,讯飞的技术和工程团队实战能力值得关注一波——不仅能打硬仗,而且“说到做到”。
现在距离正式发布还有10天,你期待讯飞的大模型迭代出什么新效果?
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
相关文章
猜你喜欢