Bard的回答
测试者猜测,Bard从求职平台Career Explorer中找到了这两个数字,然后为其编了个毫无关联的来源。
而Bing给出的回答中显示,据Zippis的调查,纽约市水管工的平均年薪为63889美元,平均时薪为30.72美元。它的回答既有具体的数字,也给出了数字的引用来源链接,用户可以直接点击查看数据来源。
Bing的答题步骤
ChatGPT的回答同样给出了解题步骤,“通过将2230乘以0.2,然后再把得到的数字加到原始数字上,就可以得到最终答案了。”
ChatGPT提供的RAM安装步骤
六、提供一份巧克力蛋糕食谱除了提示程序安装步骤之外,生成一份食谱也是个非常考验聊天机器人创造力的请求。
测试者提出了一个请求:让它们推荐一份用香草糖霜制作的巧克力蛋糕的食谱,并提供这份食谱的来源。
它们提供的食谱中可能会有完全不同的面粉、水、黄油、鸡蛋与糖的比例,导致最终做出的蛋糕更蓬松、更干或是更湿润。
Bard提供的蛋糕配方误估了时间和克数,配方中蛋糕的烘烤时间完全不够,用户按照它提供的配方只能得到一堆软塌的面粉黄油混合物。
Bard制定的马拉松训练计划
Bing几乎没有费心做推荐,直接链接了知名跑者杂志《Runner’s World》上的一篇文章。这种偷懒的做法有点让人失望,毕竟这次测试就是为了看看它们的回答,而不是直接得到一份跑步爱好者们的专业建议。
Bing提供了外部网站链接
ChatGPT详细列出一个完整的训练时间表,并建议跑步者的速度与平时训练时的速度相似,这份回答完全可以当作一份跑步训练模板来使用。
但它最大的问题在于不知道回答应该在哪里就打住,它制定的计划太过于详细,没有满足测试者简洁清晰的要求。
ChatGPT的回答
结语:狂飙之后的AI语言模型,更需加速追赶差距这些在不同应用场景下的测试把每个聊天机器人的优劣势都充分展示了出来。如果用户想用聊天对话的方式来获取一些创意写作、归纳推理方面的灵感,ChatGPT一定是首选;如果是想搜索网络资源,并且快速获取一个快速跳转链接的话,Bing则更合适一些;而Bard目前的表现在各方面都略逊一筹。
在人与人之间的技能差异被AI语言模型逐步放大的过程中,我们也能清晰感知到语言模型之间的能力差距。
但我们需要明白,无论是人类自身,还是ChatGPT、Bing、Bard等语言模型,进步一定是个持续的过程。这些聊天机器人们目前所展示出的形态还只是技术进步中的一环,但目前他们所能做到的事已经震惊了全世界,所带来的冲击力甚至远大于之前的移动互联网造成的影响。
无论是功能已经越来越全面的ChatGPT也好,暂时落后一步的Bard也好,当我们以发展的目光来看待它们所带来的技术变革时,就会对它目前欠缺的能力更加宽容,我们需要以一种更为长远的深刻洞察来对待它们。
相关文章
猜你喜欢