> 自媒体 > (AI)人工智能 > 我们同时问了GPT-4和文心一言10个问题,这是它们的回答
我们同时问了GPT-4和文心一言10个问题,这是它们的回答
来源:华尔街见闻
2023-04-28 16:49:43
291
管理

在昨天文心一言的发布会上,百度CEO李彦宏说,文心一言的体验“还称不上完美”,但百度至少是最先推出成型产品的大厂之一,并且,作为扎根于中国市场的大语言模型,文心一言具备“中文领域最先进的自然语言处理能力”。

不过,百度的发布会正赶在GPT-4登场的第二天,因为发布会现场使用了录播进行演示,因此被市场解读为百度的信心不足。但花旗银行、美国银行的分析师在试用文心一言后,普遍给出了正面的评价。百度的股价也在今日飙升15%。

华尔街见闻在收到内侧邀请码后,第一时间体验了文心一言。我们也好奇,相隔一天发布的GPT-4和文心一言,各自有什么特点?谁更加出色?

我们分别向文心一言和已升级GPT-4的Bing Chat提出了10个问题,下面是它们的回答。

01 能否用“鲍威尔停下来”,生成一首藏头诗?

第一个问题,我们请文心一言和GPT-4分别用“鲍威尔停下来”,写一首藏头诗。

这是文心一言的回答:

可以看到,文心一言的答案要更加简洁清晰,而GPT-4的回答则更像是对网页内容的摘录汇总,不过相比之下,百度的回答更宽泛,可能放之四海而皆准,GPT-4的答案更具针对性。

03 欧美银行业危机可能会蔓延到哪些领域?

我们接着询问了它们对欧美银行业危机后续发展的看法。

文心一言回答道:

不知道它的“根据以上知识”是从何而来。这里的回答完全不对题,而且句子出现了严重的错乱。甚至说“预计第一次加息将在22年上半年进行”,还认为加息“取决于奥密克戎的传播速度”。

虽然它给出了美国经济陷入衰退的具体时间节点。但内容却似乎是研报内容的拼接,且所引数据来源不明。美国2月PMI实际公布于本月初,而非“本周一”。美国2季度GPD数据也要等到今年7月才会公布。

GPT-4回答道:

GPT-4回答道:

希望它们都是真心这么认为的。

09 请你以哲学家齐泽克的口吻点评当前的人工智能热潮

接下来,我们想请它们cosplay一下当红哲学家齐泽克。

但文心一言似乎并没有这方面的语料,只是给出了一个相当机械的回答:

而GPT-4似乎没有读懂题目里的“在百度之后”,在列举了一大堆互联网公司后,GPT-4又绕回去了,认为百度最有可能做出下一个AI聊天机器人。

ONE MORE THING 假设文心一言是一个人类,请帮我画一幅她的肖像。

最后一个问题,是单独留给文心一言的。文心一言目前集成了AIGC作画功能,GPT-4暂时还用不了。

我们请它为自己创作了一幅肖像画,这是它的作品:

文心一言表现比预期要好

综上,我们认为,文心一言的表现比大众预期要更好。虽然在使用体验上和GPT-4有一定差距、出错的概率高一些,但对中文的理解显然要更强。

要知道,初代的ChatGPT也有很大概率“胡言乱语”,在中文支持上也远逊于文心一言。目前百度展示出的产品,至少让我们看到它了在AI领域的深厚积淀。假以时日,文心一言想必还能做得更好。

如果你还有其他感兴趣的问题,可以在评论区留言,我们会帮你问问文心一言。

本文来自华尔街见闻,欢迎下载APP查看更多

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
冷冷的太阳..(普通会员)
文章
377
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40329 企业收录2981 印章生成186856 电子证书796 电子名片49 自媒体20954

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索