> 自媒体 > (AI)人工智能 > 一周国际财经|深度评测:谷歌PaLM 2 VS GPT-4,谁是最强大模型?马斯克为何选中她,揭秘推特新CEO;瑞士“爆雷”后,资金疯狂涌入这里
一周国际财经|深度评测:谷歌PaLM 2 VS GPT-4,谁是最强大模型?马斯克为何选中她,揭秘推特新CEO;瑞士“爆雷”后,资金疯狂涌入这里
来源:每日经济新闻
2023-05-22 16:11:37
519
管理

每经记者:李孟林 蔡鼎 谭玉涵 每经编辑:高涵,谭玉涵

5月11日,谷歌在今年的I/O开发者大会上一口气发布新版PaLM 2、升级版办公全家桶以及更加智能的Bard聊天机器人等多款AI产品。相比在2月的Bard翻车发布,这回似乎给自己挽回了一些颜面。但是否真的“一雪前耻”了呢?ChatGPT-4和PaLM 2,谁更强?《每日经济新闻》深度评测并采访西班牙游戏工程师、技术博客Orange’s AI主理人,给出你答案。

马斯克曾表示,“一旦我找到一个足够愚蠢的人来接手这份工作,我就会辞去推特CEO一职!”5月12日,马斯克发布推文官宣NBCUniversal原全球广告业务主管Linda Yaccarino将出任推特CEO。她有什么来头?“一周人物”为你揭秘号称广告界“天鹅绒之锤”的Linda Yaccarino。

瑞信危机中,瑞士监管局将瑞信160亿瑞郎AT1债券全额减计后,原本作为全球财富管理中心的瑞士信誉大幅受损,从而驱动避险资金从瑞士撤出,疯狂涌入新加坡。

更多内容, 尽在《一周国际财经》。

对决GPT-4,谷歌推出PaLM 2,谁更强?

深度评测给你答案

图片来源:谷歌I/O大会官方视频截图

当地时间5月10日,在一年一度的开发者大会上,谷歌连续放大招:推出最新大模型PaLM 2;官宣用生成式人工智能(AI)技术改造办公软件全家桶WorkSpace;升级后的聊天机器人 Bard向所有人开放。此外,多模态大模型Gemini正在紧锣密鼓地训练中,整合对话功能的谷歌搜索也将开启测试……

在生成式AI浪潮中慢了微软和OpenAI一步的谷歌,显然把这一次大会变成了“秀AI肌肉”的舞台。据美国媒体统计,两个小时里,谷歌演讲者提到了143次AI。

发布会上,谷歌DeepMind副总裁ZoubinGhahramani表示:“PaLM 2不只是功能更强大,它比以前的模型都更快速、高效。”

言语之间,GPT-4似乎是谷歌暗中较劲的对象。究竟PaLM 2和GPT-4(ChatGPT Plus试用版)相比表现如何?我们从文本生成、逻辑推理、数学能力、文本总结和编程能力五个方面做了深度测评。(注:由于Bard目前只支持英、韩、日三种语言,所以我们使用英文进行测试。)

资本市场的反响也很热烈,谷歌股价连续两天分别涨超4%。这一次,谷歌能否扳回一城?

编程、推理、造句…… PaLM 2仍有差距

谷歌这次发布会,外界最关注的是其最新大模型PaLM 2,以及由该大模型驱动的升级版Bard。深耕AI多年的谷歌此前被OpenAI抢了风头,有大模型加持的微软也对谷歌的搜索霸主地位构成严峻威胁,因而本次发布会被视为谷歌的反击战。据谷歌介绍,PaLM 2的主要提升在于:

1. 多语言能力:由100多种语言材料训练而成,理解、生成和翻译细微文本的能力大幅提高。

2. 推理能力:PaLM 2的广泛数据集包括包含了数学表达式的科学论文和网页,其逻辑、常识推理和数学方面的能力提升。

3. 编程:PaLM 2 在大量公开可用的源代码数据集上进行了预训练,擅长主流的编程语言,如Python和JavaScript,也可以用Prolog,Fortran和Verilog等语言生成专门的代码。

仅从文字描述来看,PaLM 2的性能似乎仅是在追赶和对齐GPT-4。不过,据谷歌官方发布的技术报告,在针对公开数学题数据集MATH、GSM8K和MGSM的训练上,PaLM 2的部分结果已经做到了超越GPT-4。

真实表现如何?以下是我们进行的深度评测。

1. 文本生成

我们这里采用了AI工程师Daniel Monge发明的“苹果测试”,即用英文单词“apple”结尾造十个句子。据Monge,这个问题看起来简单,但对于GPT和PaLM这样的自回归模型而言并不容易。

Bard给出的答案(3,14)是正确的,且给出了三种不太一样的回答(虽然解法是一样的)。

图片来源:视觉中国

据美联社报道,美国白宫和国会助手表示,美国总统拜登原定于当地时间12日与国会领导人就债务上限问题进行谈判,目前,该会谈已被推迟至下周。

当地时间11日,七国集团财长和央行行长会议在日本新潟召开。美国财政部长耶伦在会前再次警告说,美国如果发生债务违约将引发严重后果,将令美国和世界经济都遭受重创。

国际货币基金组织发言人科扎克在同日表示,该组织暂时无法具体量化美国债务违约对全球经济的影响,但由此造成的利率上升或将导致美国银行业进一步动荡。国际货币基金组织敦促美国各方紧急解决当前的债务上限问题,避免出现债务违约。

瑞士“爆雷”后,避险资金盯上这里

图片来源:央视新闻

5月11日,英国国防大臣华莱士向英国议会证实,英国正向乌克兰提供“风暴之影”巡航导弹,这将令乌克兰军队有能力打击位于战线后方的俄军部队、弹药库和燃料库。此外,华莱士称,英方提供的“挑战者-2”主战坦克已全部移交给乌克兰。

“风暴之影”导弹由欧洲导弹集团制造,该型导弹由战机发射,其射程超过250公里。

对于英国向乌克兰提供巡航导弹,俄罗斯总统新闻秘书佩斯科夫11日表示,俄罗斯持极其否定的态度,俄方将会采取必要的回应措施 。

微软下注核聚变,与Helion签订购电协议

图片来源:视觉中国

当地时间周三(5月10日),核聚变初创公司Helion能源在官网宣布,科技巨头微软已同意从公司首座核聚变发电站购买电力。

作为电力购买协议的一部分,Helion预计将在2028年之前将其聚变发电装置上线,并在商定的一年内达到50兆瓦或更高目标的发电量。当聚变装置完全能达到产生50兆瓦能量的速度时,它将能够为华盛顿州约40000户家庭供电。

据CNBC,Helion成立于2013年,总部位于华盛顿州埃弗雷特,拥有约150名员工。到目前为止,Helion已经筹集了超过5.7亿美元的私人资本。值得注意的是,OpenAI的创始人Sam Altman也是Helion早期和最重要的投资者之一,他向Helion投资了3.75亿美元,外媒称这是其“有史以来”最大的投资。Altman认为,Helion和OpenAI同样重要,并且都是人类未来的相关组成部分。

记者:李孟林 蔡鼎 谭玉涵

编辑:高涵 谭玉涵

视觉:刘青彦

排版:谭玉涵

每日经济新闻

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
苹果芯跑大模型不用降计算精度,投机采样杀疯了,GPT-4也在用..
梦晨 发自 凹非寺量子位 | 公众号 QbitAI专攻代码的Code Llama一出,大家..
国内科技巨头开卷ChatGPT,资本狂欢的背后,是更大的隐忧..
#ChatGPT#不知道大家听说过ChatGPT吗?最近这段时间ChatGPT在网络上的热..
团伙3个月“养”17万个QQ号,专卖给“裸聊”诈骗人员获利百万元..
“裸聊”诈骗团伙的“美女”是如何做到利用QQ诈骗,且被封号后又能换新号..
ChatGPT他\\她\\它大热,我们也来体验一次!
(本篇文篇章共1985字,阅读时间约3分钟)搜索整合能力较强,围绕问题中..
王小川:未来不会用ChatGPT的人,就如同今天还不会用Internet、用搜索的人..
三言科技 5月14日消息,日前,360集团创始人周鸿祎和百川智能创始人兼CEO..
亚马逊被曝研发聊天机器人,剑指Chat GPT
亚马逊AI布局战略亚马逊坚信,生成式AI将成为公司增长的新动力。这一点可..
聊天即可赚钱!大厂社交App陪聊灰产泛滥,被指诱骗男用户充值..
本文来源:时代财经 作者:谢斯临 图片来源:心遇App截图而如果用户以女..
你知道GPT-4发展到什么程度了吗?
GPT-4在默默更新了多个功能之后,早已有了惊艳世人的各种新能力,简直是..
十大券商最新研判!ChatGPT新功能可帮助选股?绍兴一干部飙英语走红…来看..
点蓝字关注,不迷路~综合央视新闻、华尔街见闻、央视财经、澎湃新闻、中..
关于作者
经典好看视频..(普通会员)
文章
614
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40369 企业收录2981 印章生成216706 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved 浙ICP备19035174号-7
1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索