> 自媒体 > (AI)人工智能 > 一周国际财经|深度评测:谷歌PaLM 2 VS GPT-4,谁是最强大模型?马斯克为何选中她,揭秘推特新CEO;瑞士“爆雷”后,资金疯狂涌入这里
一周国际财经|深度评测:谷歌PaLM 2 VS GPT-4,谁是最强大模型?马斯克为何选中她,揭秘推特新CEO;瑞士“爆雷”后,资金疯狂涌入这里
来源:每日经济新闻
2023-05-22 16:11:37
430
管理

每经记者:李孟林 蔡鼎 谭玉涵 每经编辑:高涵,谭玉涵

5月11日,谷歌在今年的I/O开发者大会上一口气发布新版PaLM 2、升级版办公全家桶以及更加智能的Bard聊天机器人等多款AI产品。相比在2月的Bard翻车发布,这回似乎给自己挽回了一些颜面。但是否真的“一雪前耻”了呢?ChatGPT-4和PaLM 2,谁更强?《每日经济新闻》深度评测并采访西班牙游戏工程师、技术博客Orange’s AI主理人,给出你答案。

马斯克曾表示,“一旦我找到一个足够愚蠢的人来接手这份工作,我就会辞去推特CEO一职!”5月12日,马斯克发布推文官宣NBCUniversal原全球广告业务主管Linda Yaccarino将出任推特CEO。她有什么来头?“一周人物”为你揭秘号称广告界“天鹅绒之锤”的Linda Yaccarino。

瑞信危机中,瑞士监管局将瑞信160亿瑞郎AT1债券全额减计后,原本作为全球财富管理中心的瑞士信誉大幅受损,从而驱动避险资金从瑞士撤出,疯狂涌入新加坡。

更多内容, 尽在《一周国际财经》。

对决GPT-4,谷歌推出PaLM 2,谁更强?

深度评测给你答案

图片来源:谷歌I/O大会官方视频截图

当地时间5月10日,在一年一度的开发者大会上,谷歌连续放大招:推出最新大模型PaLM 2;官宣用生成式人工智能(AI)技术改造办公软件全家桶WorkSpace;升级后的聊天机器人 Bard向所有人开放。此外,多模态大模型Gemini正在紧锣密鼓地训练中,整合对话功能的谷歌搜索也将开启测试……

在生成式AI浪潮中慢了微软和OpenAI一步的谷歌,显然把这一次大会变成了“秀AI肌肉”的舞台。据美国媒体统计,两个小时里,谷歌演讲者提到了143次AI。

发布会上,谷歌DeepMind副总裁ZoubinGhahramani表示:“PaLM 2不只是功能更强大,它比以前的模型都更快速、高效。”

言语之间,GPT-4似乎是谷歌暗中较劲的对象。究竟PaLM 2和GPT-4(ChatGPT Plus试用版)相比表现如何?我们从文本生成、逻辑推理、数学能力、文本总结和编程能力五个方面做了深度测评。(注:由于Bard目前只支持英、韩、日三种语言,所以我们使用英文进行测试。)

资本市场的反响也很热烈,谷歌股价连续两天分别涨超4%。这一次,谷歌能否扳回一城?

编程、推理、造句…… PaLM 2仍有差距

谷歌这次发布会,外界最关注的是其最新大模型PaLM 2,以及由该大模型驱动的升级版Bard。深耕AI多年的谷歌此前被OpenAI抢了风头,有大模型加持的微软也对谷歌的搜索霸主地位构成严峻威胁,因而本次发布会被视为谷歌的反击战。据谷歌介绍,PaLM 2的主要提升在于:

1. 多语言能力:由100多种语言材料训练而成,理解、生成和翻译细微文本的能力大幅提高。

2. 推理能力:PaLM 2的广泛数据集包括包含了数学表达式的科学论文和网页,其逻辑、常识推理和数学方面的能力提升。

3. 编程:PaLM 2 在大量公开可用的源代码数据集上进行了预训练,擅长主流的编程语言,如Python和JavaScript,也可以用Prolog,Fortran和Verilog等语言生成专门的代码。

仅从文字描述来看,PaLM 2的性能似乎仅是在追赶和对齐GPT-4。不过,据谷歌官方发布的技术报告,在针对公开数学题数据集MATH、GSM8K和MGSM的训练上,PaLM 2的部分结果已经做到了超越GPT-4。

真实表现如何?以下是我们进行的深度评测。

1. 文本生成

我们这里采用了AI工程师Daniel Monge发明的“苹果测试”,即用英文单词“apple”结尾造十个句子。据Monge,这个问题看起来简单,但对于GPT和PaLM这样的自回归模型而言并不容易。

Bard给出的答案(3,14)是正确的,且给出了三种不太一样的回答(虽然解法是一样的)。

图片来源:视觉中国

据美联社报道,美国白宫和国会助手表示,美国总统拜登原定于当地时间12日与国会领导人就债务上限问题进行谈判,目前,该会谈已被推迟至下周。

当地时间11日,七国集团财长和央行行长会议在日本新潟召开。美国财政部长耶伦在会前再次警告说,美国如果发生债务违约将引发严重后果,将令美国和世界经济都遭受重创。

国际货币基金组织发言人科扎克在同日表示,该组织暂时无法具体量化美国债务违约对全球经济的影响,但由此造成的利率上升或将导致美国银行业进一步动荡。国际货币基金组织敦促美国各方紧急解决当前的债务上限问题,避免出现债务违约。

瑞士“爆雷”后,避险资金盯上这里

图片来源:央视新闻

5月11日,英国国防大臣华莱士向英国议会证实,英国正向乌克兰提供“风暴之影”巡航导弹,这将令乌克兰军队有能力打击位于战线后方的俄军部队、弹药库和燃料库。此外,华莱士称,英方提供的“挑战者-2”主战坦克已全部移交给乌克兰。

“风暴之影”导弹由欧洲导弹集团制造,该型导弹由战机发射,其射程超过250公里。

对于英国向乌克兰提供巡航导弹,俄罗斯总统新闻秘书佩斯科夫11日表示,俄罗斯持极其否定的态度,俄方将会采取必要的回应措施 。

微软下注核聚变,与Helion签订购电协议

图片来源:视觉中国

当地时间周三(5月10日),核聚变初创公司Helion能源在官网宣布,科技巨头微软已同意从公司首座核聚变发电站购买电力。

作为电力购买协议的一部分,Helion预计将在2028年之前将其聚变发电装置上线,并在商定的一年内达到50兆瓦或更高目标的发电量。当聚变装置完全能达到产生50兆瓦能量的速度时,它将能够为华盛顿州约40000户家庭供电。

据CNBC,Helion成立于2013年,总部位于华盛顿州埃弗雷特,拥有约150名员工。到目前为止,Helion已经筹集了超过5.7亿美元的私人资本。值得注意的是,OpenAI的创始人Sam Altman也是Helion早期和最重要的投资者之一,他向Helion投资了3.75亿美元,外媒称这是其“有史以来”最大的投资。Altman认为,Helion和OpenAI同样重要,并且都是人类未来的相关组成部分。

记者:李孟林 蔡鼎 谭玉涵

编辑:高涵 谭玉涵

视觉:刘青彦

排版:谭玉涵

每日经济新闻

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
跟人没话说?找不到话题?101个聊天话题建议收藏
标题:聊天话题的重要性:为什么101个聊天话题建议值得收藏聊天,是我们..
微软ChatGPT 版必应实测来了!真的完爆 Google吗?
冰火两重天,这是两天内接连开了 AI 搜索新品发布会的微软、Google 的境..
不堪入目的情侣聊天记录
两个人感情好不好,从聊天记录就可以看出来。热恋中的情侣,多以甜蜜、恩..
金融人又慌了?ChatGPT解锁新用法:破解美联储“谜语”,预测股票走势..
生成式AI风暴来袭,ChatGPT会抢走金融分析师的饭碗吗?好消息是,像ChatG..
从OpenAI 「即将破产」谈起,生成式 AI 市场需要更多冷静..
最近有消息称 OpenAI 每天的成本高达 70 万美元,以此来推算,这家明星创..
人际沟通,掌握5大原则、22个聊天技巧,助你和任何人都聊得来..
在一个繁忙的都市,有一个名叫小明的年轻人,他对人际沟通有着深刻的见解..
ChatGPT热潮下的冷思考:人工智能将如何影响人类的未来?..
“在接下来的五年中,会思考的计算机程序将阅读法律文件并提供医疗建议。..
道德沦丧!师范大学某书记和已婚妇女大尺度聊天,底线没了..
据最新报道,安庆师范大学近日曝出一起道德问题事件,一位书记与一名已..
GPT-4 即将亮相——聊聊我们已经知晓的一切
GPT-4 正式发布的日子越来越近了。官方信息、当前趋势、未来预测,都在这..
关于作者
经典好看视频..(普通会员)
文章
353
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40329 企业收录2981 印章生成185358 电子证书787 电子名片49 自媒体20213

@2022 All Rights Reserved 浙ICP备19035174号-7
1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索