> 自媒体 > (AI)人工智能 > 考进哈佛!能识图还能角色扮演!chatGPT4.0强到离谱!发布会解读
考进哈佛!能识图还能角色扮演!chatGPT4.0强到离谱!发布会解读
来源:财经Lian
2023-08-17 16:52:19
408
管理

考进哈佛!能识图还能角色扮演!

chatGPT4.0强到离谱!发布会全程解读

莫道桑榆晚,为霞尚满天。我是财经廉,你一个懂财经的朋友

OpenAI表示,新版本在镁国41个州和地区的律师资格考试中获得的分数,排名前10%左右。

根据该公司的测试,它还可以在SAT考试中获得1300分(满分1600分),在生物、微积分、宏观经济学、心理学、统计学和历史等先修课程高中考试中获得5分(满分5分)。

而更早的版本未能通过律师资格考试,在大多数大学先修考试中的得分也没有那么高。

9. 不擅长讨论未来

尽管新机器人似乎可以对已经发生的事情进行推理,但当被要求对未来做出假设时,它就不那么熟练了。

它似乎借鉴了其他人所说的话,而不是进行新的猜测。

当埃齐奥尼问新机器人,“NLP(自然语言处理)中需要解决的重要问题是什么?未来十年的研究?”它无法提出全新的想法。

10. 它仍然有“幻觉”

新机器人仍在编造东西,这个问题被称为“幻觉(hallucination)”,困扰着所有领先的聊天机器人。

因为GPT不了解什么是真什么是假,它们可能会生成完全错误的文本。

当被要求提供描述蕞新癌症研究的网站地址时,它有时会生成不存在的互联网地址。

在其他考试也呈现出类似对比效果,如果光是“跑分”,ChatGPT-4 属于是可以考进哈佛、斯坦福的水平。

既然它考试那么厉害,我们学生是不是可以借助它的能力,帮助我们复习,也考上名校呢?

当然用它作弊是不允许的。

更重要的是,Open AI 还说 GPT 4 比之前模型都更安全了。

在 OpenAI 的内部测试中,GPT 4 被“骗”到回复出不当答案的几率下降了 82%,聊起敏感话题时(如医疗),它的回复合规性也提高了 29%。

不过,OpenAI 也承认,即便如此,GPT-4 在“社会偏见、幻觉和对抗性提示”上仍存在限制。

除了普通图片,GPT-4还能处理更复杂的图像信息,包括表格、考试题目截图、论文截图、漫画等,例如根据专业论文直接给出论文摘要和要点。

此外,该公司还表示,GPT-4在许多专业测试中表现出超过绝大多数人类的水平。

OpenAI,GPT-4参加了多种基准考试测试,包括镁国律师资格考试Uniform Bar Exam、法学院入学考试LSAT、“镁国高考”SAT数学部分和证据性阅读与写作部分的考试,在这些测试中,它的得分高于88%的应试者。

OpenAI,在内部评估中,GPT-4产生正确回应的可能性要比GPT-3.5高出40%。

而且GPT-4是多模态的,同时支持文本和图像输入功能。

OpenAI称,GPT-4比以前的版本“更大”,这意味着其已经在更多的数据上进行了训练,并且在模型文件中有更多的权重,这使得它的运行成本更高。

据OpenAI介绍,在某些情况下,GPT-4比之前的GPT-3.5版本有了巨大改进,新模型将产生更少的错误答案,更少地偏离谈话轨道,更少地谈论禁忌话题,甚至在许多标准化测试中比人类表现得更好。

不过, 与早期的GPT模型一样,GPT-4仍然存在一定的局限性。

OpenAI称,它并不完全可靠,可能会出现推理错误 ,“GPT-4缺乏对绝大多数数据切断后(2021年9月)发生的事件的了解,并且无法从中吸取经验教训……它有时会出现简单的推理错误,它会轻信用户明显的虚假陈述,有时它会像人类一样在难题上失败,例如在它生成的代码中引入安全漏洞。”

基于此,OpenAI提醒,用户在使用语言模型时应格外小心,蕞好辅助以人工复查、附加上下文、或完全避免在高风险情况下使用它。

由于限于Plus订阅用户使用,当晚,大批新订用户涌入,以至于OpenAI的付款后台被挤爆了。

OpenAI,摩根士丹利正在使用GPT-4来组织数据,而电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。

其他客户还包括语言学习公司Duolingo、Khan Academy和冰岛。

据不完全统计,截至今年3月初,A股已有近20家上市公司宣布相关业务已经接入类似ChatGPT技术,或正在研究相关技术与数字人结合的应用场景。

国盛证券在研报中表示,以GPT系列为代表的大型语言模型(LLM)能教会机器以统计方式理解自然语言,完成此前人类进行的内容读取和理解。

随着多模态带来的模型普及化,人工智能将向着拥有人类解释能力这一目标更进一步。

详细翻读了 OpenAI 给出的技术文档后,我们发现 GPT-4 还抓取药物清单中的关键信息,包括但不限于:

找到类似类似性质的化合物;

对它们进行修改,以确保它们没有被专利保护;

从供应商处购买(甚至包括发送带有采购订单的电子邮件)。

这意味着它拥有发现新药物的能力。

还有人直接生成了一个“一键起诉”功能,用于针对发送骚扰电话的自动拨号软件起草起诉书,要求其赔偿 1500 美元,将大大降低律师的工作量。

同时百度研发的chatGPT,“文心一言”新闻发布会也将在3月16日举行,我也会同步关注,把消息同步给大家。

莫道桑榆晚,为霞尚满天。感谢关注我是财经廉,你一个懂财经的朋友

特别声明

本号发布的内容仅为财经Lian所有

财经Lian发布此信息的目的在于传播更多信息,文章内容仅供参考和学习交流之用,不对您构成任何决策建议。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
敞篷设计,360度全景视野,丰田普拉多ROX概念车来了
丰田在2024年SEMA展会上推出了普拉多ROX概念车,这款概念车致敬了曾经经..
新车 | 搭载小马智行自动驾驶方案,丰田铂智4X Robotaxi亮相进博会..
文:懂车帝原创 张晓丹[懂车帝原创 产品] 11月5日,小马智行铂智4X Robot..
丰田突然暂停日本两家工厂运营:网友:这是要搞大事?..
听说了吗?丰田大佬在日本爱知县搞了个大动作!11月7号,丰田汽车公司突..
丰田:为何能成为“开不坏”的传奇?
“丰田不开坏”,这句在汽车圈流传甚广的话,背后隐藏着丰田汽车怎样的秘..
丰田最新氢燃料电池全球首展,日韩汽车制造商主攻氢能落地|进博始发站..
界面新闻记者 | 刘嘉欣2024年11月5日至10日,第七届中国国际进口博览会在..
进口车仍在“去库存”,销量前十仅雷克萨斯和丰田正增长..
界面新闻记者丨魏勇猛中国汽车流通协会发布的9月中国进口汽车市场报告显..
在网络上似乎丰田已经破产了,现实中丰田却遥遥领先,这是为啥?..
你有没有发现,尽管网上总有声音说丰田技术落后、品牌不再风光…但当你去..
马自达抢着买,丰田车随意买,本田车最好别买?究竟是啥意思?..
在汽车的世界里,每个品牌都有自己的故事,而每款车型也承载着不同的梦想..
新车 | 纯电中型车/12月推出租赁服务 丰田bZ3福祉版2024进博会首发..
文:懂车帝原创 张晓丹[懂车帝原创 产品] 11月5日,2024中国国际进口博览..
关于作者
大男孩(普通会员)
文章
987
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40400 企业收录2981 印章生成237630 电子证书1054 电子名片60 自媒体52949

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索