> 自媒体 > (AI)人工智能 > GPT-4发布比上一代强在哪?幻觉和偏见显著减少
GPT-4发布比上一代强在哪?幻觉和偏见显著减少
来源:第一财经
2023-04-18 16:02:52
449
管理

在震惊科技行业的AI聊天机器人ChatGPT发布近四个月后,OpenAI公司又发布了为ChatGPT提供支持的更为强大的下一代技术版本GPT-4。

在3月14日发布的一篇博客文章中,OpenAI表示,GPT-4使用了最新的“多模式态”技术,这意味着图像和文本提示可以使它生成内容。此外,文本输入功能过一段时间将提供给ChatGPT Plus订阅者和软件开发人员。

超过90%人类考生

GPT-4根据大量在线数据进行训练,并支持微软的搜索应用Bing。“如果您在过去五周内的任何时间使用过新的Bing预览版,那么您已经体验过这个强大模型的早期版本。”微软表示。

OpenAI称,尽管在许多现实场景中它仍然“能力不及人类”,但它表现出“在各种专业和学术基准上的人类水平表现”。GPT-4还可以读取、分析或生成多达25000 个单词的文本,并以所有主要编程语言编写代码。

在谈到GPT-4比前一个版本强大在哪里时,OpenAI称,虽然这两个版本在随意的谈话中看起来很相似,但“当任务的复杂性达到足够的阈值时,差异就会出现”,GPT-4更可靠、更有创意,并且能够处理更细微的指令。

该公司表示,GPT-4响应禁止内容请求的可能性比其前一个版本低82%,并且在某些真实性测试中得分高出40%。

自去年11月推出以来,ChatGPT已经能够根据用户提示生成原创文章、故事和歌词,但它也引发了一些担忧。 最近几周,人工智能聊天机器人(包括来自微软和谷歌的工具)因情绪反应过激、犯事实错误和完全“幻觉”而受到指责。

对此,OpenAI公司CEO奥特曼在Twitter上称,GPT-4是其模型“最有能力且最符合”人类价值观和意图的模型,尽管“它仍然存在缺陷”。

“它仍然存在缺陷,仍然有限,但它有明显的改进。 “奥特曼写道,“它比以前的模型更有创意,它的幻觉明显减少,而且它的偏见也更少。”

两周前,OpenAI 宣布将向第三方企业开放其ChatGPT工具的访问权限,为聊天机器人集成到众多应用程序和服务中铺平了道路。

RBC Capital Markets分析师Rishi Jaluria表示,微软将从GPT-4的采用中受益。

本月早些时候,在2023微软Azure中国年度技术峰会上,微软首次面向企业推出了Azure Open AI云服务,借助该平台,企业用户可以发掘大规模AI与商业场景结合的潜力。

谷歌发布医学大模型2.0

科技巨头们正在ChatGPT引爆的人工智能领域展开新一轮竞争。谷歌周二宣布推出基于医学大模型Med-PaLM最新版本的AI医疗健康聊天机器人。

Med-PaLM是第一个在类似于美国医疗执照考试中分数超过60%人类考生的人工智能系统。谷歌表示,该技术的更新版Med-PaLM 2在体检的问题上达到“专家”水平,准确率超过85%,得分比之前的结果高出18%。

不过谷歌医疗研究负责人Alan Karthikesalingam表示,该公司还在根据真实医生和临床医生的反应测试Med-PaLM的答案,并对偏见和潜在的伤害进行评估。鉴于医疗信息的敏感性,还需要一段时间才能推向普通用户。

根据研究机构Omdia最新发布的一份报告,虽然ChatGPT、Stable Diffusion和其他生成式人工智能为市场带来的明显兴奋和潜在机会真实存在,但生成式人工智能并无法解决任何类型的人工智能所面临的任何市场挑战,生成式人工智能并非灵丹妙药。

“生成式人工智能不会解决人工智能面临的基本挑战,偏见、隐私、责任、一致性和可解释性。”Omdia首席分析师Mark Beccue表示,“事实上,生成式人工智能在很大程度上加剧了这些问题。例如,作为大多数生成式人工智能输出来源的大型语言模型(LLM)采用公共数据进行训练,这些公共数据可能包括有偏见的内容,这意味着输出本身可能存在偏见或不恰当。”

AI大模型开发的另一个重要的问题是高昂的成本。英伟达为AI训练提供大量的GPU,其中主要用于GPT模型训练的A100芯片每一块的价格高达1万美元。分析师和技术专家估计,训练GPT-3等大型语言模型的耗资可能超过400万美元。

为此,英伟达已经宣布了一种新的商业模式,向尚无法触及AI能力的中小企业开放云端AI能力,企业可以通过租赁云服务的方式来完成AI软件的开发工作。

英伟达创始人CEO黄仁勋预计,未来10年内,人工智能的效率将再提高100万倍,因为不仅在芯片方面,而且在软件和其他计算机部件方面的技术都会发生显著改进。

“未来会出现新的处理器、新系统、新的互联、新框架和新算法,我们会与数据科学家、AI研究人员合作开发新模型,事实上,在过去的计算机发展过程中,我们已经使大型语言模型的处理速度提高了100万倍。”黄仁勋表示。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
全开源chatGPT聊天机器人商业版源码 支持魔改 完全开放源代码..
demo软件园每日更新资源,请看到最后就能获取你想要的:1.全开源CHATGPT聊..
知道了些“了不得”的东西后,她给人转账近500万……..
“杀猪盘”可能大家都听说过但是以租房为由头的“新型杀猪盘”你了解吗?..
GPT-4被曝重大缺陷,35年前预言成真!所有LLM正确率都≈0..
编辑:Aeneas 好困【新智元导读】最近,一项研究发现,大模型身上存在一..
怎么使用ChatGPT获得更完整的答案\u0026高效对话
如何与chatGPT获得更完整的答案&高效对话?这里要提到一个词:Prompt(提..
能听懂语音的ChatGPT来了:10小时录音扔进去,想问什么问什么..
机器之心报道编辑:张倩类 ChatGPT 模型的输入框里可以粘贴语音文档了。..
美国数据仓库巨头发布开源模型 公开挑战ChatGPT
在AI大模型时代,微软不会是唯一一个占据主导的企业。更多竞争对手正在迎..
谷歌版ChatGPT支持中文了!弱智吧实测结果在此
克雷西 发自 凹非寺量子位 | 公众号 QbitAIClaude 2发布之后,Google也按..
ChatGPT大面积封号30天后,号贩灰产又在琢磨啥了?
先是马斯克挑头、千人“请命”叫停,再有意大利、加拿大等国家“封禁”、..
已证实:网友使用的国内版chatGPT 4.0了是假冒的!
在当前的科技发展中,人工智能技术已经逐渐成为了人们生活中不可或缺的一..
关于作者
泡沫人生(普通会员)
文章
562
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40369 企业收录2981 印章生成216705 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索