> 自媒体 > (AI)人工智能 > 站上大模型制高点:给不输GPT-4的文心大模型4.0,来了一场技术揭秘
站上大模型制高点:给不输GPT-4的文心大模型4.0,来了一场技术揭秘
来源:机器之心Pro
2023-10-30 10:44:10
262
管理

机器之心报道

作者:泽南

我们即将进入一个 AI 原生的时代,一个人机交互的新时代。

「这是迄今为止最强的文心大模型。它实现了基础模型的全面升级,在理解、生成、逻辑和记忆四大能力上都比文心一言线上版本有了明显提升,综合水平与 GPT-4 相比毫不逊色,」百度创始人、董事长兼 CEO 李彦宏说道。

衡量 AI 智能程度的另一个指标在于长期记忆能力,如果大模型生成的内容前后逻辑不一致,那就不存在可用性了。在现场,李彦宏让文心一言生成一部武侠小说的大纲,再在其中细化情节,加入几个人物,改变冲突的戏剧要素…… 问题来了,经历了多轮对话,它还记得自己最开始给女主角设定的特殊能力吗?

完全没有问题。

面向全社会开放才一个多月,文心大模型的综合水平看来又有了大幅进化,不过在主题演讲上的那些毕竟是「命题作文」,真正用起来会不会是一回事呢?

其实想要用上并不难:昨天大会的一开场,百度就宣布文心大模型 4.0 开启邀请测试,现场观众都有了测试权限,在网站和 APP 上都可以体验。我们则是提前获得了评测资格,尝试了一下新版本。

文心大模型 4.0 正面对比 GPT-4

在文心一言的网站上,现在已经出现了文心大模型 4.0 的标签,表面看起来和 3.5 版没有太大区别:

GPT-4 则是调用 CapCut(字节的剪映)插件生成视频内容。需要注意的是,它提示要想生成视频,就必须要与你进行多轮对话,逐步确定好视频脚本(英文的)、屏幕比例等等:

看起来,文心大模型 4.0 可以在保持原始知识的情况下,与人在不断对话的过程中生成、提炼出你想要的内容。

还有一些我们经常会用得到的功能。在 ChatGPT 出现后,越来越多的人开始尝试使用大模型帮忙来润色论文,据说 AI 写论文看起来很有功底,一般人还真比不上。我们用一段著名的发言试一下:

相比之下,GPT-4 给出了似乎是基于大模型幻觉的回答。

如果多点一步选择使用 Bing 联网版的 GPT-4 则可以得到正确回复,不过再次出现了语言问题,偶尔会获得全英文的回答。

看起来,文心大模型 4.0 在四大核心能力上的提升的确明显,和 GPT-4 比毫不逊色的说法也并不是夸张,特别是在中文领域里,水平是经得起考验的。

核心技术揭秘

能做得到业内领先,百度实现了哪些技术进步?在昨天会上,百度 CTO 王海峰解读了文心大模型 4.0 的关键技术和最新进展。

具体来说,百度:

在万卡算力上基于飞桨平台,通过集群基础设施和调度系统、飞桨框架的软硬协同优化,支持了大模型的稳定高效训练。通过建设多维数据体系,形成了从数据挖掘、分析、合成、标注到评估闭环,充分提高数据的利用效率,大幅提升模型效果。基于有监督精调、偏好学习、强化学习等技术进行多阶段对齐,保证了模型能够更好地与人类的判断和选择对齐。利用可再生训练技术通过增量式的参数调优,有效节省了训练资源和时间,加快了模型迭代速度。

基于这一系列的提升,自三月以来文心大模型的训练效率已累计提升 3.6 倍;训练稳定性方面,周均的训练有效率已超过 98%。

另外在更高层面上还有一些改进。

文心大模型 4.0 实现了输入和输出两阶段的知识点增强,一方面对用户输入的问题进行理解,拆解出所需的知识点,然后在搜索引擎、知识图谱、数据库中查找准确知识,再把这些知识组装进 Prompt 送入大模型,提升了准确率和效率。另一方面又对大模型的输出进行「反思」,从生成结果中拆解出知识点,再用搜索引擎、知识图谱、数据库,以及大模型本身进行确认,对有差错的内容进行修正。

百度搜索是大模型落地的第一步,「新搜索」是全新的 AI 互动式搜索,它实现了三大重要提升:极致满足、推荐激发、多轮交互。当你在搜索框里输入问题,它不再是单纯的输出链接,而是生成完整的答案,并附带易于理解的图表。

大模型加持的生产力工具也在变得更聪明,分析师现在可以通过大模型工具可以把十几天才能完成的任务缩短到几分钟来完成,参与在线会议的人可以从冗长的对话内容里快速总结出重要信息,出差时 AI 也会自动帮你安排行程:

在我们每天都会用的百度地图上,最新上线的 V19 版本基于文心大模型进行了重构,其中的「AI 向导」具备多轮自然语言交互能力,用说话的方式就能唤醒菜单里被折叠的上千种能力,也可以理解人们不是具体地点的需求,并找到最优解,当好一个向导。

如果把眼光放远到更多行业,百度正在大力推动数字技术与实体经济的深度融合,其大模型技术已应用在制造、能源、电力、化工、交通等实体产业中。在千帆大模型平台上,现在已有超过 1.7 万企业开发了产业模型和解决方案,覆盖了各行业的近 500 个场景。

最近一段时间,AI 领域技术的军备竞赛让我们对技术突破越来越熟视无睹。有时候甚至会忘记距离 ChatGPT 正式发布,现在才过去十个多月的时间。在这段时间里,通用的生成式 AI 已经从遥不可及的愿景,变成了人人在玩的聊天机器人,又蜕变成为了众多行业效率提升的基础。

而在未来,不论时间的长短,AI 原生的智能化注定要改变所有人的生活和工作方式。

可喜的是,在这个过程中,国内公司已经拿到了入场门票。

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
关于作者
烽火(普通会员)
文章
350
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40329 企业收录2981 印章生成186403 电子证书794 电子名片49 自媒体20815

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索