担心GPT-3被喂假消息？谷歌新研究，将知识图谱转“人话”来训练-脚本导航

> 自媒体 > （AI）人工智能 > 担心GPT-3被喂假消息？谷歌新研究，将知识图谱转“人话”来训练

担心GPT-3被喂假消息？谷歌新研究，将知识图谱转“人话”来训练

来源：量子位

2023-05-04 22:06:38

637

管理

萧箫发自凹非寺量子位报道 | 公众号 QbitAI

还在担心大语言模型“啥都吃”，结果被用假信息训练了？

放在以前，这确实是训练NLP模型时值得担心的一个难题。

现在，谷歌从根本上解决了这个问题。

他们做了个名为TEKGEN的AI模型，直接将知识图谱用“人话”再描述一遍，生成语料库，再喂给NLP模型训练。

这是因为，知识图谱的信息来源往往准确靠谱，而且还会经过人工筛选、审核，质量有保障。

目前，这项研究已经被NAACL 2021接收。

整体来看，用TEKGEN生成语句的流程是这样的：

生成后的语句，就能用来放心地训练大语言模型了。

这份生成的语料库，由4500万个三元组生成，组合起来的句子有1600万句。

当然，这里面也用LAMA（LAnguage Model Analysis） probe，来对用这个语料库训练的模型进行了评估。

在Google-RE和TREx两个数据集上，经过预训练的模型，在各项任务上均取得了非常好的效果。

说不定，将来真能让AI去试试高考语文的“图文转换”题：

论文一作小姐姐Oshin Agarwal，是宾夕法尼亚大学的计算机系在读博士生，研究方向是自然语言处理中的信息抽取。

这篇论文，是她在谷歌实习期间完成的。

来自谷歌的Heming Ge、Siamak Shakeri和Rami Al-Rfou也参与了这项工作。

目前，作者们已经将这个用知识图谱生成的语料库放了出来。

想要训练NLP模型的小伙伴，可以用起来了~

论文地址：https://arxiv.org/abs/2010.12688

用知识图谱生成的语料库：https://github.com/google-research-datasets/KELM-corpus

参考链接：https://ai.googleblog.com/2021/05/kelm-integrating-knowledge-graphs-with.html

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

OpenAI的GPT-3能做什么？一位艺术家进行了实验

2023-05-04 22:07

低代码迎来重大突破！微软启用超级模型GPT-3，路人秒变程序员

2023-05-04 22:05

相关文章

主打年轻和性价比东风风行中大纯电轿车星海S7上市11.98万起..

9月26日，东风风行旗下中大型轿车星海S7上市，新车共推3个不同配置版本，..

君威2024款：174马力+9AT，7.1秒破百，运动轿车还是家用买菜车？..

选车就像找对象，总想找到各方面都匹配的那一位。10万左右的预算，想买一..

哪款“7”字辈SUV更值得期待？智界R7/阿维塔07/极氪7X三车对比..

内饰采用环抱式座舱布局，配备悬浮式中控屏和35.4英寸4K远端屏，两侧还可..

新车 | 或途胜L平台打造/三排布局/混动系统，现代全新SUV消息曝光..

文：懂车帝原创史景旭[懂车帝原创产品] 日前，我们从海外媒体获悉，现..

10.99万能买中型SUV，12.99万就有插混版，全新瑞虎8PLUS上市..

今年1-8月份，奇瑞汽车交出了1508259辆，同比增长41.9%的成绩，能够在今..

新车 | 5座电动SUV/约人民币8.5万元起售，名爵WINDSOR EV正式发布..

文：懂车帝原创高帅鹏[懂车帝原创产品] 近日，名爵WINDSOR EV实车在海..

大众用心打造的一款SUV，ID.与众深度体验

ID.与众，这是大众在中国市场超用心，2年磨一剑打造的首款紧凑型SUV。2、..

等等这7款重磅新车吧！比亚迪发力高端车，奇瑞布局增程6座SUV..

市场上越来越多新车试图挑战热销榜车型的地位，咱们来看看，今年剩下的几..

智驾标杆SUV，极越01对比智界R7，哪款更具性价比？

提起高阶智驾，我想国内有两家企业很具代表性，其一是华为ADS高阶智能驾..

关于作者

阳光下的微笑..(普通会员)

文章

951

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

02

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

03

DeepSeek 究竟是个啥？一文带你看明白

1个月前

04

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

2023/07/18

05

上海女家长陪睡校长，不雅聊天记录曝光！真是三观尽毁

2023/06/19

标签云

成员 网址收录40400 企业收录2981 印章生成237624 电子证书1052 电子名片60 自媒体52521

@2022 All Rights Reserved

浙ICP备19035174号-7

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索