> 自媒体 > (AI)人工智能 > 科学家证实ChatGPT改变学术论文风格,百万篇论文词频减少10%
科学家证实ChatGPT改变学术论文风格,百万篇论文词频减少10%
来源:DeepTech深科技
2024-07-09 22:04:15
194
管理

在近期一项研究中,意大利国际高等研究院(SISSA,International School for Advanced Studies)博士生耿明萌量化了 ChatGPT 对学术论文写作的影响。

图 | 耿明萌(来源:耿明萌)

日前,相关论文以《ChatGPT 正在改变学者的写作风格吗?》(Is ChatGPT Transforming Academics’ Writing Style?)为题发在 arXiv[1]。

图 | 相关论文(来源:arXiv)

据介绍,之前大多数同类研究,往往是分析某个段落或某篇文章由 ChatGPT 生成的可能性。但是,本次成果更加关注于整体情况。

举例来说,一项成熟的运动不只需要优秀的运动员,还需要球迷、教练、投资人、裁判等。

目前,大模型的火热程度已经无需赘述,这条赛道甚至显得有些拥挤不堪。在这样的背景之下,耿明萌想做一些类似足球裁判员和数据分析师的工作。

事实上,就在一年之前他还不是 ChatGPT 的拥趸,也不打算追逐大模型的研究热潮。

2023 年夏,耿明萌把更早一篇论文的初稿提交给导师之后,导师并没有直接在原文上修改,而是给出一些简略的建议和批注,其中有不少建议针对的是写作问题。

这时,耿明萌想到使用 ChatGPT 来修改和润色论文,但是很快他就意识到 ChatGPT 的风格,比如其所使用的词语频率和人类有所不同。

于是,他想从词频角度出发,来分析 ChatGPT 对于人类论文的影响。耿明萌导师的主业是天文和统计,之前并没有自然语言处理的经验。

导师也很疑惑为何当时仍未有人使用这么简洁明了的方法来研究 ChatGPT 的影响,因此推测有可能是因为行不通所以才没有人研究,于是暂时搁置了这个想法。

事情的转机发生在 2023 年秋,当时导师频繁出差去宣传自己出版的新书,并没有时间讨论课题组的项目。

于是,耿明萌决定腾出手自己试试看。

他记得特别清楚,在万圣节假期的前一天晚上,在解决所有数据问题之后,他出去旅行了两周,回来又花费一周时间得到了初步结果。

即:学术论文中确实有一些词语的使用频率,在 ChatGPT 出现之后发生了明显变化。

为了方便起见,耿明萌选取了当时 arXiv 上最新的 100 万篇论文的摘要进行分析。之所以这样做是因为摘要虽然短小,但是比论文的其他部分更有代表性。

结果他发现:最近几年论文数量出现暴涨,比如从 2018 年到 2023 年,就有超过 100 万篇论文被提交到 arXiv 上。其中,大约有 90% 论文来自于数学、物理和计算机三个学科。

当然,初步的研究结果也很有意思:比如“significant”的词频翻了接近一番,而“is”和“are”的词频则减少了 10% 左右。

(来源:arXiv)

那么,如果使用 ChatGPT 处理一部分论文摘要,和未经 ChatGPT 处理的论文摘要混在一起,能否基于词语频率的变化,估算出经过 ChatGPT 处理的论文摘要的比重?以及应该怎样估计?再就是应该选取哪些词语?

为了回答这些问题,耿明萌提出一个含有噪声项的模型,证明在某些情况之下,词语的选取并不是越多越好。

而是应该主要考虑以下两个标准:词语频率、以及 ChatGPT 处理前后的变化率。

而且,对于不同类别和不同混合比例的摘要,选取的词语也应该有所变化。随后,通过校准和测试,上述理论分析也在模拟中得到了验证。

(来源:arXiv)

基于此,他开始根据真实的 arXiv 摘要数据,来估算 ChatGPT 的影响。

这一分析是基于:ChatGPT API 的模拟输出对于不同的 prompt,其输出的结果也不相同,因此所得出的结果是一个相对值。

如果以“Revise the following sentences”的结果作为基准,ChatGPT 修改的“比例”大约在 35% 左右。

如果科研人员在使用 ChatGPT 时都能使用更精准的 prompt,那么 ChatGPT 对于论文摘要的贡献就完全有可能超过 100%。

不过,耿明萌更愿意用“影响”而非用“比例”来看待本次结果。

不同的 prompt 会产生不同的输出,因而同样的使用比例也会产生不同的估计结果。考虑到实际的使用场景,一些人很有可能在使用 ChatGPT 之后刻意抹去了一些痕迹。

亦有论文作者的写作风格的确受到了 ChatGPT 的影响,但最后并没有使用 ChatGPT 润色论文摘要。同时,其它大模型可能会有相似、但不相同的词频。

(来源:arXiv)

总的来说,耿明萌依然认为,使用 ChatGPT 或其它工具,来润色论文和翻译论文本身并没有错,但要知道修改前后语义上的差别。

对于母语非英语的研究人员来说,这些新工具的合理使用确实也能促进公平,但直接利用这些工具生成论文段落是不可取的。

而研究 ChatGPT 对于论文风格的影响,则能助力科研人员更好地使用类似工具。

参考资料:

1.https://arxiv.org/pdf/2404.08627

运营/排版:何晨龙

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
直男宝典和女生聊天的正确方式
有些男同胞们因为性格比较内向,说话比较直白;遇上喜欢的只能心里想想,..
超市老板娘出轨小鲜肉,两人聊天记录被曝光,内容既露骨又搞笑..
出轨,一直以来都是备受关注的话题。因为一旦涉及到出轨,就意味着夫妻双..
ChatGPT新手必看教程01-软件推荐
ChatGPT火爆半年多了,如今热度依旧不减。很多小伙伴都想尝试,但是不知..
讯飞星火V3.0升级发布:多领域超越GPT-4 ,ChatGPT羡慕不来..
10月24日,第六届世界声博会暨2023全球1024开发者节开幕,产业领袖、专家..
主播“秀才”账号被封,“中老年顶流”塌房了,曾被举报欺诈51万..
9月2日,拥有“中年妇女收割机”美誉的和一千多万粉丝主播“秀才”账号被..
GPT-4插件与联网功能开放测试,我们实测之后发现这东西有点蠢..
两种功能都开放了的账号很幸运,知危编辑部隔壁的差评编辑部的 Plus 账号..
苹果禁用ChatGPT,为防机密泄露!大模型版Siri即将升级推出..
明敏 杨净 发自 凹非寺量子位 | 公众号 QbitAI前脚ChatGPT刚刚上线iOS嗨..
警惕新型“订单式”骗局!已有人上当,聊天记录曝光..
“老板,我校急需要一大批XXX”如果你是商户老板突然接到这样的大额订单..
超越 GPT-3,DeepMind 推出新宠 Gato,却被质疑「换汤不换药」..
受大规模语言建模的启发,Deepmind应用类似的方法构建了一个单一的「通才..
关于作者
婆罗花开(普通会员)
文章
561
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40348 企业收录2981 印章生成209232 电子证书890 电子名片56 自媒体30864

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索