美国人工智能公司OpenAI推出的聊天机器人ChatGPT“火”出了科技圈,也惊动了学术圈。当传统学问进入数字时代,以ChatGPT为代表的人工智能会改变人文学科的未来吗?
澎湃新闻(www.thepaper.cn)邀请来自哈佛大学、北京大学、南京大学、上海交通大学以及德国柏林马克斯·普朗克科学史研究所的五位学者,共同讨论ChatGPT及人工智能技术如何参与人文学科的研究与教学。这五位学者均为当下数字人文领域的中坚力量,他们曾接受历史学、哲学或计算机科学的博士训练,又在数字人文这一跨学科的领域中,将计算机工具与方法引入人文学科,也使科技工作者逐渐理解人文学科的学术语境。
圆桌嘉宾:
王宏甦,哈佛大学计量社会科学研究所研究员、“中国历代人物传记数据库”(CBDB)资深项目经理
王涛,南京大学历史系教授
陈诗沛,德国柏林马克斯·普朗克科学史研究所研究员
杨浩,北京大学人工智能研究院副研究员
赵思渊,上海交通大学历史系教授
“吾与点”古籍智能处理系统的自动分词功能
ChatGPT回答“鸦片战争爆发的原因”,受访者供图
从教学的方面看,让ChatGPT独立完成一篇具有原创性结论的历史学专业论文,目前看还不可能。因为,ChatGPT本质上是一个语言模型,它所有知识来源都是基于已有和已知的信息。只是基于强大的算力,让ChatGPT能够快速定位,再加上算法,把知识关联起来,并能使用逻辑通顺的自然语言导出结果,才让ChatGPT看起来很智能。
ChatGPT擅长的其实是对知识的整合,在文字处理上,让它完成公务文章或者应用文,是信手拈来的事情,因为这种类型的文章具有极强的范式。让ChatGPT去完成一篇历史作业,对知识进行梳理和总结,对它而言也是正中下怀。对ChatGPT稍加调教,投喂足够多的八股文数据,它在竞争激烈的科举考试中拔得头筹,应该也是毫无压力。
我看到《连线》网站上发布的一个新闻,一名英语老师对ChatGPT布置了不同类型的写作任务,从打油诗、剧本到十四行诗,ChatGPT都能应对自如,并以极高的效率完成,多项作业取得了不俗的成绩。
但是,老师不应该过分担心ChatGPT对教学的冲击。老师们能够调教出像ChatGPT这样的孩子,在业务考试中取得优异成绩的学生固然值得庆幸,但是如果所有的学生都像ChatGPT那样,只会掉书袋,也是一种悲哀。
老师们的担忧可能是,学生们有了类似ChatGPT这样人工智能的协助,考试作弊,不认真学习,会破坏教学秩序。这个问题,需要从老师如何教,以及学生如何学两个方面解决。
在人工智能技术日趋完善的将来,老师的教学不能仅仅追求知识的灌输,而是要教会学生自我成长的方法。在ChatGPT可以在掌握知识的准确度上碾压人类的背景下,“授之以鱼不如授之以渔”显得更加重要了。
对学生而言,死记硬背的方式学习知识,显然已经不能满足未来社会的需求了。在记忆这个技能上,没有人能够比得过ChatGPT。学生们需要掌握的技能是要善于提出问题,并且能够使用包括ChatGPT在内的工具找出解决方案。
澎湃新闻:以一个历史学者的眼光,您认为人工智能会给史学这门古老的学问带来怎样的影响?
王涛:ChatGPT的历史知识是有来源的,它之所以显得智能,就在于它能够在数据库中定位到相关的历史结论。而这些知识体系,是由一代一代人类历史学者通过脑力研究得出的成果。
所以,从比较和谐的角度来说,以ChatGPT为代表的人工智能技术对历史学科的发展有积极推动作用,关键在于专业的历史学家是否能够用好这个助理。
历史学家的长处,从来不是过目不忘,而是善于在不同史料中穿行,找出符合历史语境的解释与判断。而历史学家不擅长的地方,正是对ChatGPT等人工智能工具而言最普通的技能,所以两者的合作对双方都是扬长避短,有机会达到双赢的局面。
在前数字化时代,历史学者非常重视阅读笔记的作用,因为即便有博闻强识的大学问家,大多数人的情况是好记性不如烂笔头。学者们需要通过笔记对史料进行体系化构建,从而给研究提供思路和线索,特别是在书写研究论文的时候,根据学术规范的要求对史料来源进行注释才能够从容不迫。
我在ChatGPT上做过实验,丢给ChatGPT一个问题,用符合美国现代语言协会制定的论文格式(MLA),规范地引用“知识就是力量”这句话。ChatGPT精准地给出了作者、书名、出版年份等信息,独缺页码信息。我追问了一下,为什么没有页码,ChatGPT回答,在培根生活的16世纪,出版的图书还没有出现规范的页码格式。ChatGPT还特别贴心地提醒我,培根的作品被很多文集再版了,那里可以找到页码信息。
澎湃新闻:杨浩老师是北大哲学系的博士,跨界到技术领域从事数字人文的工作。您怎么看技术给人文学科带来的改变?要跨越不同学科间的壁垒,关键在哪里?
杨浩:带来的改变我认为大致有三个方面。第一在方法上,数字人文是量化的方法,对传统的质性研究是很重要的补充。第二是在视角上,逆转了传统人文学科研究那种越来越细分、越来越专门的趋势,整合碎片化的知识生产,带来大尺度、大跨度的视角。第三在文献上,可以提供全量文献基础上的研究与分析。真正的大数据含义,是趋向于无穷大的数据;全部中文古籍总量也就300亿字,永远不再增长,其实是“小数据”,是有极限的。数字人文的方法在理论上可以实现全量文献基础上的研究,这是过去不可能做到的。
打破不同学科之间的学术壁垒需要一些顶层设计,在教育的层面鼓励交叉学科的实践、跨学科人才的培养。作为个体,无论是文是理,有这样一些内容是需要主动学习的:通识教育、经典教育、对技术的掌握和自学的能力。通识的重要性毋庸多言,通用人工智能之所以惊人,也正是因为“通”。而掌握传统人文知识,最好的途径就是经典教育,未来的人工智能如果要理解人,也要学习经典。现在这个时代,无论文理都需要掌握技术,技术就是一门语言,一种生存技能。最后,我个人最大的体会还是自学能力,善于自学才能突破边界。技术日新月异,各种新思想也不断涌现,没有主动学习的能力,肯定不行。
人工智能让我们反思人的本质,“人是什么”。人类做机械的、重复的工作的能力,并不比机器弱。所以人工智能会淘汰平庸的抄袭者,完全没有创造力的工作一定会被人工智能取代。
澎湃新闻:陈诗沛老师所在的德国柏林马克斯·普朗克科学史研究所是一个很有代表性的跨学科研究机构,科学史本身有学科交叉的性质,马普所又倡导“历史学家和计算机科学家同桌思考”。陈老师是计算机系的博士,您是怎么与历史结缘的?以您的个人经验而言,如何使两个来自不同领域的人沟通得更顺畅?
陈诗沛:我在台湾大学计算机工程系的导师是项洁老师,他是数字人文最早的倡导者和实践者之一。当时他被任命为台大图书馆馆长,正在做历史古籍的数字化项目,我和系里的很多硕士生、博士生一样,参与了这些项目。
我的确觉得计算机和历史学这两个领域之间的壁垒很高,难以跨越。这也解释了为什么很少计算机科学家投入数字人文。我当初并不是一个好的计算机科学家,因为我喜欢跟人讲话,不喜欢跟机器讲话。但由于我了解一些计算机的基础概念,我就试着把它们解释给历史学家、人文学家。在这两个领域里,大家使用的语言和思考方式不同。一个计算机科学家可能不理解一个历史学家提出的问题有什么意思,做出来的东西不见得符合历史学的需求。
我觉得我花了很长时间才真正进入人文学科,直到最近几年才觉得自己被历史学家们接纳,他们开始认可我提出的问题是人文学者的问题。而我真正理解他们在做的事情,是通过阅读历史学、科学史方面的论文,以及参与他们的讨论。我所接触的历史学者们,主要的学术活动是报告论文,他们会把论文初稿拿出来和大家切磋讨论,得到反馈后再修改、发表。我参与这样的报告和讨论三四年以后,才逐渐感觉能够理解他们在意的问题、他们的需求、他们做研究的本质,以及他们所追求的到底是什么。
身在数字人文这个领域,我的确有一个信念,就是这些数字工具可以为历史研究提供很好的服务,做出以往不容易做到的事情。但我们需要保持警醒,数据本身是不客观的,尤其是历史上的数据,因为有太多信息已经遗失。所以我们不会完全相信它。我们解释这些数据背后代表什么意思,保持对历史文档本身的怀疑,保持对历史的怀疑。因为每一个文档都不是客观的。
回到你前面的问题,历史学的训练到底是什么?我经过和许多历史学家的合作,深深体会到的就是,历史文档不是客观的,每个文档产生的背景都不一样,很多东西没有被写下来,只有去重构文档生成的过程,才能做出相对客观的判断。
相关文章
猜你喜欢