编者按:2022年11月美国人工智能研究实验室OpenAI发布chatGPT大型语言模型(Large Language Models,LLMs)引发了全球社会各界的关注,尤其是2023年3月14日发布的GPT-4的回答准确性不仅大幅提高,还具备更高水平的识图能力,且能够生成歌词、创意文本,实现风格变化。此外,GPT-4的文字输入限制也提升至2.5万字,且对于英语以外的语种支持更加优化。
近期,随着各类大型语言模型(LLMs)的公布更是引发了关于人工智能(Artificial Intelligence,AI)、生成式人工智能(AIGC)和通用人工智能(AGI)对未来人类生活影响的激烈讨论和研究热情。本文由Shahab Saquib Sohail, Faiza Farhat, Yassine Himeur等人通过Scopus数据库搜索109篇ChatGPT相关文章,包含了53个国家、349位作者关于ChatGPT讨论所形成的文献综述,可以代表当前国际社会对ChatGPT最新和最全面的研究成果。小编通过编译将原文标题《解码ChatGPT:现有研究、当前挑战和未来可能方向的分类》的主要内容进行翻译和编辑,以飨读者。希望本文有助于中国人工智能相关领域的创业者、研究者和爱好者正确理解、辨析和认知ChatGPT等大型语言模型(LLMs),进而为生成式人工智能(AIGC)和通用人工智能(AGI)的研究指明方向。
解码ChatGPT:
现有研究、当前挑战和未来可能方向的分类
Decoding ChatGPT: A taxonomy of existing research, current challenges, and possible future directions
近年来,自然语言处理(NLP)和人工智能(AI)技术取得了重大进展,开发了能够生成类人文本的复杂语言模型。在这些模式中,生成预训练模型(GPT)因其生成连贯和上下文相关响应的能力而获得了极大的关注和认可。GPT模型已成功应用于各种NLP任务,包括语言翻译、文本摘要和问答(Guo et al.,2023)。GPT模型的一个突出变体是聊天生成预训练模型(ChatGPT),这是一种专门设计用于与用户进行对话交互的聊天机器人(AI,2023;Sohail等人,2023)。ChatGPT利用GPT的功能提供交互式和动态响应,模仿类似人类的对话。这项创新技术开辟了新的可能性。
7.3
多式联运设计
与ChatGPT的多模式集成将实现更自然、更人性化的直观、引人入胜和有效的沟通。它需要创建能够处理和组合各种数据的机器学习模型和算法,包括文本、音频和图像。可以将这些不同的模式结合起来,以各种方式创造更具吸引力的有效的用户体验。
7.3.1 基于图像的设计
使用图像作为交流的主要工具是基于图像的设计的重点。为了传达某种信息或想法,这可能涉及使用图像、插图和其他视觉组件。视觉识别、图像字幕和基于图像的搜索可以与ChatGPT集成,使其成为多模式人工智能。图像识别和基于图像的搜索是功能强大的工具,在不同领域都有大量应用。例如,学生可以利用这些技术来定位和分析相关图像,用于学术研究目的。
7.3.2 基于音频的设计
可以与ChatGPT结合的音频功能的几个例子是语音识别、音频字幕和基于内容的音频检索。通过处理听觉输入并将其翻译成软件或其他设备可能使用的文本,语音识别技术使ChatGPT能够理解和识别口语。
7.3.3 基于视频的设计
集成基于视频的设计技术,如视频内容分析、视频字幕和视频索引,是开发多模式人工智能系统的关键方面。通过结合视频内容分析,多模式ChatGPT可以分析和处理视频片段,检测对象,并跟踪视频中的运动。视频字幕可以添加到ChatGPT中,在对话过程中提供隐藏字幕或字幕,使视频内容更容易访问。此外,视频索引允许用户使用关键字或时间戳搜索视频中的特定内容,从而更容易快速查找相关信息。
7.3.4 人机交互设计
创建多模式人工智能的下一步将是结合人机交互的特征,包括面部表情、触觉。
7.4
可信度
当今最紧迫的需求之一是开发值得信赖的人工智能。为了实现这一点,ChatGPT的未来迭代可以包含保证公正和公平答案的功能。随着人工智能伦理和公平变得越来越重要,可以考虑三个关键类别:计算技术、伦理考虑和社会考虑。深度学习、机器学习和人工神经网络等升级的技术发展应该集成到计算方法中,以提高人工智能的性能。然而,还必须考虑伦理因素,包括数据伦理,以确保人工智能系统培训的数据收集、存储和使用是以道德和负责任的方式进行的,同时防止未经授权的访问或滥用。为了防止基于宗教、种族或性别等特征对个人或群体的歧视,机器学习的公平性也必须是优先事项。
7.4.1 公平
在人工智能系统的创建和应用过程中,应纳入人工智能的公平性,以避免偏见和歧视。它需要确保人工智能系统平等地处理每个人,没有歧视,不会加剧现有的偏见和不平等。这需要全面考虑用于训练人工智能模型的数据,以及人工智能系统中使用的算法和决策程序。作为一种AI语言模型,ChatGPT可以通过考虑和解决其训练数据、决策过程和输出中的偏见来努力实现公平。解决训练数据中的偏见的一种方法是确保用于训练模型的数据是多样的,并能代表人群。这可以通过使用各种来源和包括代表性不足群体的数据来实现(Hassani和Silva,2023)。培训数据也应仔细策划和过滤,以消除任何有偏见或有问题的数据。
7.4.2 透明度
人工智能系统的决策过程和基本数据对用户透明和可用的程度被称为人工智能的透明度。因为透明的人工智能系统更容易理解和分析,它们鼓励信任,使系统更有可能做出道德和法律选择。为了确保ChatGPT使用的透明度,必须清楚该模型的局限性及其功能。此外,重要的是要对用于训练模型的数据源和任何潜在的偏差保持透明。
7.4.3 可解释性
可解释的人工智能可以为其选择和决策提供全面的解释。因此,人类可以理解和验证系统的决策过程,这对于建立人工智能系统的信心至关重要。增加可解释性的一种方法是使用固有的可解释性模型,如决策树或线性回归模型。这些模型更容易理解,因为它们明确地显示了每个特征对模型输出的贡献。
另一种方法是计算并呈现模型输入的特征重要性分数。这允许用户查看哪些因素该模型正在使用进行预测。
7.4.4 以人为本的设计
它指的是创建符合人类价值观、需求和偏好的人工智能系统的过程。这需要考虑人工智能系统的伦理和社会影响,并在设计时强调透明度、公平性和问责制。以人为中心的设计原则通常应用于研发过程中,例如进行用户研究以了解使用语言模型的人的需求和行为,测试不同的设计原型,以及根据用户反馈迭代设计。
八、结论
在这篇综述文章中,我们通过全面回顾关于ChatGPT的100多篇Scopus索引出版物,展示了未来GPT语言模型在各个领域的巨大潜力。尽管有其潜力,但早期的ChatGPT研究仍然面临一些局限性。我们确定了一些可能需要解决的问题,这些问题被归类为内在的和以使用为中心的问题。此外,我们还讨论了伦理问题。最后,为克服这些挑战并提高ChatGPT的效率,我们发现了一些潜在的未来发展方向。
【作者简介】
汪 政
中国政法大学法学院博士生
浙江泰杭律师事务所主任
浙江合众法律科技智能研究院院长
相关文章
猜你喜欢