你是否认为,构建一个基于自然语言处理(NLP)的 AI 应用程序(例如聊天机器人或翻译软件)需要大量的数据、计算机技术、并且会花费大量时间?但其实并非总是如此——使用 GPT-3,我们能够以最少的开发工作量构建一些基于 NLP 的惊人 AI 应用程序。
GPT-3 全称 Generative Pre-trained Transformer 3,是一种通过训练大量来自互联网的数据集得到的语言模型,由 OpenAI 公司开发。本质上它是一个巨大的神经网络,作为深度学习的一部分,它是人工智能的典型代表。
那么 GPT-3 模型为什么受到巨大关注?我们一起来看看:
GPT-3 模型包含 1750 亿个参数,而以前的版本,GPT-2 模型只有 15 亿个参数。参数是神经网络模型中的权重,该神经网络模型将输入转换为输出。GPT-3 是一个生成模型,这意味着它具有生成较长单词序列的能力,可以作为连贯输出。这种最先进的语言模型几乎可以回答所有传递给它的问题,而且更加人性化。在模型训练中使用了数十亿个单词、文本和代码段,从而使其能够在多种编程语言中进行自动编码。除了英语,它的多语言文本处理功能还可以处理其它语言。最优越的地方在于,GPT-3 模型可以执行特定任务,比如充当翻译器、聊天机器人甚至作为代码构建器,而无需任何自定义设置或任何特殊调整,它只需要经过一些训练数据的训练。在本文中,我们将向大家展示如何使用这个惊人的 API 来解决不同的基于 NLP 的 AI 用例。
获取访问权限首先,要构建本文中涵盖的用例,需要获得 GPT-3 beta API 的访问权限。可以通过以下链接申请访问:
此外,为了与 GPT-3 API 交互,我将使用“gpt3-sandbox”存储库中的脚本。使用 API 文件夹中的 gpt.py 就可以访问 GPT-3 API。
gpt3-sandbox 存储库链接:
https://github.com/shreyashankar/gpt3-sandbox
脚本链接:
https://github.com/rsharankumar/Use-Cases-using-GPT-3
聊天机器人 chatbot在下面的示例中,导入所需的软件包以及从“gpt3-sandbox”存储库中下载的脚本。我们将向模型传递三个参数:
engine:有四个选项可供选择,分别是 Davinci、ADA、Babbage、Curie。此处使用 Davinci,因为它是使用 1750 亿个参数训练的最强大引擎;temperature:其范围通常在 0-1,用于控制生成输出的随机性。值为 0 时模型具有确定性,即每次执行后的输出都是相同的;值为 1 时,生成的输出将具有较高的随机性;max_tokens:最大完成长度。在下面的脚本中,需要询问的问题被传递给变量“prompt1”,然后使用 submit_request 函数传递给模型。其结果存储在“output1”变量中,如下图:
将文本转换为公式在下面的示例中,可以基于非常少的训练即可将文本转换为公式,这一点其他预训练模型则无法实现。
如图所示,temperature 值已经增加,以使响应输出具有一定的随机性,我们还将一些预定义的示例作为训练数据集传递给模型。仅用 5 个示例,就可以训练该模型将文本转换为公式。用已知示例训练模型后,如图所示,将 “x squared plus 2 times x” 作为输入,模型成功将其转换为公式 “x^2 2x”。
翻译器(英语-法语)此外,还可以训练模型使其充当翻译器。如下所示,仅通过三个示例来训练模型,就能将英语文本翻译为法语。
附上以上用例的视频教程 https://youtu.be/g5WhlYBx-T0,其中提供了用例实现的逐步介绍。
原文链接:
除了以上 3 个案例之外,我们还在网站 GPT3 Examples 上找到了各类 GPT-3 实例应用,比如:
1、设置待办事项时,人们往往难以预估完成某任务所需的时间及其难度,Bram Adams 使用 GPT-3 的语义搜索功能确定任务难度。比如,输入“walk the dog”,GPT-3给出的任务难度为“easy”,完成时间低于 1 小时。
链接:
https://twitter.com/i/status/1319867941115092993
2、从发票中提取不同款项的信息:有人利用基于 ML 和基于规则的逻辑开发此功能,但往往耗时较长。Sahar Mor 使用 GPT3 构建类似工具,只需要将发票文件导入即可获得结果,大大缩短提取时间。
链接:
https://twitter.com/i/status/1300862719969681411
3、Tyler Lastovich 使用 GPT-3 和 Generated Photos 创建了一个可互动虚拟人的工具:在框内输入人物描述,即可生成符合描述的虚拟对象,你可以与虚拟对象互动,“他们”知道自己的名字、工作地点、自己的老板是谁等等具体信息。
链接:
https://twitter.com/i/status/1295772261975314432
4、基于一句话,将其扩展成一篇完整的邮件:Samanyou Garg 使用 GPT-3 构建了一个 Gmail 信息填充器,移动端与网页版均可使用。
链接:
https://twitter.com/i/status/1297958041262776325
5、招聘时撰写职务说明需要创意?工具 Dover 可以帮助招聘者更恰当地描述职位,以便找到合适的应聘者。
链接:
相关文章
猜你喜欢