近几年,大语言模型的发展十分迅速。尤其是2022年 11 月底ChatGPT的发布,更是引爆AI领域发展,使人们觉得通用人工智能(AGI)成为可能,引起了社会各界的广泛关注。
在使用ChatGPT时,人们通过提示词(prompt)与大语言模型进行交互。对于不同的提示词,ChatGPT给出的答案截然不同。如何设计提示词使模型产生符合人们需要的答案成为一项富有挑战的工作。于是各种Prompting技术应运而生。
根据专业文献的定义,Prompting技术是一种在使用大语言模型(LLM)时,通过提供特定的提示、指令或上下文信息(统称为Prompt),来引导模型生成特定类型、格式或内容的文本的人机交互技术。在Prompting模式下,模型的输入会包含一个明确的提示,该提示用于指导模型生成与提示相关的文本。这种提示可以是一个完整的句子或问题,也可以是一个关键词或短语。通过在训练数据中使用提示来指导模型的学习,可以提高模型在特定主题、风格或格式上的生成能力。
一、一些常见的Prompting技术范式1、样例式Prompting(Example-based Prompting):
内涵:通过提供示例文本来引导模型生成类似的文本。特点:基于已有的样例文本进行生成,模型可以学习样例的风格、语气和结构。用途:生成与示例文本相似的文本,如生成类似风格的新闻报道、评论或产品描述。例子:提供一段积极评价的餐厅评论作为Prompt,要求模型生成另一家餐厅的积极评价。2、指令式Prompting(Instruction-based Prompting):
内涵:通过明确的指令或命令告诉模型生成特定类型的文本。特点:提供明确的指令,使模型按照特定要求进行生成。用途:执行特定任务,生成符合指定要求的文本,如写作业、生成代码或撰写商业报告。例子:要求模型写一篇关于环保的文章,包括原因、影响和解决方案。3、填空式Prompting(Cloze-style Prompting):
内涵:在Prompt中留下空白或缺失的部分,要求模型填写相应的内容。特点:通过填写空白,模型可以补全句子或提供缺失的信息。用途:测试模型对特定问题或知识的理解和补全,如填写缺失的单词、词组或句子。例子:给定一段对话的一句话作为Prompt,留下一个空白,要求模型填写空白以继续对话。4、对话式Prompting(Conversation-based Prompting):
内涵:模拟对话形式,引导模型生成与对话相关的回答。特点:基于对话上下文,模型可以生成连贯的对话回应。用途:生成与特定对话场景或多轮问答相关的文本,如智能助手的对话回答、聊天机器人等。例子:提供一个用户问题的上下文作为Prompt,要求模型生成合理的回答。5、主题式Prompting(Topic-based Prompting):
内涵:通过设定特定的主题或领域,引导模型生成与该主题相关的文本。特点:限定生成文本的主题范围,使模型专注于特定领域的文本生成。用途:生成特定领域的文章、报道、评论或指南等。例子:要求模型写一篇关于人工智能在教育领域的应用的文章,包括案例、挑战和前景。6、递进式Prompting(Progressive Prompting):
内涵:逐步增加问题或信息,引导模型生成连续的文本。特点:通过逐步引导模型思考和生成,产生连贯的文本。用途:逐步构建故事情节、展开论证或解答复杂问题。例子:提供一个初始问题作为Prompt,然后逐步引导模型回答相关的后续问题,形成完整的故事。7、条件式Prompting(Condition-based Prompting):
内涵:通过设定特定的条件或约束,引导模型生成符合条件的文本。特点:约束模型生成文本的属性,如长度、格式、情绪等。用途:生成符合特定条件的文本,如限定长度、特定格式的文档或情感表达等。例子:要求模型生成一段长度为50个词的描述,包含指定的关键词和特定的表达方式。8、思维链Prompting(Thought-chain Prompting):
内涵:通过逐步引导模型的思考过程,产生连贯和有逻辑性的文本。特点:基于思维的链条,通过将前一步的输出作为当前步的输入,逐步扩展和推进生成过程。用途:有助于模型在生成过程中进行迭代和逻辑推理,从而产生更加准确和丰富的答案。举例:提供一个初始观点或问题,然后逐步引导模型发展和扩展相关的思路和解答。这些Prompting技术可以根据具体应用的需求进行选择和组合。通过合理应用Prompting技术,可以提高语言模型的生成效果,使其更加符合预期和用户需求。
二、一些高阶Prompting技术范式1、图像Prompting(Image Prompting):
内涵:通过提供图像作为Prompt来引导模型生成与图像相关的文本。特点:将图像信息与语言模型结合,生成与图像内容相关的文本。用途:生成图像描述、图像故事、图像标注等与图像相关的文本。例子:给定一张猫的图片作为Prompt,要求模型生成一段关于猫的描述或故事。2、视频Prompting(Video Prompting):
内涵:通过提供视频作为Prompt来引导模型生成与视频内容相关的文本。特点:结合视频内容与语言生成,生成与视频场景、情节相关的文本。用途:生成视频描述、视频脚本、视频评论等与视频相关的文本。例子:给定一个短视频片段作为Prompt,要求模型生成一段关于视频内容的描述或评论。3、音频Prompting(Audio Prompting):
内涵:通过提供音频作为Prompt来引导模型生成与音频内容相关的文本。特点:结合音频信息与语言生成,生成与音频内容、情感、节奏相关的文本。用途:生成音频描述、音频脚本、音频评论等与音频相关的文本。例子:给定一段音乐作为Prompt,要求模型生成一段关于音乐风格、情感或评论的文本。4、多模态Prompting(Multimodal Prompting):
内涵:通过结合多种媒体形式(如图像、视频、音频)作为Prompt来引导模型生成多模态的文本输出。特点:同时考虑多种媒体信息,生成与多模态内容相关的文本。用途:生成多模态描述、多模态脚本、多模态评论等与多媒体内容相关的文本。例子:给定一张图像和一段音频作为Prompt,要求模型生成一段描述图像和音频相关联的文本。5、情景Prompting(Scenario Prompting):
内涵:通过设定特定情景或场景,引导模型生成与情景相关的文本。特点:模拟特定的情境,使模型生成与情景一致的文本。用途:生成情景描述、情景对话、情景剧本等与特定情景相关的文本。例子:设定一个旅行场景,要求模型生成一段关于旅行经历的描述或对话。这些高级Prompting技术将不同的媒体形式或情景引入到语言模型中,进一步拓展了生成文本的可能性。它们在生成与多媒体内容相关的文本或模拟特定情景的文本方面具有独特的应用价值。
相关文章
猜你喜欢