机器之心报道
编辑:张倩、袁铭怿
Dramatron似乎在一定程度上克服了AI大模型写长剧本前后不连贯的问题。
你是否有过这种体验:某一天逛街的时候,脑子里突然冒出来一个好玩的故事,但你一时想不到更多的细节,也没有一块完整的时间去把它写出来?
DeepMind 新出的一款剧本写作 AI——Dramatron 或许可以帮到你。
据报道,剧作家们表示,他们不会使用这个工具来创作一部完整的戏剧,并发现人工智能的输出可能是公式化的。然而,他们认为 Dramatron 将有助于世界的构建,或者帮助他们探索改变情节元素或角色的其他方法。同时,人工智能也有助于他们「产生更具创意的想法」。
和很多生成式 AI 工具一样,Dramatron 的背后也有一个大型语言模型作为支撑。这个模型名为 Chinchilla,参数量为 70B,在 1.4T token 的 MassiveText 数据集上进行训练。不过,DeepMind 在论文中表示,OpenAI 的 GPT-3 等大模型也可以用来部署 Dramatron。
有趣的是,在 Dramatron 昙花一现的试用页面上,DeepMind 明确表示,要使用 Dramatron,你需要一个 OpenAI API key。
下图 2 展示了 Dramatron 在研究中用到的两种叙事结构:
左图是德国小说家、剧作家古斯塔夫 · 弗赖塔格(Gustav Freytag)的金字塔结构。他认为典型剧情由上升 (rising action)、高潮 (climax) 和回落 (falling action) 组成。右图是叙事学和比较神话学中的一种公式——英雄旅程(Hero's journey),又称为单一神话(monomyth),主轴围绕在一个踏上冒险旅程的英雄,这个人物会在一个决定性的危机中赢得胜利,然后得到升华转变或带着战利品归返到原来的世界。Dramatron 使用几个硬编码的 prompt(即 input prefix)来指导大型语言模型。Prompt engineering 是用户控制或影响大型语言模型的常用方法。如下图 3 所示,prompt 与用户提供的之前大型语言模型生成的输入和 / 或输出相连接,这种方法被称为 prompt chaining,是一种算法 prompting。如上图 1 所示,在整体结构的较低层次,prompt 与来自整体结构更高层次的输出链接在一起。
更多细节请参见原论文。
相关文章
猜你喜欢