> 自媒体 > (AI)人工智能 > GPT-4对游戏文本检查的最佳实践
GPT-4对游戏文本检查的最佳实践
来源:闪念基因
2023-07-17 14:24:25
538
管理

GPT-4是OpenAI利用自然语言处理技术研发的大型语言模型,能够协助人类进行写作辅助、文章撰写、智能聊天机器人、编程辅助、新闻生成、游戏设计等工作。它能理解并回应各种语言风格和主题,提供创新的解决方案,帮助各行各业解决问题。本文记录了一次利用GPT-4对游戏文本进行检查的最佳实践,并据此介绍如何利用GPT-4协助我们正确、高效地完成日常工作。

01 背景和目标

在任何一个游戏项目中,都存在着海量的,每周都会迭代更新的游戏文本。由于各种各样的原因,对这些文本进行检查的频率并不高,通常只会在版署测试前进行检查,但是一旦出现问题,轻则被游戏玩家截图传播留下话柄,重则直接被举报导致游戏下架整改。因此,寻找一个高效率且高准确度的文本检查方式就成为了一直以来的技术难题。

万幸的是,GPT-4的出现为这个技术难题找到了一个几乎可以说是完美的解决方案。在本次的例子中,待检查的测试文本挑选了以下几个具有代表性的词语case:

不应该出现在游戏中的:毒贩夫妇,乔布斯,苹果公司,盗窃星晶宝盒

可以出现在游戏中的:刃·致命,爆发性伤害技能,诸葛亮,6元首充,验证码

接下来我们正式与GPT-4开启交锋,并通过一步步对提示词进行优化,最终达到我们想要的完美结果:

02 第一次尝试

可以看到,仅仅是给出了两个词语的例子,GPT-4就改善了“输入case数量和输出case数量不一致”的问题,并且对每一个词语都给出了总结性的结论,和上一份输出相比有着明显的提升。

但是还不是我们想要的,它还存在以下问题:

(1)部分case仍然未给出明确结论,例如“苹果公司”,GPT只提示我们要“小心使用”。

(2)部分case结果错误,例如“盗窃星晶宝盒”属于不良价值观导向。

(3)输出了一些没用的解释信息,无法适用于大批量检查。

2.

指定输出格式

我们为GPT-4追加了两条判断标准,希望AI能准确地发现问题:

对于违反法律或道德的行为,判断为不合适对于可能存在侮辱的词语,判断为不合适

但是很遗憾地发现,GPT-4并没有发现“盗窃星晶宝盒”是不合适的,为什么呢?当发现预期结果与实际不一致时,还有一个方法是:问问AI为什么这么想。

在理解了AI的思考和行动逻辑后:我们追加规则:

对于可能鼓励或引导玩家在真实世界中进行违法行为的词语,判断为不合适。

至此,我们已经提炼出了一份完成度较高的,较为可用的prompt。

作为对比,我们来看一下GPT-3.5的输出结果:

在最终的生产实践中,使用的prompt是:

assume you are a text editor for teenager-game products.

I'll provide you some phrases in Chinese.

your responsibility is to check if these phrases are leading the wrong moral guidance to teenagers.

please identify any sentences or phrases not suitable for teenagers.

here are some additional rules:

slightly dirty world should be considered as proper.

slightly violence description should be considered as proper.

price or purchase description should be considered as proper.

any phrase contains celebrity name should be considered as improper.

the input format:

the input will contain several lines.

each line should be considered as a phrase.

the output format:

if any phrase provided is suitable for teenagers, just pass it, do not output anything and go to next phrase.

if any phrase is improper, output it and explain the reason.

相比之前提到的例子,增加了对轻微脏话、暴力用词、支付术语的容忍度,增加了面向的受众群体(未成年)使得审查标准更加严格,并增加了对实际存在的人名的绝对过滤,最终取得了非常良好的结果。

04 总结

作为OpenAI的最新的语言生成模型,GPT-4相比于GPT-3的模型规模更大,学习能力和理解能力更强,输出结果的准确性和一致性更高,还可以处理长篇文本和维持话题连贯性。在任何可能的情况下,我都推荐使用GPT-4而不是GPT-3。

在利用GPT-4协助工作时,可以利用类似于最小可行产品的设计-反馈-迭代思路优化prompt:

(1)给出一个清晰,具体的prompt

(2)检查AI给出的反馈,分析为什么AI没有给出预期的输出

(3)重新调整任务目标和prompt

(4)重复以上操作

作者:测试中心小编

来源:微信公众号:网易雷火测试中心

出处:https://mp.weixin.qq.com/s/Ljw1wfne0_0Kt_-nAEXYSg

0
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
日产拉上三菱,划分两大阵营
当前,日本汽车品牌正步入一个前所未有的活跃阶段。作为全球第三大汽车生..
日产拉上三菱,划分两大阵营
当前,日本汽车品牌正步入一个前所未有的活跃阶段。作为全球第三大汽车生..
三菱、日产将成立合资公司,部署L4自动驾驶业务
近期,海外消息称,三菱商事和日产汽车将成立合资公司,该公司将提供与L4..
三菱汽车因刹车隐患提交改善措施,涉及13.8万辆汽车
总台记者当地时间11月1日获悉,因可能存在安全隐患,日本三菱汽车工业公..
继丰田、三菱被曝造假后,日本松下承认造假44年,负责人鞠躬致歉..
松下造假案:44年的谎言,终将被戳破“鞠躬道歉”,这四个字在日本企业文..
中日韩三大财团:三菱总资产21万亿,三星2.16万亿,中国第一是谁..
导语中日韩三国中,韩国以其经济增速迅猛而备受关注,然而即使韩国GDP达..
2024款三菱 ASX 换上了新面孔
首次亮相一年后,三菱 ASX 换上了新面孔。整容手术成功了吗?这是测试三..
日产、三菱拟建立合资公司,专注自动驾驶、电动汽车动力电池业务..
IT之家 11 月 4 日消息,据《读卖新闻》今日报道,日本三菱商事与日产计..
三菱汽车因刹车隐患提交改善措施 涉及13.8万辆汽车
总台记者当地时间11月1日获悉,因可能存在安全隐患,日本三菱汽车工业公..
关于作者
酷匠(普通会员)
文章
1111
关注
0
粉丝
1
点击领取今天的签到奖励!
签到排行

成员 网址收录40404 企业收录2983 印章生成239177 电子证书1064 电子名片60 自媒体59670

@2022 All Rights Reserved 浙ICP备19035174号-7
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索