> 自媒体 > (AI)人工智能 > ACL2023 | 赔了?引入GPT-3大模型到智能客服,竟要赔钱?
ACL2023 | 赔了?引入GPT-3大模型到智能客服,竟要赔钱?
来源:夕小瑶科技说
2023-07-30 16:23:30
293
管理

作者 | 小戏、Python

关于大模型的商业落地,一个非常容易想到的场景就是智能客服,作为不止是大模型也是 NLP 领域的一个最主要的应用场景,由于人工客服的高昂成本,AI 客服伴随着模型技术的发展也逐步走进我们的生活,在手机里各种主要的 APP 几乎都配备了一个智能客服。

而以 Chat 命名的大规模语言模型(LLMs)似乎天然的适配智能客服的应用场景,大模型驱动的智能客服也是一个非常具有想象力的落地方向。但是,在今年的 ACL 2023 中,来自对话式 AI 科技公司 LivePerson 的研究人员针对大模型“取代”客服工作算了一笔经济账,结果发现,用 GPT-3 等大模型做智能客服的 Backbone 反而有可能要赔钱?

案例研究

论文针对一家匿名零售商(AR)展开了案例研究,AR 的客户群体主要由在 AR 平台进行买卖的商家与消费者组成,AR 雇佣的专业人类客服会接受专业的培训,可以就不同的客户及各种不同的问题做出专业的回复。AR 共计雇佣约 350 名客服,平均每月发送 100000 条消息,约进行 15000 轮对话。

通过该零售商提供的对话数据,论文构建了一个针对 AR 零售商的定制训练数据集(Brand)与一个问题的通用数据(General),采用三种主流的训练策略——Prompt Engineering, Fine-tuning 以及知识蒸馏,对 11 种主流模型进行了训练:

为了获取针对这些“智能客服”回答响应的“有用程度”,论文采用专家打分的方式,对这些模型的每个对话进行了接受、编辑与忽略的评分判断,哪怕对于人工客服,人们也并不总是接受他们的回复,而在智能客服中,基于 GPT-3 的模型表现最佳。

假设一个人工客服每小时的成本为 10$,即 SU=SE=SI=10,每条消息平均需要 30 秒,而使用 LLMs 可以节省 25 秒,GPT-2 的模型生成成本为 0.002 美分,使用 Distilled GPT-2 需要 0.0011 美分,使用 OpenAI 的 API 成本为 1.09 美分,使用微调模型的成本为 6.54 美分,使用 Cohere 的 API 的成本为 0.25 美分,使用微调模型的成本为 0.5 美分。通过使用 ENCS 评估各个模型的“成本节约力度”,结果如下图所示,可以看出具有更高响应质量的 GPT-3 反而会造成负的 ENCS 值,即不仅不会为企业带来成本的节约,甚至还会加重企业成本的负担。

具体而言,AR 零售商使用 GPT-2 BFT BD 单条消息可以节省 4.47 美分,根据 AR 每年的消息数量 1200000 条来计算,使用 GPT-2 模型可以节约 53653 美元,而使用 GPT-3 模型则可能要亏损约 18691 美元。

针对计算得到的 ENCS,可以为每个模型计算得到一个盈亏平衡点,如下图所示,当绿色线(劳动力成本节约)与红色线(模型建设投入)相交时达到盈亏平衡,可以得到,对于一个每年消息总量约 500000 条的小企业而言,使用大模型构建智能客服必须快速的降低前期的研发成本,而对于一个每年约有 2000 万条消息的大企业而言,使用大模型构建智能客服才会真正带来成本节约。

总结与讨论

这篇论文针对大模型应用在智能客服领域的商业场景进行了细致深入的研究,同时提出了一种评估大模型响应到底带来了多少“成本节约”问题的分析框架 ENCS,给出了一个有点反直觉但是又十分合理的结论——在当下大模型的应用成本仍然较高,只有大企业的大体量带来的规模效应才有可能有动力去完成大模型的实际部署,对于小企业而言大模型的应用成本仍然过高。不过这些分析也主要试图提供一些管理、决策之上的洞见,在更细致的成本测算之上还有许多工作需要去做,当然,最后,这些洞见不仅呼唤着大模型的技术进步为我们带来成本的降低,也呼唤着一些第三方平台企业的出现解决一些小企业用不起大模型的现实问题,且让我们期待一下大模型未来的进步吧!

论文题目:The economic trade-offs of large language models: A case study

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
人工智能的发展:OpenAI 创始人离职的启示
关于创造的Open AI是否会解雇CEO曼的讨论引起了网友们的关注。据了解,早..
日本金融巨头瑞穗将让 45000 名员工测试 OpenAI
瑞穗银行表示,将在该银行的经纪部门使用人工智能工具。 这家日本银行业..
陶哲轩:我用GPT-4辅助证明不等式定理,论文还会上传arXiv..
机器之心报道编辑:杜伟陶哲轩可太喜欢 GPT 系列大语言模型了!近几个月..
李彦宏:谷歌比百度多付四千万美元也没做出ChatGPT
“算力不能保证我们能够在通用人工智能技术上领先,算力是可以买来的,创..
“丝袜门”事件再反复!新聊天记录疑曝光,涉事人员称账号被盗?..
更令人匪夷所思的是,事件中还牵涉到一名自称为“省政府办公厅”的用户。..
女子的不雅视频被监控拍下,聊天内容不堪入目
尊敬的读者,感谢您再百忙之中能够阅读我的文章,这是对我努力的肯定,也..
真正会说话的人,不是口若悬河,而是懂得这几种聊天方式..
人与人交往,往往是始于“颜值”,终于“言值”。一句话说好了,入心入肺..
“人机之恋”升级:GPT让虚拟伴侣更会聊天,也更危险..
·截至目前,豆瓣“人机之恋”小组已有9498名成员。Replika Reddit论坛则..
OpenAI 第四弹:马斯克强调的 TruthGPT 是什么?下个“AK”;微软弃婴,二..
有消息称,前 OpenAI 联合创始人&主席 Elon Musk,正在接洽曾在 DeepMind..
关于作者
天外天(普通会员)
文章
624
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40369 企业收录2981 印章生成216707 电子证书945 电子名片57 自媒体34015

@2022 All Rights Reserved 浙ICP备19035174号-7
1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索