> 自媒体 > (AI)人工智能 > ChatGPT 爆火的背后:深度解读“智能对话”与“人机交互”技术
ChatGPT 爆火的背后:深度解读“智能对话”与“人机交互”技术
来源:InfoQ
2023-04-08 17:36:37
725
管理

作者 | 鲁冬雪

智能对话技术在近几年来取得了惊人的进步,最近爆火的 ChatGPT 更是将智能对话推到了至高潮。像 ChatGPT 这样的聊天机器人有着广泛的用途,然而想要让其达到真正的智能水平,还有很多挑战需要克服,比如自然语言处理、上下文理解、逻辑推理、情感表达等技术能力都需要进一步迭代。

如今智能对话技术已经发展到什么程度了?当前有什么好的智能对话产品实践经验?智能对话技术的下一步演进将是怎样的?为了得到这些问题的答案,3 月 11 日下午,OPPO 数智在线下举办了主题为《畅谈“智能对话”,共启“交互未来”》的 OGeek 小布沙龙。OPPO 小布助手首席研究员杨振宇博士作为本次沙龙的内容出品人,邀请到了清华大学计算机科学与技术系长聘副教授黄民烈博士、百度 AI 主任研发架构师 & 小度算法团队技术负责人谢剑博士及 OPPO 小布助手算法专家索宏彬博士来到现场进行了硬核的技术干货分享及精彩绝伦的圆桌论坛。

在自定义 TTS 方面,传统的声音自定义技术方案,录入时间长,效率低。同时,小布助手的用户群体背景及使用场景复杂,因此在复杂的环境和海量数据情况下,如何挑选满足条件的音频作为训练数据成为了一个巨大的挑战。于是小布助手研发团队自研了“纯语音 VAD”与“语音语义深度结合 VAD”的解决方案,同时应用了“预训练 在线自适应”的技术方案。

就像出品人杨振宇说的那样,“即使有像 ChatGPT 这样的新技术出现,挑战也仍然存在,包括内容安全与 AI 伦理、长时记忆与个性化、共情能力与拟人化、反馈驱动与自学习。但机遇与挑战并存,随着技术的快速迭代,智能对话领域正在迎来最好的时代。”

值得一提的是,在本次 OGeek 小布沙龙中,杨振宇还宣布了“2023 年中国高校计算机大赛智能交互创新赛”启动事宜,呼吁全球高校在校生参与到本届大赛中。据悉,该大赛是由教育部四大教指委创办,由浙江大学与 OPPO 公司联合承办,旨在提升学生在新一代人机交互方向的技术、场景创新能力,积极探索“科技为人”的智能交互技术,给未来人类生活提供全新的产品及服务体验。希望通过竞赛的形式培育产学研融合的 AI 人才生态体系,共同促进人机物三元融合产业的发展和革新,全面推进 AI 技术的发展。

附:圆桌论坛环节精彩整理

问题 1(杨振宇):关于智能对话技术的研究与探索,目前学术界和工业界的侧重点分别是什么?

黄民烈:学术界现在的趋势是以神经网络模型为主,工业界的趋势则是朝 OpenAI 的方向持续狂奔。从学术界角度来讲,由于资源受限,无法支撑太多大规模的模型和试验。整个学术界的研究方式正在与工业界的方式趋同和对齐,很多有影响力的论文都是由名校和大厂共同产出的。

学术界当下需要考虑如何学习外界工具方法来解决自身研究的问题。工业界数据是最好的方法,但学术界也需要用有原则性的方法突破它。比如乌托邦个性化对话平台的很多行为要靠数据解决,里面也有很关键的算法,这时既要考虑算法在原理层面是否合适,同时也要注意规避算法短时间内难以克服的缺陷。

谢剑:不单是智能对话,我们可以思考任何计算机领域包括科学领域,学术界和工业界的侧重点是什么。个人看来,学术界侧重突破新的可能。比如不考虑任何成本,智能最终极限将是什么样的。工业界则侧重于解决问题,他们更看重“捅破天花板”的技术最终能应用于哪些场景以解决用户的需求。近年,工业界产品的用户体量很大,也需要再往前走一走。刚刚黄老师提到,现在许多大厂和高校之间都有合作。那么工业界也将与学术届合作,一起捅破“天花板”。

索宏彬:目前,OPPO 小布也在和学校进行合作,该项目的出发点主要围绕两个方向,一是跨领域、多模态领域,涉及语音、图像以及语义结合,可以看出学术界在这些领域是比较关注的。第二个是问题驱动,这其中包括很多技术挑战点,高校工作也比较关注。回到本质上,目前智能助手业务应用上,跟高校的合作还是主要围绕用户体验、围绕问题驱动。

问题 2(杨振宇):当前 B 端企业和 C 端用户对于“智能对话”产品的核心需求分别有哪些?

谢剑:2B 最后也是 2C,最终都是要满足用户的需求,当然它们也会各有侧重。2B 的客户往往是开发者,他们看重是否具有泛化能力,能否降低开发者成本。2C 的大部分用户不是开发者,他们希望交互一次就能满足需求。所以,从智能对话上来讲,这可能是比较明显看到的区别。也许,新的时代 2B 和 2C 会模糊掉。如果开发者用很简单的自然语言就能开发,就意味着人人都能成为开发者,中文也能变成世界上最强的编程语言之一。所以,2B 和 2C 的模糊,一定程度上也能带动整个社会生态的蓬勃发展。

索宏彬:小布的产品定位正在发生变化,尤其在备受热议的 ChatGPT 出来之后,小布的目标是朝着“有用”的方向走。原来的小布侧重于“有趣”,现在则在向“有用”的方向走,这是很典型的一个变化。

黄民烈:我理解人类有两类基本需求,一类是信息需求,一类是情感需求。信息需求本质上是做事情,怎么把它完成的更好。情感需求本质是要消磨时光,有情感的寄托,有情绪上、心理上的支持和疏导。所以,我们希望今天的助手能和人产生更强的连接,有情感的、社会的、信任的关系,不仅要完成信息类的任务,还要完成情感类的任务。从人类两大需求角度来看,无论是信息的还是情感的,最终都将融到一起,尤其现在技术发展越来越快,势必会产生很多新的应用场景。随着技术的成熟和变革,一定会有新的拐点和机会到来,这也是我们现在想试着做 AGI 的重要驱动点。

杨振宇:无论是 2B 还是 2C,都要考虑到底最终为用户希望发挥的价值是什么,以及在此之上给用户提供的体验是怎么样的。2C 与 2B 的核心需求侧重点目前虽然稍微有点不同,但本身都还在演进、融合的过程中。

问题 3(杨振宇):目前智能对话领域最大的“技术挑战”是什么?如何应对这个挑战?

索宏彬:大家在演讲过程中提了很多挑战,如果选一个最大的,那就是“自然”,不是 AGI 的,而是更往上走,真的达到拟人化或者跟人产生情感连接。实现无负担的交互。

谢剑:挑战很多,如果说最大的我个人觉得是如何做到 All in one,我怎么说都行,怎么说它都能搞定,背后一定程度上隐隐朝向 AGI 的挑战。其他的新场景泛化,信息需求和情感需求都能满足,本质都是需要 All in one。现在发现预训练的大模型能够把它整合,但依然还有很多问题,目标是希望能够 All in one 用一个大脑,这是我理解最大的挑战。

黄民烈:最大的挑战是如何实现 Human-like conversation。从现在看,我们已经接近类人的对话能力,但有些应用场景仍存在差距,比如多模态的信息、上下文理解等,尤其是如何连接到外部世界和知识,以及外部背景信息。总体来讲还是挺难的,AGI 有很长的路要走。

杨振宇:针对这个问题也分享一下我的想法,非常赞同今天各位专家提到的未来大模型用的越来越广泛的时候,怎么解决安全性的问题,怎么解决 AI 伦理的问题,特别是直接面向 to C 用户生成内容的时候。当讨论未来最大挑战的时候,多样性还蛮强的,在场各位专家完全不用担心未来没高价值工作可以做了,挑战还有很多。

问题 4(杨振宇):未来 XR 等新硬件设备的发展,将对智能对话领域产生怎样的影响?

黄民烈:现在技术发展很快,很多东西不太能够预测。我想未来电子宠物或者电子陪伴类的产品也许会卖的很好,因为它们能满足用户的情感需求。

杨振宇:大家在猜想 XR 设备会不会有下一个爆品,如果它发展起来,会不会对智能对话的领域有很大的影响。

黄民烈:前提是一定要脱离对设备本身的强依赖。如果设备本身的使用门槛或者使用场景不够自然,门槛很高,也许未来在手机装一个超级 APP 类似于 ChatGPT 的时候,可能就会很好。

索宏彬:XR 拓宽更多的交互模态,是增强人机交互的一种手段。

谢剑:人们所需要的最理想的助手,终极形态一定是多模态的助手形态。XR 有虚拟增强的设备,设备本身在拓宽 input 和 output 的模块。音箱是一个节点,从没屏幕变到有屏幕了,从只能听、能说,到后面有摄像头、能看、会说,再往后能不能有更虚拟的现实增强。回到智能助手,如果 XR 设备发展成熟了,多模态的助手就有了很好的承载设备,语言的理解就要还原到物理真实环境里,交互的各个方面都会有新的挑战。我相信新的技术挑战会带来新的技术机遇。

问题 5(杨振宇):随着技术发展,大家觉得未来理想的人机交互形态会是什么样的?在交互形态里,智能对话会扮演什么样的角色?

索宏彬:我比较认同当前类似 XR 的模式,即往多模态方向走,未来交互形态一定是自然表达,类比“人人”交互。

黄民烈:理想的一定是“情景式”的,有很多的交互场景。比如在车里,假设有一个人可以很好的与之交流,并且车内的场景交互一定是多模态的,有很多摄像头监测到肢体的状态等。其次是有很高的智能水平,可以自主也可以被动,智能到感知用户的全面状态,根据状态做出最有利于用户的决策。一定要具备综合决策能力,在特定场景下可以主动,大部分情况被动。

谢剑:关于理想态,我认为第一点是“个性化”。每个人在不同场景下都具有一个满足该场景需求的助手,或者每个人有一个“个性化助手”,它能在不同场景下扮演不同的能力和满足需求的形态。第二,未来的助手应满足市场供给。市场上有很多律师、作家、卖手等等,相信未来各个领域都会有助手。原本找律师的咨询费是比较贵的,而一些基本问题就可以咨询价格更实惠的智能助手。因此理想的形态,一是能满足个性化情景需求,二是市场上应该会有公共的产生知识供给的助手。

问题 6(杨振宇):现在 ChatGPT 的热度很高,它对智能对话将会产生哪些深远的影响?

黄民烈:我认为 ChatGPT 最大的意义是让所有公众意识到了 AI 的能力以及 AI 能够突破传统认知上的局限。每个行业、每个人都开始思考应该如何和 AI 相处,这是它最大的意义。ChatGPT 给我们带来的仍然是想象的空间,在当前的时代和节点下,大模型能够带给我们什么想象空间,过去不敢想的事情,是不是今天能够去想、能够去做,这个意义是比较重大的。为什么说是 AI 里程碑,因为它比过去所有事情带来的冲击都要更大。

谢剑:影响还是很大的,我们可以分类来看。针对普通用户,他们要思考在未来的工作场景中如何实现人机共生,只有拥抱人机共生才能做 AI 之上的人。很多人会比较悲观,但其实人不可能被工具杀死,人加上工具自然会超过工具。对于 NLP 和从业工程师来说影响也是巨大的,不管在工业界还是在学术界都是如此。影响巨大的原因是,原本从 AI 技术来看,大家认知 NLP 是皇冠上的明珠,突然间发现 All in one 做任务并不差,甚至效果更好,这对从业工程师的挑战还蛮大的。学术界有很多做某个单点方向的,此时就要寻找新的方式参与进去。

索宏彬:谢老师提到了 AI 共生的理念,我非常认同。不知道大家有没有用到 Bing 和 ChatGPT 的结合版,Bing 的效率非常高。Bert、ChatGPT 等大模型的演进路线,给很多 AI 从业者提供了新的方向,带来一定冲击的同时也增强了大家的信心。大家会沿着这条路做更多的探索,有挑战、有危机,同时也有机遇、有机会。

问题 7(杨振宇):在未来 2~3 年,您觉得智能对话等人工交互领域最有前景的方向是什么?

黄民烈:我认为最有前景的方向还是“个性化”,未来肯定是千人千面的。无论是教育场景,还是金融服务场景,每个用户对不同类型机器了解的方式是不一样的,从这个层面来看个性化是最大的商业价值点。

谢剑:我补充一个点,"增强语言模型",以大语言模型为大脑,利用其强大的常识、推理等语言能力,结合和借助外部的信息、知识以及工具,来增强大语言模型,实现能够推理、执行动作再推理等反复的思考 - 动作链,通过这种方式能够更好的实现广泛场景的落地。

索宏彬:个人认为从交互模态上,input 会变得更加丰富。其次是表达侧的表现,生成式人工智能是当下特别炙手可热的技术点,我们也在做一些探索和尝试。

杨振宇:我个人的期待是,未来的助手是可进化的,是越来越聪明的。通过进化实现个性化和知识增强,对外界知识有更强的理解。如果能实现可进化,一定会有更好的前景。

1
点赞
赏礼
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与本站无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 凡本网注明 “来源:XXX(非本站)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。 如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。 QQ:617470285 邮箱:617470285@qq.com
相关文章
不要转账!不要转账!不要转账! 男子深夜裸聊遭敲诈,幸得反诈宣传及时警..
12月20日凌晨,一年轻小伙神色慌张地来到上海市公安局崇明分局绿华派出所..
聊天交友软件“美女”主动搭讪,只要下载APP就能“赤身相见”?..
“夏季行动”期间,市民张先生向上海市公安局徐汇公安分局报警称,其在家..
chatGPT大规模封号,封禁IP
3月30号开始,chatgpt大规模封号,主要针对的是亚洲节点,以及以前批量注..
ChatGPT(OpenAI)太厉害了,我可以和它聊上一整天
最近 ChatGPT(OpenAI) 非常火热,主要也是因为它太厉害了,大家都被他强..
超1000人公开信呼吁停止AI训练,OpenAI创始人也签名了?真相是……..
每经编辑:黄胜人工智能风口正盛,一封呼吁暂停大型AI研究的公开信在硅谷..
零代码编程:用ChatGPT自动登陆微信公众号后台
要实现微信公众号后台自动登陆,可以使用ChatGPT来编写Python代码实现。..
GPT-4来了,这回对算力要求更苛刻
3月14日,ChatGPT热度未散,OpenAI就正式推出最新作品——多模态大模型GP..
60多岁阿姨砸20万追男星,儿子懵了:怎么又是他?
说到知名演员靳东相信许多人都很熟悉在中老年群体中更是有一大波粉丝但没..
年亏损5亿刀,OpenAI 2024年破产?自曝GPU短缺,顶级人才掀离职潮..
编辑:编辑部【新智元导读】ChatGPT日烧70万美元,OpenAI即将陷入破产边..
关于作者
冷冷的太阳..(普通会员)
文章
454
关注
0
粉丝
0
点击领取今天的签到奖励!
签到排行

成员 网址收录40335 企业收录2981 印章生成194261 电子证书831 电子名片53 自媒体26178

@2022 All Rights Reserved 浙ICP备19035174号-7
1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索