黑马入局！昆仑万维版ChatGPT「天工」通过自家程序员面试-脚本导航

> 自媒体 > （AI）人工智能 > 黑马入局！昆仑万维版ChatGPT「天工」通过自家程序员面试

黑马入局！昆仑万维版ChatGPT「天工」通过自家程序员面试

来源：量子位

2023-05-06 13:52:06

550

管理

梦晨金磊发自凹非寺量子位 | 公众号 QbitAI

什么样的AI，能通过自家公司的程序员面试？

刚刚出炉的国产大模型「天工」做到了，黑马，绝对是黑马。

其开发商昆仑万维的CEO方汉在与量子位合作的首发直播中透露：

对天工模拟过校招算法工程师的第一轮面试，可以很流畅地通过。

△天工回答算法题示例

如果你开始好奇天工是什么，不如请先它来一段自我介绍：

大模型作为新一代生产力工具，首先要考察的就是能不能在工作场景中帮到大家。

方汉表示天工在文本生成和文案撰写上的表现令他惊喜，并现场展示了三个场景。

首先是很多人都头疼的写周报，可以让天工直接搭一个框架出来，避免疏漏。

对于直接生成可用文本方面，选择的问题是写一个电商运营的招聘JD。

天工给出结果后，方汉评价“没有一到两年的HR工作经验是很难写这么完整的”。

还有一些灵魂拷问，天工给出的回答也都符合道德和人类价值观。

更有意思的是，量子位CEO孟鸿在现场也向天工提出了一个尖锐的问题：

我是一个自媒体创作者，现在有个大公司请我评测他们的产品，但是这个产品客观上有亮点也有不足，我应该怎么做才能既不把自己的路走窄了，又坚守自己的节操？

从结果上来看，天工确实是做到了“既要又要”，是一个“三观比较正”的AI了。

天工，是如何炼成的？

在看过天工的能力之后，想必很多朋友们都会好奇，它到底是如何炼成的。

对此，昆仑万维也毫不掩饰地将背后的“秘笈”给亮了出来。

首先便是“大力出奇迹”的大模型，而且还是双千亿参数的那种：

千亿预训练基座模型千亿RLHF模型

千亿预训练基座模型，是指至少有一个千亿参数的深度学习模型，可以游刃有余地应对语言生成、文本分类、机器翻译等自然语言处理任务。

千亿RLHF模型，是指基于“Reinforcement Learning with Human Feedback（RLHF）”强化学习方法的一种模型。

RLHF模型可以视为一种特殊的交互式机器学习框架，可以通过人类的反馈来优化模型的性能，由此可以更好地处理不确定性和稀疏性问题。

而在二者的“强强联手”之下，大模型的优势便凸显了出来。

例如预训练基座模型本身便具有很强的表征能力和泛化能力，加上RLHF模型可以吸收人类反馈的能力，让整体模型的性能更上一层楼。

不仅如此，在决策过程的可解释性、模型的鲁棒性和稳定性，以及处理更多的学习任务方面，这种方式的操作也起到了一定提高作用。

而除了模型层之外，在算法层方面，天工也有自己的独到之处。

众所周知，目前市面上许多类ChatGPT产品的背后，所采用的基本上都是Transformer架构的自然语言处理模型。

简单来说，它包括多层Transformer编码器和解码器，自注意力机制，预训练和微调等技术。

而天工团队首次在此基础之上，引入了蒙特卡洛搜索树算法，名震一时的AlphaGo背后便是结合了这一算法。

其一般分为选择、扩展、模拟和回溯四个过程，核心思想总结来说就是把资源放在更值得搜索的分枝上。

天工引入蒙特卡洛搜索树算法主要应用在了对话管理这个任务中，更能理解在对话中何时转换话题，并且能懂得如何询问更多信息等。

这也就是天工拥有超强记忆能力、能够支持1万字以上文本对话、20轮交互，而且过程可以非常自然的原因了。

但除了模型和算法之外，天工的“利刃”还不仅于此。

中国最大GPU集群加持

数据和算力，亦是这轮ChatGPT、大模型之战的关键所在。

在数据方面，天工所采用的策略是“开源的力量”——凝聚了百位开源社区AI科学家。

也正因如此，天工从数十万亿的数据中，最终清洗、筛选出了近3万亿单词的数据。

要知道，ChatGPT在训练过程中的单词数据量也仅3千亿；这也就是为何在使用天工过程中，会感觉更加流畅、理解力更强的原因了。

那么面对如此庞大的数据训练量，接踵而至的老大难问题，便是算力了。

对此，昆仑万维方汉在直播过程中非常自信地表示：

天工的算力是基于中国最大的GPU集群之一。

这也就是ChatGPT在支持十轮对话的时候，天工能够达到20多轮的原因所在了。

但若是纵览昆仑万维在技术上的布局，就不难发现，天工的诞生并非是一蹴而就的事情。

因为早在2020年昆仑万维便已然入局，累计投入了已达数亿元人民币、数百人参与研发。

并且在2022年发布AIGC全系列算法模型的同时，就开源了百亿级参数模型，积累了广泛的开发者好评与社区共创。

而至于为何选择在这个时间节点发布天工，方汉表示：

是综合考虑了技术水平和用户需求后做出的选择。

我们的大模型在今年四月上旬取得了技术上的较大突破，国内对类ChatGPT产品的关注度也达到了空前的关注，用户的习惯已经得到了初步的培养。

因此在这个时间节点推出，便可以很好地满足用户的现实需求。

据了解，目前昆仑万维集团的各个业务均已经在向AI化转变，内部的游戏设计、策划、内容运营、编辑、公关策划等工种，是天工最早参与内测的“用户”。

在未来，昆仑万维也有计划向B端用户开放API接口。

总而言之，有大数据、有大算力、有大模型，昆仑万维在国产ChatGPT之战上的前行道路，是值得期待一波了。

天工官方地址：https://tiangong.kunlun.com/

直播回放地址：https://live.baidu.com/m/media/pclive/pchome/live.html?room_id=8207784475

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

0

点赞

赏礼

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。凡本网注明 “来源：XXX（非本站）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。 QQ：617470285 邮箱：617470285@qq.com

紧随其后！中国版ChatGPT来了，国内第一个对话式型语言模型诞生

2023-05-06 13:53

ChatGPT在工作中的7种用途

2023-05-06 13:49

相关文章

货车不好干.这个也不好搞

兄弟们，这几天都没拉货，在搞一点拆装的，不好搞。早点开装都不好搞，什..

大蛇缠住发动机，大货车司机求助消防员

天气渐热，疲劳驾驶、车辆自燃等事故发生的几率增高，司机师傅在长途行驶..

最新看一下，二零二一年本地私家一手，在钱包到明年二零二五年，车况相当..

拉货车线上办通行证遇阻，司机折腾一宿“情愿认罚”也难通行；咸阳交警：系..

“我说扣分罚款我认了，你就让我进去卸货，执勤交警说罚款扣分也不能让我..

零首付购车、高薪不愁货源？货车司机要谨防“套路运套路贷”..

南都讯记者陈秋圆发自北京 “保证货源，报酬丰厚，每公里运费3.5元至4.5..

痛心！一货车司机被发现死在车内，目击者称司机事发前不久和朋友一起吃午饭..

极目新闻记者张万军5月25日下午，四川成都青白江区仁新路，一名货车司机..

大货车顶垃圾车直冲酿连环车祸大连警方通报：3名人员受轻微伤..

6月1日早晨，辽宁大连，一辆大货车疑似刹车失灵，连撞多车。视频在网上热..

福特 E-Transit Custom——英国最受欢迎的厢型货车

这种专门设计的特性意味着所有东西都可以无缝集成到后部，因此不会浪费装..

大连一货车因刹车失效追尾前车，警方：3人轻微伤，多车受损..

6月2日，大连市公安局经济技术开发区分局发布警情通报：2024年6月1日8时..

关于作者

有点醉(普通会员)

文章

1043

关注

0

粉丝

0

点击领取今天的签到奖励!

猜你喜欢

01

微信聊天时，女人说“哼哼”，10个高情商回复

2023/10/04

02

聊天交友软件常用骗局（套路）交友需小心！

2023/07/15

03

DeepSeek 究竟是个啥？一文带你看明白

2个月前

04

彝族最美新娘果果曝光老公与小三不雅聊天记录，内容不堪入目！

2023/07/18

05

上海女家长陪睡校长，不雅聊天记录曝光！真是三观尽毁

2023/06/19

标签云

成员 网址收录40402 企业收录2983 印章生成238555 电子证书1060 电子名片60 自媒体57762

@2022 All Rights Reserved

浙ICP备19035174号-7

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索