机器之心原创
机器之心编辑部
ChatGPT 军备赛开幕,哪些国内机构具备打造下一个 ChatGPT 的实力?
自从 2022 年底 ChatGPT 发布以来,海内外就掀起了一阵狂潮。推出仅两个月,ChatGPT 月活用户突破 1 亿,成为了史上用户增长速度最快的消费级应用程序。
ChatGPT 成为了搅动人工智能领域风云的新势力,其背后的 OpenAI 也因此成为了当下最热门的 AI 公司,甚至引发了科技巨头们的深度焦虑。
谷歌和微软两家科技巨头正在 ChatGPT 搜索上进行激烈竞争,先后宣布了将大型语言模型(LLM)整合到 Google 和 Bing 搜索中的计划。更有众多互联网公司迅速跟进,掀起了科技领域的又一场「军备竞赛」。有些机构开始着手研究同类型产品,有些机构从零开始布局对话式 AI 背后的一系列相关技术。
中国版 ChatGPT 将诞生于何处,也成为了大众最关心的问题之一。
鉴于 ChatGPT 是多项 AI 技术的集大成者,远非「一日之功」。这背后离不开算力、数据、人才等资源的支持。环顾国内群雄,谁最有可能造出下一个 ChatGPT?
在这篇文章中,机器之心将盘点国内最具实力的一批学术型机构和 NLP 研究领域带头人,共分为高校、大厂、非营利研究机构、初创公司四个部分,供大家参考、讨论。
如有盘点错误的地方,欢迎指正。
高校
清华大学自然语言处理与社会人文计算实验室
清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP)成立于 20 世纪 70 年代末,是国内开展自然语言处理研究最早、深具影响力的科研单位。实验室围绕以中文为核心的自然语言处理,在大规模预训练模型、中文信息处理、机器翻译、社会计算、智慧教育和知识图谱等方面开展了系统深入的研究。
实验室学科带头人是孙茂松教授,教师团队包括刘洋教授和刘知远副教授。近年来,该实验室承担了一系列国家重点研发项目、国家社会科学基金重大项目等重要研究任务,并与腾讯、华为、阿里、美团等企业建立了密切的学术合作关系。相关成果产生的 Github 开源工具包共获数万星标。
代表成员:
李涓子,清华大学计算机科学与技术系长聘教授,清华大学人工智能研究院知识智能中心主任,中国中文信息学会语言与知识计算专委会主任。2000 年在清华大学获得博士学位,研究领域为知识图谱、新闻与社会网络挖掘。主持研发了基于语义链接的跨语言知识图谱 XLORE,参与研发了研究者社会网络挖掘和服务系统 AMiner,曾获北京市科技进步一等奖、人工智能学会科技创新一等奖、王选新闻科学技术进步一等奖等多个奖项。
朱小燕,清华大学计算机系教授、博士生导师。曾任智能技术与系统国家重点实验室主任、北京市计算机学会副理事长、清华大学计算机系副主任、加拿大国际开发研究中心(DIRC)首席科学家。1982 年获北京科技大学学士学位,1987 年获日本神户大学硕士学位,1990 年获日本名古屋工业大学博士学位,1993 年到清华大学任教。长期在智能信息处理领域开展深入研究,在人工神经元网络、机器学习、自然语言处理、信息获取、智能问答系统、交互智能和人机交互等方面取得显著成果。
黄民烈,清华大学计算机系长聘副教授,2000 年毕业于清华大学工程物理系,2006 年获清华大学计算机科学与技术博士学位。研究兴趣主要集中在人工智能与机器学习方法包括深度学习、强化学习等,自然语言处理方法与应用,包括自动问答、阅读理解、对话系统、情感分析等。主要研究语言理解、语言生成、语言匹配与推理中的科学问题,致力于解决对话系统、自动问答、阅读理解中具有挑战性的人工智能问题。曾获得汉王青年创新奖、微软合作研究奖(Microsoft Collaborative Research Award)、IJCAI-ECAI 2018 杰出论文奖、CCL 2018 最佳系统展示奖、NLPCC 2015 最佳论文奖。
代表成果:
清华大学交互式人工智能课题组(CoAI)长期以来一直致力于构建开源的中文开放领域对话预训练基座模型,已有成果包括 CDial-GPT 、 EVA1.0、 EVA2.0、OPD 等。
北京大学人工智能研究院自然语言处理研究中心
北京大学人工智能研究院自然语言处理研究中心将以研发通用自然语言处理技术为目标,探索通用自然语言处理理论、方法和技术体系,研究通用性鲁棒性强且支持跨模态的自然语言理解与生成方法,为通用人工智能平台和领域 AI 大任务系统的提供技术支撑。主要研究方向有:语义分析与理解、文本推理、问答与对话、文本生成、跨模态语言智能、认知与知识计算等。
代表成员:
黄萱菁,复旦大学计算机科学技术学院教授、博士生导师,主要从事自然语言处理、信息检索和社会媒体分析研究,人工智能、自然语言处理学科方向带头人。兼任中国中文信息学会理事、社会媒体专委会副主任,中国计算机学会自然语言处理专委会副主任、学术工作委员会委员、中国人工智能学会女科技工作者委员会副主任、AACL 执委,EMNLP 2021 程序委员会主席。在高水平国际学术期刊和会议上发表了百余篇论文,负责的多个科研项目受到国家自然科学基金、科技部、教育部、上海市科委的支持。获 2021 年上海市育才奖,并入选「人工智能全球女性」、「AI 2000 人工智能全球最具影响力提名学者」及「福布斯中国 2020 科技女性榜」。
张岳,2003 年毕业于清华大学计算机科学专业,获得学士学位;2006 年毕业于牛津大学计算机科学专业,获得硕士学位;2009 年毕业于牛津大学计算机科学专业,获得博士学位。2010 年 3 月 - 2012 年 6 月在剑桥大学计算机科学专业从事博士后研究,2012 年 7 月 - 2018 年 8 月在新加坡科技与设计大学担任助理教授。2018 年 9 月全职加入西湖大学,担任终身副教授。主要研究领域为自然语言处理、文本挖掘、机器学习和人工智能,具体研究方向包括:1. 中英文基础自然语言处理中的词法、句法及语义表示,分析。2. 信息抽取中的实体、关系、事件以及情感抽取。3. 金融领域、生物医药领域以及文学领域的文本挖掘。4. 自然语言生成及其在文本总结与机器翻译中的应用。
张岳博士是近几年全球 NLP 相关顶会最高产的学者之一。根据相关统计,在 2012 年 - 2020 年期间,张岳博士在 NLP 领域的顶会发表的论文数量是全球第三,仅次于周明和 Yoshua Bengio。
赵铁军,教授,博士生导师,哈工大教育部 - 微软语言语音重点实验室主任,兼任中国中文信息学会常务理事,中国计算机学会自然语言处理专业委员会副主任,《中文信息学报》、《自动化学报》编委。1987 年开始从事中文信息处理领域相关研究,主要研究方向:自然语言理解、人工智能应用。近年来承担国家自然科学基金重点项目、面上项目、国家重点研发计划项目、国家高技术计划项目、科技部国际合作项目等 7 项,2018 年担任国家重点研发计划司法专题项目(2018YFC0830700)首席科学家;发表学术论文 60 余篇。先后获部级科技进步奖 6 项,出版专著、译著 3 部。
车万翔,教授,哈尔滨工业大学计算学部长聘教授、博士生导师,社会计算与信息检索研究中心副主任。教育部青年长江学者,黑龙江省「龙江学者」青年学者,斯坦福大学访问学者。在 ACL、EMNLP、AAAI、IJCAI 等国内外高水平期刊和会议上发表学术论文 50 余篇,其中 AAAI 2013 年的文章获得了最佳论文提名奖,论文累计被引用 4,600 余次(Google Scholar 数据),H-index 值为 37。负责研发的语言技术平台(LTP)已被 600 余家单位共享,并授权给百度、腾讯、华为等公司使用。2018、2019 连续两年获 CoNLL 国际评测第 1 名。2015、2016 连续两年获谷歌专注研究奖。2017 年,所主讲的 MOOC 课程《高级语言程序设计(Python)》获国家精品在线开放课程。
刘挺,博士生导师,哈工大计算学部主任兼计算机学院院长。多次担任国家 863 重点项目总体组专家、基金委会评专家。中国计算机学会理事,中国中文信息学会常务理事 / 社会媒体处理专委会(SMP)主任,曾任国际顶级会议 ACL、EMNLP 领域主席。主要研究方向为人工智能、自然语言处理和社会计算,是国家 973 课题、国家自然科学基金重点项目负责人。主持研制「语言技术平台 LTP」、「大词林」等科研成果被业界广泛使用。曾获国家科技进步二等奖、省科技进步一等奖、钱伟长中文信息处理科学技术一等奖等。
张家俊,中国科学院自动化研究所研究员、博士生导师,主要研究方向为机器翻译和自然语言处理,获得国家优秀青年科学基金资助,入选中国科协首届青年人才托举工程、中国科学院青年创新促进会优秀会员和北京智源青年科学家。发表 CCF-A/B 类论文 80 余篇,出版学术专著 2 部、译著 1 部,获得中国中文信息学会钱伟长中文信息处理科学技术奖一等奖、青年创新奖一等奖和 2020 年北京市科学技术奖一等奖等。担任中国中文信息学会理事、青年工作委员会主任和机器翻译专委会副主任。担任 ACL/EMNLP/COLING 的 (资深) 领域主席,以及《自动化学报》等期刊的编委。
中科院计算所自然语言处理研究组
中国科学院计算技术研究所自然语言处理研究组隶属于中国科学院智能信息处理重点实验室,主要从事自然语言处理相关的研究工作,主要研究方向包括机器翻译、人机对话等。研究组在自然语言处理领域旗舰会议 ACL 和影响力最大的期刊 CL 上分别发表了国内首篇论文;获 ACL 2019 最佳长文奖,为 ACL 开办以来国内单位首次获得此奖项;获 ACL 2006 Meritorious Asian NLP Paper Award,为国内学者首次获得 ACL 论文奖;获 EMNLP 2008 最佳论文提名奖、2020 世界人工智能大会青年优秀论文奖等。多次在 IWSLT 国际机器翻译评测和 CWMT 机器翻译评测中获得第一名,并在由美国国防部 DARPA 资助的、NIST 组织的世界权威机器翻译评测中获国内研究机构最好成绩。部分研究成果获国家科技进步奖二等奖、北京市科技进步二等奖、钱伟长中文信息处理科学技术奖一等奖、中国电子学会科学技术奖科技进步一等奖等。
代表成员:
韩先培,中科院软件所研究员,担任中文信息处理实验室副主任,入选国家优青、中国科协青年人才托举计划及北京智源青年科学家。主要研究方向为信息抽取、知识图谱及自然语言理解。承担中科院战略先导、科技创新 2030 课题、国家重点研发专项等十余项课题。在 ACL、SIGIR、IJCAI 等重要国际会议发表论文 60 余篇。担任中国中文信息学会理事及语言与知识计算专业委员会副主任。相关成果获中国中文信息学会汉王青年创新奖一等奖及科学技术奖一等奖。
中国人民大学高瓴人工智能学院
中国人民大学高瓴人工智能学院由高瓴资本创始人、耶鲁大学校董、中国人民大学校友张磊先生捐资支持建设。高瓴人工智能学院博士生导师实行人才培养导师组的形式,研究方向为:人工智能基础理论,智能信息检索,机器学习,计算机视觉,自然语言处理,人工智能交叉应用等。
学院已与百度、华为分别签订人才培养合作协议、「智能基座」产教融合基地合作协议,与百度共建「松果实践基地」,与北京智源人工智能研究院、微软亚洲研究院开展人工智能创新人才联合培养,与联通、京东、滴滴、浪潮、爱奇艺、美团点评等 20 余家知名企业设立了实训基地。
2021 年学院师生共发表高水平论文(中国计算机学会 CCF A/B 类)100 余篇。文继荣院长作为北京智源研究院首席科学家,带领团队研发首个中文超大规模多模态预训练模型「文澜」,产生广泛影响。
在国际排行榜 CSRankings 中,2021 年中国人民大学人工智能领域世界排名已升至第 16 位,在互联网与信息检索方向排名位居世界第一。更多国际一流学者正在陆续加入人才培养导师组。
代表成员:
卢志武,中国人民大学高瓴人工智能学院教授,博士生导师。2005 年 7 月毕业于北京大学数学科学学院信息科学系,获理学硕士学位;2011 年 3 月毕业于香港城市大学计算机系,获 PhD 学位。主要研究方向包括机器学习、计算机视觉等。主持 NSFC、KJW 等多个国家项目。设计首个公开的中文通用图文预训练模型文澜 BriVL,并发表于 Nature Communications。以主要作者身份发表学术论文 70 余篇,其中在 TPAMI、IJCV、TIP、TCYB、TGRS 等重要国际期刊和 NeurIPS、AAAI、IJCAI、CVPR、ICCV、ECCV 等重要国际会议上发表论文 40 余篇,CCF A 类论文 25 篇,入选 ESI 高被引论文 1 篇。
赵鑫,教授、博士生导师。研究方向为自然语言处理以及推荐系统。近五年内在国内外著名学术期刊与会议上发表论文 80 余篇,其中包括信息检索领域顶级学术期刊 ACM TOIS 和学术会议 SIGIR、数据挖掘领域顶级学术期刊 IEEE TKDE 和学术会议 SIGKDD、自然语言处理顶级会议 ACL 和 EMNLP。所发表的学术论文取得了一定的关注度,据 Google Scholar 统计,已发表论文共计被引用 4000 余次,其中以第一作者发表《Comparing Twitter and Traditional Media Using Topic Models》被引用 1300 余次。
代表成果:
在中国人民大学高瓴人工智能学院执行院长、智源首席科学家文继荣教授的带领下,中国人民大学、北京智源人工智能研究院、中科院计算所的研究团队合作开展了大规模中文多模态预训练模型的研究,并发布了第一代悟道・文澜,旨在发掘预训练模型在中文通用多模态数据上的理解能力。文澜模型经过 6.5 亿弱相关中文图文对的预训练,学习到独特的中文语义理解能力并能很好地将中文语义与视觉信息联系起来,尤其擅长读取中文独有的含蓄语义与图片中的抽象概念。
南京大学自然语言处理研究组
南京大学自然语言处理研究组从事自然语言处理领域的研究工作始于 20 世纪 80 年代。近年来,研究组在自然语言处理的多个方向上做了大量、深入的工作,集中关注文本分析、机器翻译、社交媒体分析推荐、知识问答等多个热点问题,结合统计方法和深度学习方法进行问题建模和求解,取得了丰富的成果。研究组在自然语言处理顶级国际会议 ACL、EMNLP、NAACL 和人工智能顶级国际会议 IJCAI 和 AAAI 上发表论文三十余篇,相关系统在机器翻译、中文分词、命名实体识别、情感计算等多个国际国内评测中名列前茅。
代表成员:
周靖人,哥伦比亚大学计算机科学博士,浙江大学兼职教授,IEEE Fellow。现任阿里巴巴集团资深副总裁,达摩院副院长。曾负责阿里云计算平台,淘宝和支付宝搜索、推荐、广告等数据智能业务。研究方向包括云计算、大数据、人工智能算法及应用。多次担任 VLDB,SIGMOD,ICDE 等国际顶级会议程序委员会主编、主席,在顶尖国际期刊和会议上发表论文超百篇,并拥有几十项技术专利。2022 年 12 月,任阿里云智能 CTO 兼任达摩院副院长。
司罗,阿里巴巴副总裁兼达摩院语言技术实验室负责人,2014 年成为阿里人工智能科学家阵营的一员,带领阿里 NLP 团队取得多项重要成果。他领导阿里巴巴语言智能、机器翻译、文本分析、对话智能以及文本搜索等技术研究方向,累计发表学术论文 180 多篇,被广泛引用。司罗是最早一批从学术界转向工业界的人工智能科学家之一。在加入阿里巴巴之前,司罗是美国普渡大学计算机系的终身教授,并先后获得美国国家科学基金会成就奖、雅虎、谷歌研究奖等。更早之前,司罗先后获得清华大学和卡内基梅隆大学的计算机学士和博士学位。他曾先后担任 ACM 信息系统(TOIS)、ACM 交互信息系统(TIIS)和信息处理与管理(IPM)编辑委员会的副主编,并多次在国际学术会议担任重要职务(如 2016 ACM CIKM 技术主席)。2019 年,司罗当选 ACM 2019 杰出科学家。
张正友,腾讯首席科学家、腾讯 AI Lab 及 Robotics X 实验室主任。1985 年本科毕业于浙江大学信息与电子工程系,于 1987 年在南锡第一大学(现洛林大学)获计算机科学硕士学位,并于 1990 年获巴黎第十一大学计算机科学博士学位。2021 年 1 月 8 日,张正友受聘腾讯历史上最高专业职级 ——17 级研究员 / 杰出科学家。
俞栋,腾讯 AI Lab 副主任,主要研究领域涵盖自动语音识别、语音处理和自然语言处理等,是将深度学习技术成功应用到语音识别领域的开创者之一。作为 100 多项专利的发明人及开源软件 CNTK 的发起人和早期主要开发者,俞栋发表了多篇引领性的论文,获得了 IEEE 信号处理协会 2013、 2016、2020 和 2022 年的最佳论文奖(表彰过去 6 年内发表的最佳期刊论文),2021 年 NAACL 最佳长文奖, 2022 年 IEEE 信号处理杂志最佳论文奖(表彰过去 10 年内发表的最佳论文),以及 2022 年 IEEE 信号处理杂志最佳专栏奖(表彰过去 10 年内发表的最佳专栏文章),谷歌学术引用量高达 5 万多次,h-index 超过 80。他提出的理论与模型已经广泛用于业界的语音识别和处理系统中。
代表成果:
腾讯公司的相关技术储备包括「混元」系列 AI 大模型、智能创作助手文涌(Effidit)等。
混元系列 AI 大模型来自腾讯广告多媒体 AI 团队,完整覆盖了 NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业 / 领域模型。去年,混元 AI 大模型团队推出了万亿级别中文 NLP 预训练模型 HunYuan-NLP-1T,该模型已落地于腾讯广告、搜索、对话等内部产品并通过腾讯云服务外部客户。
智能创作助手「文涌」为腾讯 AI Lab 出品,实现融合了知识抽取、文本理解、文本生成、大规模预训练模型、经典语言模型、搜索等技术,具有智能纠错、文本补全、文本润色等功能,部分功能的实现使用「混元」系列 AI 大模型作为底层预训练模型。
在 2 月 9 日对 ChatGPT 的相关回应中,腾讯公司表示:「目前,腾讯在相关方向上已有布局,专项研究也在有序推进。腾讯持续投入 AI 等前沿技术的研发,基于此前在 AI 大模型、机器学习算法以及 NLP 等领域的技术储备,将进一步开展前沿研究及应用探索。」
科大讯飞
科大讯飞在 NLP 方面同样有诸多研究积累。2005 年,科大讯飞研究院正式成立。2017 年 12 月 13 日,科技部批准依托科大讯飞股份有限公司建设认知智能国家重点实验室。这一实验室是科技部首批 20 家标杆全国重点实验室之一,多年来始终保持关键核心技术处于世界前沿水平,在去年曾获得 CommonsenseQA 2.0、OpenBookQA 等 12 项认知智能领域权威评测的第一。实验室瞄准国际认知智能技术的理论和技术发展前沿,面向国家重大战略需求和人工智能产业发展,以人机交互、智慧教育、智慧医疗、智慧司法等领域对认知智能技术的广泛和共性需求为牵引,重点开展语义计算、知识建模等认知智能基础理论及技术研究。
与此同时,科大讯飞面向认知智能领域陆续开源了 6 大类、超过 40 个通用领域的系列中文预训练语言模型,成为业界最广泛流行的中文预训练模型系列之一,在 GitHub 获 13346 颗星,位列中文预训练模型星标数第一。
2 月 8 日,科大讯飞在投资者互动平台回应称,ChatGPT 主要涉及到自然语言处理相关技术,属于认知智能领域的应用之一,公司在该方向技术和应用具备长期深厚的积累。科大讯飞 AI 学习机将成为该项技术率先落地的产品,将于今年 5 月 6 日进行产品级发布。
代表成员:
王仲远,快手技术副总裁、MMU&Y-tech 负责人。曾担任 Facebook 公司 Research Scientist,负责 Facebook 产品级 NLP Service。在 Facebook 之前,王仲远是微软亚洲研究院的主管研究员,负责微软研究院知识图谱项目和对话机器人项目。后任美团点评高级研究员、高级总监、搜索与 NLP 部负责人。2020 年 10 月,王仲远加盟快手,负责多媒体内容理解部。多年来专注于自然语言处理、知识图谱及其在文本理解方面的研究,在国际顶级学术会议如 VLDB、ICDE、IJCAI、CIKM 等发表论文数十篇。
田奇,计算机视觉、多媒体信息检索专家,IEEE Fellow。1992 年本科毕业于清华大学电子工程系,1996 年硕士毕业于美国德雷塞尔大学,后赴美国伊利诺伊大学香槟分校学习,师从 Thomas S. Huang 教授获博士学位。2002 年至 2019 年间,任美国德克萨斯大学圣安东尼奥分校计算机系助理教授、副教授和正教授。2018 年至 2020 年间,任华为诺亚方舟实验室计算视觉首席科学家。2020 年 3 月,加入华为云,任华为云人工智能领域首席科学家。
代表成果:
华为云盘古预训练大模型包括自然语言处理大模型、视觉大模型、多模态大模型、科学计算大模型、图网络大模型等多个系列大模型,可实现一个 AI 大模型在众多场景通用、泛化和规模化复制,减少对数据标注的依赖,让 AI 开发由作坊式转变为工业化开发的新模式。在预训练模型 微调的模式下,开发周期能够缩短到几天,甚至几个小时。
与 OpenAI GPT-3 相比,华为盘古 NLP(自然语言处理)同样达到千亿级参数量,并且,盘古 NLP 是全球最大的中文语言 AI 训练大模型。
浪潮信息
2021 年 9 月,浪潮发布参数量为 2457 亿的中文语言大模型」源 1.0」,比此前 OpenAI 发布的 GPT-3 大模型,参数量增加 40%,训练数据集提升 10 倍,」源 1.0」发布时即获得中文语言理解评测基准 CLUE 榜单的零样本和小样本学习两类总榜冠军。2022 年,浪潮深入推进「源 1.0」开源开放计划,持续加强开发者社区建设及行业应用落地,当前社区已经拥有超过 3000 名开发者,打造了「AI 剧本杀」、「 心理咨询 AI 陪练」、「AI 反诈」「金陵诗会」等爆款应用,推出了对话、问答、翻译、古文等技能大模型 (Skill Model)。浪潮信息基于「源」大模型驱动的企业」智能客服大脑」,荣获了《哈佛商业评论》新技术突破奖。
此外,大模型在巨量算力、海量数据和高效平台等方面的超高门槛,成为了当前 AI 领域众多初创企业、创新团队、大学或研究机构进行生成式 AI 研发创新方面的主要障碍。浪潮信息已推出相关 AI 算力服务,以加速国内 AIGC 创新步伐、赋力生成式 AI 产业创新的出发点。
非营利性研究机构
ChatGPT 的蹿红让其背后的研发公司 OpenAI 成为了 AI 界的当红炸子鸡。这家公司在 2015 年由一群科技领袖创办,包括山姆・阿尔特曼(Sam Altman)、彼得・泰尔(Peter Thiel)、里德・霍夫曼(Reid Hoffman)和埃隆・马斯克(Elon Musk)等,最初只是一家致力于学术研究的小型非营利性实验室。从反响平平的 GPT-1 到今天名声大噪的 ChatGPT,这家公司几度沉浮终见曙光。
在国内,我们同样能看到一批非营利性研究机构的诞生和蓬勃发展。
智源研究院
2018 年,北京智源人工智能研究院在科技部和北京市支持下,联合北京人工智能领域优势单位共建。成立三年多以来,智源研究院始终聚焦原始创新和核心技术,在北京建成全球最佳的人工智能创新生态,打造世界人工智能的「学术高地」。
代表成员:唐杰、刘知远等。
代表成果:
2021 年 3 月 20 日,智源研究院发布了我国首个超大规模智能模型系统「悟道」的第一阶段成果。「悟道」由智源研究院牵头,汇聚清华、北大、人大、中科院等高校院所,以及诸多企业的 100 余位 AI 领域专家共同研发,从基础性能、有效使用到预训练模型扩展,提出一系列创新解决方法,取得多项国际领先的 AI 技术突破和多个世界第一。
2021 年 6 月,智源研究院发布「悟道 2.0」巨模型,以 1.75 万亿的参数量成为当时全球规模最大的预训练模型。不仅如此,悟道团队还基于 GPT 与 BERT 各自在自然语言生成(NLG)和自然语言理解(NLU)任务上的优点,成功将两者融合并提出通用语言模型 GLM,将所有自然语言任务都化归为生成任务进行统一处理,GLM 也成为首个在 NLU、NLG、Seq2Seq、不定长填空等任务中全部登顶的语言模型。
鹏城实验室
鹏城实验室是中央批准成立的突破型、引领型、平台型一体化的网络通信领域新型科研机构。实验室拥有一支由院士专家、杰出领军人才、中青年骨干、博士生团队组成的多层次合理人才队伍,建成了以「鹏城云脑」「鹏城靶场」为代表的若干重大科技基础设施与平台,发布了「丝路」多语言机器翻译平台、「鹏程。盘古」中文预训练语言模型等一系列重大应用。
其中,网络智能研究部由高文院士领衔,拥有全球领先的智能算力大科学装置「鹏城云脑」,贯通云态智能计算软件体系,研制体系化网络智能集群开源软件栈,突破感知、评价、决策一体化的多维度协同与持续进化的云网协同智能等共性关键技术,支撑智能制造、物联网、工业云、人工智能等规模化产业应用。研究部设有云脑研究所、高效能云计算研究所、视觉智能研究所、云脑使能研究所。研究部人员构成多元化,现有全职、博士后、双聘、访问学者、联培博士生等 500 多人,团队成员均来自海内外知名高校。
代表成员:
高文,现任中国工程院院士、鹏城实验室主任,北京大学博雅讲席教授,新一代人工智能产业技术创新战略联盟理事长,全国专业标准化技术委员会副主任,数字音视频编解码技术标准 (AVS) 工作组组长,国际电气和电子工程师协会会士(IEEE Fellow)、美国计算机协会会士(ACM Fellow)。曾任第十届、十一届、十二届全国政协委员,国务院学科评议组计算机学科成员,中国计算机协会理事长,计算机学报主编;2013 年至 2018 年,在国家自然科学基金委员会工作,任自然科学基金委副主任。2018 年被聘为鹏城实验室主任。曾一次获得国家技术发明一等奖、一次获得国家技术发明二等奖、五次获得国家科技进步二等奖,获得「2005 中国十大教育英才」称号和中国计算机学会王选奖。主要从事人工智能应用和多媒体技术、计算机视觉、模式识别与图像处理、虚拟现实方面的研究,主要著作有《数字视频编码技术原理》、《Advanced Video Coding Systems》等。在本领域国际期刊上发表论文 200 余篇,国际会议论文 600 余篇。
IDEA 研究院认知计算与自然语言研究中心
粤港澳大湾区数字经济研究院(International Digital Economy Academy,简称「IDEA 研究院」)的使命为「推动人类 AI 技术发展,立足社会需求研发颠覆式创新技术,并回馈社会,让更多的人从数字经济发展中获益。」研究院实行理事会领导下的院长负责制,由沈向洋博士担任理事长,理事会成员包括:中国工程院院士、鹏城国家实验室主任高文,深圳市科技创新委员会主任梁永生,福田区委副书记、区长黄伟,香港科技大学首席副校长倪明选。
研究院目前已聚集一批包括院士、世界著名大学教授、世界知名开源系统发明人在内的国际一流技术专家,致力于在 AI 基础技术与开源系统、人工智能金融科技、区块链技术与机密计算、企业级 AI 系统、产业智能物联网与智能机器人等领域研发国际顶尖成果,并培育一批国际领先科技企业,带动深圳乃至大湾区万亿级数字经济产业发展。
IDEA 研究院认知计算与自然语言研究中心(CCNL,Cognitive Computing and Natural Language)致力于在预训练大模型时代建设认知智能的基础设施、推动 AI 学术和产业发展。目前,研究中心在预训练模型生产、少样本 / 零样本学习、受控文本生成、自动化机器学习等技术领域,都达到了领先水平。
代表成员:
沈向洋,IDEA 研究院创始人、理事长。沈向洋博士是美国国家工程院外籍院士和英国皇家工程院外籍院士,计算机科学与人工智能领域的世界级专家和全球科技产业领袖,在学术界、企业界、投资界拥有重要影响力。沈博士曾担任微软公司全球执行副总裁,主管微软全球研究院和人工智能产品线,并负责推动公司中长期总体技术战略及前瞻性研究与开发工作。他参与创建了微软亚洲研究院,担任院长兼首席科学家,培养了众多国际一流的计算机科学家、技术专家和企业家。
尤洋,潞晨科技董事长兼总裁,新加坡国立大学校长青年教授。尤洋是 UC Berkeley 博士,曾创造 ImageNet 和 BERT 训练速度世界纪录,获 IPDPS 和 ICPP 最佳论文,西贝尔奖学金,ACM-IEEE HPC Fellowship,Lotfi A. Zadeh Prize,ACM Doctoral Dissertation Award,福布斯 30 岁以下精英榜(亚洲),IEEE-CS 超算杰出新人奖。
小冰公司
小冰公司前身为微软(亚洲)互联网工程院人工智能小冰团队,是微软全球最大的人工智能独立产品研发团队。该团队于 2013 年 12 月在中国组建,2014 年 9 月扩展建立日本研发分部,团队分布于北京、苏州、东京等地,技术产品覆盖中国、日本及印度尼西亚等多个国家,商业客户覆盖全球范围。为加快小冰产品线的本土创新步伐,促进小冰商业生态环境的完善,2020 年 7 月 13 日,微软宣布将小冰分拆为独立公司运营。
作为微软全球首个以中国为总部的人工智能产品线,小冰经多年发展,已成为微软最有价值的人工智能技术框架之一。小冰框架以自然语言处理(NLP)为基础,持续推动完备迭代发展,目前是全球承载交互量最大的完备人工智能框架之一,技术覆盖自然语言处理、计算机语音、计算机视觉及人工智能内容生成。其中,在开放域对话、多模态交互、超级自然语音及内容生成领域居于全球领先。
代表成员:
李笛,2013 年加入微软,同年创立微软人工智能情感计算框架,于 2014 年推出微软小冰。小冰是目前全球范围内承载交互量最大的人工智能系统,占全球交互总量 60% 以上。2020 年 7 月,微软宣布将小冰分拆为独立公司运营,李笛担任小冰公司 CEO。
徐元春,小冰公司首席运营官、人工智能创造力实验室负责人,CCF 计算艺术分会执行委员,中国音像与数字出版协会音乐产业促进工作委员会专家委员会特聘专家,中国乐器协会未来音乐科技专业委员会委员。从 2017 年开始领导团队从事小冰在 AI 创造领域的技术研发、产品革新和应用落地。致力赋予 AI 拟合人类的创造能力,运用 AI 技术展开具有创造性的内容生成,并倡导通过 AI 技术解决高度定制化内容的供需矛盾。目前在文本、声音与视觉方面掌握全球领先的核心技术,拥有丰富的包括端到端的音乐创作(作词,作曲,编曲)、诗歌(现代诗,古诗)、绘画(西方油画,中国画)、艺术设计等创造模型,在 AI 创造领域不仅内容形态众多且质量稳定,并已形成完善的产品线,以及广泛的合作伙伴生态阵营。
思必驰
思必驰是国内专业的对话式人工智能平台公司,拥有全链路的智能语音语言技术,自主研发了新一代人机交互平台(DUI),和人工智能芯片(TH1520);为车联网、IoT及政务、金融等众多行业场景合作伙伴提供自然语言交互解决方案。截至2021年底,思必驰拥有各类已授权知识产权900余件,其中已授权专利近400项,软件著作权近300项。并拥有中英文综合语音技术。思必驰语音识别、声纹识别、口语对话系统等技术曾经多次在美国国家标准局、国际研究机构评测中夺得冠军。
思必驰被列入国家发改委「互联网 」重大工程和人工智能创新发展工程、工信部人工智能与实体经济深度融合创新项目、江苏省工业和信息产业转型升级项目、江苏省科技计划项目等,并累计参与40余项国家标准、行业标准制定。凭借雄厚的AI技术实力与广泛的产品业务落地,2020年,思必驰完成pre-IPO轮融资;2021年3月,思必驰完成股份制改造,正式更名为:思必驰科技股份有限公司。
代表成员:
俞凯,思必驰创始人、首席科学家、上海交大教授上海交通大学-苏州人工智能研究院执行院长。剑桥大学工程系博士,入选国家级人才工程、科技部中青年科技创新领军人才,国家自然科学基金委优青。中国计算机学会语音对话及听觉专业组副主任,中国人工智能产业发展联盟学术和知识产权组组长,中国语音产业联盟技术工作组副组长。2014年获得“吴文俊人工智能 科学技术奖”进步奖,2016年获评“科学中国人年度人 物”。IEEE高级会员,IEEE Speech and Language Processing Technical Committee委员。 在一流国际期刊和会议上发表论文 180 余篇,担任InterSpeech、ICMI等国际权威学术会议程序委员会主席,以及ACL、EMNLP、InterSpeech等国际会议的语音和对话技术领域主席,多次获得国际权威期刊和会议优秀论文奖,以及多个国际公开研究评测竞赛冠军。
面壁智能
面壁智能(ModelBest)是一家人工智能大模型加速与应用落地赋能公司。公司依托开源社区打造大规模预训练模型库与相关工具,加速百亿级以上大模型的训练、微调与推理,降低大模型使用门槛,并进一步推动大模型在人工智能典型场景与领域的应用与落地。
公司创始团队来自于清华大学计算机系自然语言处理与社会人文计算实验室,并由知名清华大学教授担任首席科学家。公司目前已完成百万级天使轮融资,并与知名机构与公司达成战略合作。
聆心智能
AIGC 初创企业聆心智能由清华大学黄民烈教授创立,成立于 2021 年 11 月,由清华大学计算机系孵化。团队核心成员均来自于清华大学、卡内基梅隆大学、谷歌等国内外顶尖高校及公司,具有丰富的商业化经验。聆心智能的核心人员是国内最早开展大模型底层技术的团队,在语言生成、对话生成方面具有独特的技术优势。
自成立以来,聆心智能致力于将最先进的人工智能技术应用到精神健康的数字诊疗服务上,通过建立先进的 AI 数字疗法体系,为临床患者和广大心理亚健康人群提供高质量、低成本、个性化、全天候的情绪支持、心理咨询和干预方案,为用户提供更科学、高效的精神健康服务。
作为 AI 心理赛道中自然语言处理基因领先的创业团队之一,聆心智能已开发了心理咨询及朋辈支持服务线上平台聆心悠然、AI 数字疗法软件聆忧,可为不同需求层次的用户提供服务。
代表成果:
基于生成式大模型,聆心智能打造了 Emohaa 情绪疗愈机器人,并与知名精神心理平台好心情达成合作,成功落地了国内首款人工智能心理陪伴数字人;与高端豪华电车品牌 Beyonca 合作,打造了新一代智能驾舱的贴心助手。
同时,聆心智能自研全球技术指标领先的中文对话大模型 OPD,在自动评测和人工评测中显著优于同类模型;去年 11 月,推出了首个超拟人 AI 产品 ---「AI 乌托邦」,该系统允许用户快速定制 AI 角色,只需要输入简单的角色描述,就可以生成相应人设的 AI ,与之进行深度对话和聊天。
相关文章
猜你喜欢