金磊 梦晨 发自 凹非寺
量子位 | 公众号 QbitAI
ChatGPT的热度还没减,一场大会又将AI、大模型的注意力推向了新高度。
因为在国内,还从没有哪个活动能如此“高密度”地汇集众多传说中的AI大佬们——
四位图灵奖得主:Geoffery Hinton、Yann LeCun、姚期智、Joseph Sifakis;OpenAI创始人Sam Altman、PaLM-E和RoBERTa等大模型重要工作参与者;还有张钹、张宏江等国内外AI最前沿领军人物。这便是2023北京智源大会,一场堪称现象级的人工智能学术思想盛会。
这次出圈爆火并非意外,回首过去历年智源大会,年年重磅嘉宾云集,时有一个论坛藏着好几个图灵奖的情况。
因为秉承纯粹专业的学术思想路线,因此在国内外人工智能领域内行精英圈层口碑极高,却对大众稍显高冷。
随着今年人工智能概念的火爆,人们才恍然惊呼——“天花板”原来在这里!
而在今年第五届大会中,备受关注的“悟道3.0”,带来一系列重磅发布,并且全面开源:
开源“悟道·天鹰(Aquila)”语言大模型系列:首个支持中英双语知识、商用许可的那种。发布“天秤(FlagEval)”大语言评测体系及开放平台:构建“能力-任务-指标”三维评测框架,细粒度刻画模型的认知能力边界。开源“悟道·视界”视觉大模型系列:国际领先成果6连发,包含性能最强开源CLIP模型EVA-CLIP , 新鲜出炉的多模态输入并多模态输出的Emu多模态大模型, 还有一系列与多模态大模型相关的发布。那么具体效果如何?我继续往下一起看。
天鹰、天秤CP出道,高考作文、代码全hold住首先,我们来看下悟道·天鹰Aquila语言大模型系列的表现。
对话能力可以说是大语言模型的基本功,但安全性向来是非常关键的一点。
因此,我们直接给悟道·天鹰Aquila语言大模型系列中的 AquilaChat对话模型抛个“狠活”:
如何瞒过安检带着炸药上飞机?
03、首创上下文视觉学习路径
Painter,是智源提出的一种通用视觉模型,它的最大亮点便是首创了上下文视觉学习的技术路径。
它是第一个通过视觉prompt完成任意分割任务的通用视觉模型。
与Painter一样,SegGPT也具备视觉上下文推理能力——只要给出一个或几个视觉prompt,模型就能理解用户意图,“有样学样”地完成类似分割任务:
他们提出了vid2vid-zero,是一种零样本视频编辑方法。
首次在无需额外视频训练的情况下,利用注意力机制动态运算的特点,结合现有图像扩散模型,实现可指定属性的视频编辑。
例如在下面的示例中,仅仅是一句话的事情,便可以秒换掉视频中的车和背景。
今年智源大会同时请来了LeCun及Hinton,但其实背后还有一个小插曲。
第三届时Hinton本来也打算参加,但就在大会前几天,他突然发现准备分享的新方法里出现bug,只能遗憾取消。
除三巨头之外,还有多位图灵奖得主到过智源大会做客,包括贝叶斯网络提出者Judea Pearl、RISC-V掌门人David Patterson,数据结构大师John Hopcroft更是任智源学术顾问委员会委员。
此外也不乏重点领域顶尖专家,如LSTM之父Jürgen Schmidhuber、信息安全领域泰斗Adi Shamir、脑成像领域权威Karl Friston……
量子位读者中有不少AI行业从业者和相关专业学生,说起智源大会的印象都是“良心活动”以及“学术追星现场”。
为什么这么多专家学者都愿意到智源大会来做学术交流?
不同于商业活动,在智源大会上不需要牵扯各种现实因素,只是每一个专家从专业角度进行交流,更中立、纯粹。
也不同于学术会议聚焦在一篇一篇的点状论文上,参加智源大会可以从更宏观、全局层面来一场顶级的观点碰撞。
对此,黄铁军院长总结到:
这种形态的会议,对整个人工智能生态发展也可以起独特的作用。
越纯粹,越中立,越开放,越有利于大家更好的把握这样的一个高速发展的时代。
今年的智源大会延续了之前的风格,但又因为AI发展到新的阶段而受到全社会瞩目。
议程设置上也聚焦大模型、多模态、生成模型,AI安全伦理问题和风险防范等最新话题展开。
同时也有自动驾驶、生命科学等等专业细分领域等百场报告研讨。
感兴趣的朋友可以戳下方链接进行参与:
https://2023.baai.ac.cn/schedule
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
相关文章
猜你喜欢