衡宇 克雷西 发自 凹非寺
量子位 | 公众号 QbitAI
在OpenAI祭出GPT-4的API和“最强插件”代码解释器后,竞争对手显然坐不住了。
就在刚刚,Anthropic旗下Claude发布第二代——没错,就是被外界评价为GPT-4最强竞品的那一个。
浅划一下这次更新动作的重点:
免费,不用排队,自己用邮箱注册即可登陆。
科技大佬们打起来真是妙啊,妈妈再也不用担心CHATGPT/GPT-4将我拒之门外后,打工或写作业时没有AI用了!
国内AI博主海辛也在微博上惊讶连连。
因为上传自己的简历后,Claude2分析出了她的MBTI人格:
看到Claude2一本正经地回答弱智吧问题,就会发现AI还是太单纯了,看不出人类的小心机。
不过正经地看,这些回答倒也没毛病。
上面的两个问题算Claude2顺利过关,那么如果提问一些更无厘头的问题呢?
问,玉皇大帝到底住在九重天的哪一层?
答,从立足点来看,玉皇大帝所在的天庭,应该处于平流层,因为“这更符合天庭圣洁的定位”。
当然,没有人能评判这个回答到底对还是错,但至少Claude2的这一通分析,还算有理有据。
开胃小菜就展示到这里,下面上正餐!
长文档是本次更新的一大亮点,这一点已经被推特网友们惊呼鹅妹子嘤了。
比如上传两个pdf,可以看到,Claude2可以从两个pdf文档中做出摘要,这两个文档一个关于“语言流变模式”,一个关于“对称性”,并且将文档内容分点列在对话框中:
举个例子说明一下它的算法:
假如明文是B,密钥是C,B是字母表中第二个,那么从C开始数的第二个字母D就是密文。
如果数到了Z,就重新从A开始接着数,密钥长度不足时则进行循环。
解密自然就是把加密过程倒过来。
Claude输出了这样的代码(C ,下同):
这里面既有GPT-3首席工程师Tom Brown,也有OpenAI安全和政策副总裁Daniela Amodei(Dario的姐姐),可以说是带走了相当一批核心人才。
出走成立新公司的原因之一,自然是对OpenAI现状并不满意。
从前几年开始,微软频频给OpenAI注资,随后又要求他们使用Azure超算来搞研究,而且将技术授权给微软,甚至为微软自己的投资活动筹集资金。
这与OpenAI创立的初衷相悖,一批员工便想到了离职创业。
当然,还有一部分原因是这群人想做能控制、可解释的AI,说白了就是先搞明白AI模型背后的原理,从而在提供工具的同时设计更多可解释的AI模型。
于是,在OpenAI彻底变成“微软揽钱机器”后,他们便从这家公司离开,创办了Anthropic。
不仅如此,公司核心技术Constitution AI也备受瞩目。
它主要围绕“语言模型如何决定它将涉及哪些问题以及它认为哪些问题不合适?为什么它会鼓励一些行动而阻止另一些行动?语言模型可能具有哪些价值?”展开。
为了解决上述问题,它让AI尽可能遵循很多原则。
原则条目有很多,包括联合国宣言、Anthropic从研究中自己发现的原则,DeepMind在Sparrow研究中提出的原则,甚至还借鉴了苹果的服务条款。
并且是通过AI反馈的方式,来评估输出,应对目前AI的缺点。具体体现在AI训练过程中,分为两个阶段:
第一阶段,模型被训练使用一套原则和一些过程的例子,来评估和修改自己的反应;
第二阶段,模型通过强化学习进行训练,使用基于原则集的AI生成的反馈来选择和输出更无害的内容。
这一点与ChatGPT的的杀手锏RLHF(人类反馈强化学习)大相径庭,而Anthropic给出的解释是:
基于Constitution AI的强化学习,比从RLHF中强化学习得出的生成内容,更有用,且更无害。并且,还更容易规模化。
在这套Constitution AI,迭代到2.0的Claude,确实在导入文件、上下文窗口理解等功能方面,比GPT-4更引人注目。
不过也不是完美的,比如GRE考试成绩上,Claude2就5局3败,输给了GPT-4。
但不可否认,巨佬们在AI方面你追我赶的局面,让本普通用户切切实实感受了一波渔翁得利的快乐,嘻嘻嘻(狗头)。
速来自己肉测:
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
相关文章
猜你喜欢