周二,Meta 发布了最新一代的开源大语言模型 Llama 2。
与 Meta 在 2 月发布的第一代大模型 Llama 1 相比,Llama 2 在许多方面得到提升,比如训练数据比 Llama 1 多了 40%、训练所用的 token 翻了一倍,增加至 2 万亿、上下文长度限制也翻了一倍……总而言之,就是 Llama 变得更强了。
不过,使整个行业震惊的不是 Llama 2 的强大——当然,它足够强——而是 Meta 宣布 Llama 2 对研究和商用都是免费。
开源的基本概念
所谓“开源”,即开放源代码,也称源代码公开,是软件的一种散布形式,而开源软件即公开源代码的软件。
*Windows3.0
但闭源软件开发模式带来了一系列问题,比如软件费用高、安全漏洞多、新旧版支持问题、不符合个人需求等等,一部分软件开发者对其不满意,于是兴起了“开放源代码运动”。
开放源代码运动的支持者认为不阻碍合作、可共享的研究风气才是软件开发应有的路径,反对把软件建立在知识产权与许可证的基础之上,认为这样限制了他人利用源代码修改、调整软件以适应自身的需要,阻碍了软件的进一步完善和发展,导致软件安全性下降、创新减少、不兼容等问题。
随着开放源代码运动的进行,产生了许多实际性成果。
Richard M.Stallman 于 1985 年创立了自由软件基金会,并开启了 GUN 项目,后者是一个自由的操作系统,其内容软件完全以 GPL 的方式发布。
1999 年,Eric S.Raymond 出版了著作《大教堂与市集》,该书讲述了黑客文化史、Linux的开发过程、以及作者本人主持开发的开放源代码软件 Fetchmail 的经历,并讨论了软件开发的方法论。《大教堂与市集》成为开放源代码活动的圣经。
开源的意义
在前面提到了,开放源代码运动旨在追求不阻碍合作、可共享的软件开发路径,并认为开放源代码更有利于提高软件的安全性、创新性和兼容性,这是开放源代码最直接的意义。
开源的缺点
在前面,老狐介绍的都是开源的优点,事实上,开源的缺点某种程度上也是其优点带来的,体现了一个事物的两面性。
首先是开源项目参与人数众多,且自发进行,这必然造成管理困难,需要项目领导者付出更多精力去整合项目,做好决策。
例如 80 年代与比尔·盖茨齐名的技术天才米切尔·卡普尔曾出资几百万美元启动一个名为 Chandler 的开源项目,旨在开发一个个人信息管理软件,但因为项目管理混乱,开发人员更迭,项目最后失败。
*米切尔·卡普尔
其次,开源项目迭代频繁,不断有新版本被开发出来,这需要软件用户不断安装新版本,这给用户带来了更高的使用成本。
最后则是开源软件未来的不确定性,因为其成员来自不同的人,软件的质量和未来发展都没法得到保证,一款软件用户正用着可能就没下文了。
以上开源的三个缺点恰好是闭源的商业软件的优势,以 Windows 为例,微软有专业团队负责开发,后期有稳定的更新和维护,能给用户减少许多的麻烦。
*纳德拉和扎克伯格
开源社区 Hugging Face 伴随着 AI 的兴起,成为了开源社区的顶流,如今 Hugging Face 上有超过 25 万个模型,包括 Meta 的 Llama 2、国内王小川创立的百川智能的大语言模型“百川”。
*Hugging Face上的大模型
现在回到文章开头的话题上来,小伙伴们认为 Llama 能通过开源的方式,击败闭源的 ChatGPT 和 Bard 么?
虽然结果老狐也无法预测,但非常乐意见到这样的竞争,这是一场技术落后者借助群众力量与技术领先者的竞争,也是开源的理想主义者与闭源的现实主义者的竞争,结果会怎样呢?
答案在时间里。
参考资料
财联社:Meta 发布 Llama 2 模型 与微软、高通展开合作
晚点 LastPost:Llama 2 发布,一夜之间,大模型竞争来到新起点
维基百科:“开放源代码”
石娟:开放源代码及相关知识产权法理刍论[D].重庆:西南政法大学,2007.
远川研究所:差一步称霸AI:历史进程中的扎克伯格
Web3 天空之城:杨立昆最新访谈:AI 威胁论是蒙昧主义,控制欲只有人才有
维基百科:《Dreaming in code》
虎嗅:Github 50 亿美元把自己卖了,为什么是微软呢?
极客公园:为了中国市场,Hugging Face 甚至玩上了小红书
编辑:木易
相关文章
猜你喜欢