梦晨 衡宇 发自 凹非寺量子位 | 公众号 QbitAI
高端GPU持续缺货之下,一家要挑战英伟达的芯片初创公司成为行业热议焦点。
8枚芯片跑大模型,就能支持5万亿参数(GPT-4的三倍) 。
这是独角兽企业Sambanova刚刚发布的新型AI芯片SN40L——
型号中40代表是他们第四代产品,L代表专为大模型(LLM)优化:高达1.5T的内存,支持25.6万个token的序列长度。
CEO Rodrigo Liang表示,当前行业标准做法下运行万亿参数大模型需要数百枚芯片,我们的方法使总拥有成本只有标准方法的1/25。
SambaNova目前估值50亿美元(约365亿人民币),累计完成了6轮总计11亿美元的融资,投资方包括英特尔、软银、三星、GV等。
这一策略与GPT-4和谷歌Gemini等做法形成鲜明对比,巨头大多希望创建一个能泛化到数百万个任务的巨型模型。
分析师认为技术上可能谷歌的做法性能更强,但SambaNova的方法对企业来说更实用。
没有任何一个模型或人能完整访问企业的所有数据,限制每个部门能访问的专家模型,就能限制他们能访问的数据。
斯坦福系芯片公司,华人工程师主力SambaNova成立于2017年,2020年之前都比较低调。
联创3人都是斯坦福背景,连产品系列名Cardinal(深红色)都是斯坦福的昵称与代表颜色。
CEO Rodrigo Liang是前Sun/甲骨文工程副总裁,也有人将这个名字解读为暗指甲骨文老对头IBM的DeepBlue(深蓝)。
另外两位联合创始人都是斯坦福教授。
CTO Kunle Olukotun是电气工程教授,因多核芯片架构方面的研究而闻名,开发了首批支持线程级推测 (TLS) 的芯片之一。
Christopher Ré是计算机科学副教授,重点研究方向机器学习和数据分析的速度和可扩展性。
此外团队中还有不少华人工程师。
从官网公开信息来看,SambaNova的领导团队中,至少有3名华人。
Jonathan Chang,拥有UC伯克利的机械工程学士学位以及南加州大学的MBA学位。
他在构建高增长方面拥有20多年的经验。加入SambaNova之前,Chang在特斯拉工作了近9年。
Marshall Choy,此前曾担任甲骨文公司系统产品管理和解决方案开发副总裁,监督了数十个行业的企业硬件和软件产品的上市。
Penny Li,在EDA工具和微处理器设计方面拥有超过27年的经验。此前,她曾在IBM和甲骨文工作过。
如果去领英搜索还能发现更多华人团队成员。
目前SambaNova包含SN40L芯片的人工智能引擎已上市,但定价没有公开。
根据Rodrigo Liang的说法,8个SN40L组成的集群总共可处理5万亿参数,相当于70个700亿参数大模型。
全球2000强的企业只需购买两个这样的8芯片集群,就能满足所有大模型需求。
参考链接:[1]https://spectrum.ieee.org/ai-chip-sambanova[2]https://www.nextplatform.com/2023/09/20/sambanova-tackles-generative-ai-with-new-chip-and-new-approach/[3]https://sambanova.ai/resources/
相关文章
猜你喜欢