作者 | Tina、核子可乐
“我见过 10 多个数据库突然变成了向量数据库!”
“我预测每个数据库都会突然原生支持向量嵌入和向量搜索。”
“是的,兄弟,我的向量数据库初创公司刚刚结束了 A 轮融资。”
......
OpenAI 掀起的这波 AI 变革,让向量数据库越来越受关注。
AI 技术不断向前发展,一个核心驱动因素,就是背后的存储、处理和分析大量数据所需要的强大基础设施也在不断发生进步。这波“新基建”浪潮也催生出又一颗冉冉升起的新星——向量数据库,一种用于管理非结构化数据,包括数字形式的文本、音频、图像和视频的强大解决方案。
随着市场对 AI 基础设施需求的不断增加,向量数据库预计也将保持强劲的发展势头,并一步步成为未来 AI 技术愿景的重要基石。
新型数据库成就一批新富豪数据库领域经历过一系列发展阶段。最早的是 SQL 类关系数据库,其中所有数据都被纳入结构化的矩形表中。Web 2.0 企业的需求增长引发了 NoSQL 革命,数据库变得更加灵活,能够处理体量更大的数据。如今,随着市场为 AI 技术积极筹划,向量数据库的时代也终于来临。
与传统数据库不同,向量数据库特别擅长从非结构化数据中提取见解。这些数据库使用向量嵌入来表示数值型数据,并将其排列在彼此相似的一个个聚类当中,能够帮助用户使用相似对象查询数据库,从而轻松比较并找出最适合的匹配项。向量搜索的另一个优势就是这类查询延迟更低,特别适合生成式 AI 应用。
资料来源:GradientFlow.com
SeMI Technologies 公司 CEO Bob van Lujit解释了Weviate这样的厂商跟传统关系数据库供应商之间的区别。“这是我们第一次打造 AI 优先的基础设施,希望在数据科学成果跟市场业务需求之间架起桥梁。”
软件服务初创公司 Heltar 的创始人 Avyukt Aggarwal 也解释了向量数据库与生成式 AI 工具间的紧密联系。“每一场淘金热都不缺卖铲子的人。对于生成式 AI,这里的铲子是什么?就是向量数据库。几乎一切由大语言模型支持的应用程序都在用向量数据库,或者即将用上。大语言模型被集成到几乎所有主流应用当中,而提供一揽子托管向量数据库的厂商就是在挣淘金热当中卖铲子的钱。”
资料来源:Dhruv Anand 是谷歌前工程师,也是科技创新初创企业 AI Northstar tech 的创始人。
把向量数据库称为生成式 AI 的“铲子”并不为过。随着 AI 应用在企业生产部署中的快速普及,对高质量向量数据库的需求也重现了 SQL 在当年云黄金期的辉煌。
参考链接:
https://thenewstack.io/vector-databases-long-term-memory-for-artificial-intelligence/
https://twitter.com/GPTDAOCN/status/1658238286605975552
https://twitter.com/mattturck/status/1648825069177634820
https://github.com/codediodeio/rektor-db
https://www.youtube.com/watch?v=klTvEwg3oJ4
https://analyticsindiamag.com/why-are-investors-flocking-to-vector-databases/
https://www.relataly.com/vector-databases-the-rising-star-in-generative-ai-infrastructure/13599/
本文转载来源:
相关文章
猜你喜欢
成员 网址收录40387 企业收录2981 印章生成232037 电子证书1025 电子名片60 自媒体46877