首页 > 文档云仓 > 行业研究 | 企业研究 > 信息产业|互联网 > 中国数据库行业分析报告:向量启航,引擎加持

中国数据库行业分析报告:向量启航,引擎加持(45页).pdf
  长工   2022-10-26   23445 举报与投诉
 长工   2022-10-26  2.3万

【报告导读】本月报告中墨天轮发布了最新向量数据库全球产业图谱,国内典型向量数据库代表有Milvus 、Vearch、 TensorDB 、Om-iBASE等。向量数据库是专门为处理向量嵌入独特结构而构建的数据库系统。它们通过比较值 并找到彼此最相似的向量来索引向量,以便于搜索和检索。从技术角度来讲,向量数据库主要解决2个问题,一个 是高效的检索,另一个是高效的分析。向量数据库其实就像传统数据去处理一些关系型数据、结构化数据一样, 承担的是非结构化数据的低成本存储和高性能计算两大核心能力。具体包括用于搜索和检索的向量索引、单级过 滤、数据分片、复制、混合存储以及API功能。向量数据库主要的应用领域如人脸识别、推荐系统、图片搜索、 视频指纹、语音处理、自然语言处理、文件搜索等。随着 AI 技术的广泛应用,以及数据规模的不断增长,向量 检索也逐渐成了 AI 技术链路中不可或缺的一环,更是对传统搜索技术的补充,并且具备多模态搜索的能力

随着数据库软硬件技术的发展,经典的SQL计算引擎逐渐成为数据库系统的性能瓶颈,尤其是对于涉及到大量计 算的OLAP场景。如何充分发挥底层硬件的能力,提升数据库系统的性能,成为近年来数据库领域的热门研究方 向,而向量化执行就是解决上述问题的一种有效手段。火山模型的诞生为缓存数据库的内存压力,但该设计并未 充分利用CPU的执行效率且以往的火山模型一次处理一个元组的方式造成过大的解释执行代价,阻止了对性能影 响极大的编译优化。2005年《MonetDB/X100: Hyper-Pipelining Query Execution》的论文首次提出“向量 化引擎”的概念,后续国产数据库陆续推出向量化执行引擎,加速OLAP场景的查询分析速度


分享

格式

pdf

大小

1.49MB

青云豆

3

下载

收藏(114)

格式

pdf

大小

1.49MB

青云豆

3

下载
114
举报与投诉
确认提交
取消
维权须知

如果您觉得此文档侵犯了您的合法权利,请填写以上内容并提交。请您务必阅读并参照网站底部的“用户协议”、“隐私协议”中关于侵权问题的处理方法,积极维护您的权益,我们将尽快处理以维护您的合法权益。

温馨提示

您的青云豆余额不足,请充值后再下载!

去充值 ×

下载支付确认

中国数据库行业分析报告:向量启航,引擎加持.pdf

所需支付青云豆:3

确认支付
取消支付
分享
菜单 登录/注册