Skip to content

Latest commit

 

History

History
677 lines (608 loc) · 62.4 KB

README_CN.md

File metadata and controls

677 lines (608 loc) · 62.4 KB

Milvus banner

欢迎来到 Milvus

Milvus 是什么

Milvus 是一款全球领先的开源向量数据库,赋能 AI 应用和向量相似度搜索,加速非结构化数据检索。用户在任何部署环境中均可获得始终如一的用户体验。

Milvus 2.0 是一款云原生向量数据库,采用存储与计算分离的架构设计。该重构版本的所有组件均为无状态组件,极大地增强了系统弹性和灵活性。更多系统架构细节,参考 Milvus 系统架构

Milvus 基于 Apache 2.0 License 协议发布,于 2019 年 10 月正式开源,是 LF AI & Data 基金会 的毕业项目。

产品亮点

针对万亿级向量的毫秒级搜索 完成万亿条向量数据搜索的平均延迟以毫秒计。
简化的非结构化数据管理
  • 一整套专为数据科学工作流设计的 API。
  • 无论是笔记本、本地集群还是云服务器,始终如一的跨平台用户体验。
  • 可以在任何场景下实现实时搜索与分析。
  • 稳定可靠的用户体验 Milvus 具有故障转移和故障恢复的机制,即使服务中断,也能确保数据和应用的业务连续性。
    高度可扩展,弹性伸缩 组件级别的高扩展性,支持精准扩展。
    混合查询 Milvus 2.4 引入了多向量支持和混合查询框架,用户可以将多个向量字段(最多 10 个)导入到单个 Collection 中。这些来自不同的嵌入模型或经过不同的处理方法处理的向量分别代表了不同的数据特征。混合搜索的结果使用 reranking 策略对各向量列的结果进行融合,如 Reciprocal Rank Fusion (RRF) 和 Weighted Scoring。

    该特性尤其适用于综合搜索场景,如基于多种属性(如照片、声音、指纹等)识别向量库中最相似的人。有关更多信息,请参阅 混合搜索

    基于 Lambda 架构的流批一体式数据存储 Milvus 在存储数据时支持流处理和批处理两种方式,兼顾了流处理的时效性和批处理的效率。统一的对外接口使得向量相似度查询更为便捷。
    广受社区支持和业界认可 Milvus 项目在 GitHub 上获星超 8000,拥有逾 1000 家企业用户,还有活跃的开源社区。Milvus 由 LF AI & Data 基金会 背书,是该基金会的毕业项目。

    快速开始

    启动 Milvus

    源码编译 Milvus

    请先安装相关依赖。

    go: 1.21
    cmake: >=3.18
    gcc: 7.5
    protobuf: >=3.7
    

    克隆 Milvus 项目并编译。

    # 克隆项目
    $ git clone https://github.com/milvus-io/milvus.git
    
    # 安装第三方依赖
    $ cd milvus/
    $ ./scripts/install_deps.sh
    
    # 编译 Milvus 单机版
    $ make milvus

    获取更多内容,请阅读 开发者文档

    注意 主分支用于 Milvus v2.0 代码开发。Milvus v1.0 于 2021 年 3 月 9 日发布,是 Milvus 的首个长期支持(LTS)版本。如需使用 Milvus 1.0,请切换至 1.0 分支

    Milvus 2.0:功能增加、性能升级

    详见 Milvus 2.0 vs. 1.x

    入门指南

    教程

    你可以从教程概述中,找到涵盖 RAG(检索增强生成)、语义搜索、混合搜索、问答、推荐系统等主题以及各种快速入门指南。这些资源旨在帮助你快速高效地入门。

    教程 使用场景 相关 Milvus 功能
    使用 Milvus 构建 RAG RAG 向量搜索
    使用 Milvus 构建多模态 RAG RAG 向量搜索, 动态字段
    使用 Milvus 进行图像搜索 语义搜索 向量搜索, 动态字段
    使用 Milvus 进行混合搜索 混合搜索 混合搜索, 多向量, 密集嵌入, 稀疏嵌入
    使用多向量实现多模态搜索 语义搜索 多向量, 混合搜索
    问答系统 问答系统 向量搜索
    推荐系统 推荐系统 向量搜索
    视频相似性搜索 语义搜索 向量搜索
    音频相似性搜索 语义搜索 向量搜索
    DNA 分类 分类 向量搜索
    文本搜索引擎 语义搜索 向量搜索
    通过文本搜索图像 语义搜索 向量搜索
    图像去重 重复数据删除 向量搜索
    使用 Milvus 构建图形 RAG RAG 图搜索
    使用 Milvus 进行上下文检索 快速入门 向量搜索
    使用 Milvus 进行 HDBSCAN 聚类 快速入门 向量搜索
    使用 ColPali 实现多模态检索 快速入门 向量搜索
    向量可视化 快速入门 向量搜索
    基于 Milvus 的电影推荐 推荐系统 向量搜索
    使用 Matryoshka 嵌入进行漏斗搜索 快速入门 向量搜索

    应用场景

    以图搜图系统 智能问答机器人 分子式检索系统

    以图搜图系统

    从海量图片中快速检索最相似图片。

    智能问答机器人

    交互式智能问答机器人帮助用户节省时间和用人成本。

    分子式检索系统

    迅速检索相似化学分子式。

    训练营

    Milvus 训练营能够帮助你了解向量数据库的操作及各种应用场景。通过 Milvus 训练营探索如何进行 Milvus 性能测评,搭建智能问答机器人、推荐系统、以图搜图系统、分子式检索系统等。

    贡献代码

    欢迎向 Milvus 社区贡献你的代码。代码贡献流程或提交补丁等相关信息详见 代码贡献准则。参考 社区仓库 了解社区管理准则并获取更多社区资源。

    All contributors




    Milvus 文档

    获取更多有关安装、开发、部署和管理的指南,请查看 Milvus 文档.

    SDK

    Attu

    Attu 提供了好用的图形化界面,帮助您更好的管理数据和Milvus.

    社区

    欢迎加入 Slack 频道分享你的建议与问题。你也可以通过 FAQ 页面,查看常见问题及解答。

    订阅 Milvus 邮件:

    关注 Milvus 社交媒体:

    Wechat QR Code

    加入我们

    Zilliz 是 Milvus 项目的幕后公司。我们正在 招聘 算法、开发和全栈工程师。欢迎加入我们,让我们携手构建下一代的开源数据基础软件。

    引用

    如需在研究论文中使用 Milvus,欢迎添加以下引用:

    @inproceedings{2021milvus,
      title={Milvus: A Purpose-Built Vector Data Management System},
      author={Wang, Jianguo and Yi, Xiaomeng and Guo, Rentong and Jin, Hai and Xu, Peng and Li, Shengjun and Wang, Xiangyu and Guo, Xiangzhou and Li, Chengming and Xu, Xiaohai and others},
      booktitle={Proceedings of the 2021 International Conference on Management of Data},
      pages={2614--2627},
      year={2021}
    }
    

    特别感谢

    Milvus 采用了以下依赖库:

    • 感谢 FAISS 相似性检索库。
    • 感谢开源键值存储 etcd
    • 感谢分布式信息发布/订阅平台 Pulsar
    • 感谢存储引擎 RocksDB