赞
踩
在Milvus,collection、cluster和entities这几个术语有特定的含义:
Collection:
pk
(标识每个实体的唯一标识符)、一个双精度浮点数字段random
以及一个浮点数向量字段embeddings
。Entities:
pk
、一个random
值和一个8维的embeddings
向量组成。这些entities被插入到"hello_milvus" collection中。Cluster:
总结来说,在Milvus中,collection是存储数据的容器,entities是collection中的数据项,而cluster指的是多个Milvus实例组成的集群环境。
二选一
单机安装(非集群):https://milvus.io/docs/v2.2.x/install_standalone-docker.md
wget https://github.com/milvus-io/milvus/releases/download/v2.2.16/milvus-standalone-docker-compose.yml -O docker-compose.yml
sudo docker-compose up -d
pip install milvus
启动
milvus-server
提示:使用Linux(WSL)跑lite版本比Windows平台更稳定。
实验平台:WSL
Pymilvus和Milvus Server版本对应关系
https://milvus.io/api-reference/pymilvus/v2.2.x/About.md
引入pymilvus
from pymilvus import (
connections,
utility,
FieldSchema, CollectionSchema, DataType,
Collection,
)
connections
connect
)、断开连接(disconnect
)和获取当前连接状态(如get_connection
)等功能。它允许你指定Milvus服务器的地址和端口,以便与之建立连接。utility
has_collection
)、列出所有collections(list_collections
)、删除collection(drop_collection
)、获取collection的信息和状态等辅助功能。FieldSchema
INT64
、FLOAT
、FLOAT_VECTOR
等)、是否为主键、自动生成ID等。这是定义collection结构的基础部分。CollectionSchema
FieldSchema
,创建一个完整的collection模式。这包括collection中的所有字段和它们的数据类型,以及collection的描述信息。DataType
FLOAT
、INT64
、VARCHAR
和FLOAT_VECTOR
等,用于在定义FieldSchema
时指定字段的数据类型。Collection
连接服务器
connections.connect("default", host="127.0.0.1", port="19530")
判断名为hello_milvus的collection是否存在
utility.has_collection("hello_milvus")
创建一个collection schema
fields = [
FieldSchema(name="pk", dtype=DataType.VARCHAR, is_primary=True, auto_id=False, max_length=100),
FieldSchema(name="random", dtype=DataType.DOUBLE),
FieldSchema(name="embeddings", dtype=DataType.FLOAT_VECTOR, dim=dim)
]
schema = CollectionSchema(fields, "hello_milvus is the simplest demo to introduce the APIs")
使用collection schema创建collection
hello_milvus = Collection("hello_milvus", schema, consistency_level="Strong")
同时,也可以使用Collection函数选中已有的collection
collection = Collection("hello_milvus")
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。