保姆级教程：用Python 3.6和pymilvus 1.1.0搞定Milvus向量数据库的增删改查

张开发

• 2026/4/15 6:28:10 • 15 分钟阅读

分享文章

保姆级教程：用Python 3.6和pymilvus 1.1.0搞定Milvus向量数据库的增删改查

Python 3.6与Milvus向量数据库实战从零开始构建AI应用在人工智能和机器学习领域向量数据库正成为处理高维数据的核心工具。Milvus作为一款开源的向量数据库因其高效的相似性搜索能力而备受开发者青睐。本文将带你从零开始使用Python 3.6和pymilvus 1.1.0版本一步步掌握Milvus的核心操作。1. 环境准备与安装在开始之前我们需要确保开发环境配置正确。Python 3.6是一个稳定的版本与pymilvus 1.1.0兼容性良好。以下是具体步骤首先创建一个干净的Python虚拟环境python3.6 -m venv milvus_env source milvus_env/bin/activate # Linux/macOS milvus_env\Scripts\activate # Windows接下来安装pymilvus 1.1.0使用清华镜像源加速安装过程pip install pymilvus1.1.0 -i https://pypi.tuna.tsinghua.edu.cn/simple验证安装是否成功import pymilvus print(pymilvus.__version__) # 应该输出1.1.0注意确保你的Milvus服务已经启动并运行。可以通过Docker快速启动一个测试实例docker run -d --name milvus_cpu -p 19530:19530 milvusdb/milvus:1.1.0-cpu-d030521-1ea92e2. 连接Milvus与集合管理成功安装后第一步是建立与Milvus服务的连接。以下是连接和集合管理的最佳实践from pymilvus import Milvus, MetricType, Status # 建立连接 milvus Milvus(hostlocalhost, port19530) # 检查连接状态 status milvus.server_status() print(fServer status: {status}) # 创建集合参数配置 collection_params { collection_name: image_features, dimension: 512, # 向量维度 index_file_size: 1024, # 索引文件大小(MB) metric_type: MetricType.L2 # 使用L2距离度量 } # 创建集合 status milvus.create_collection(collection_params) if status.code Status.SUCCESS: print(集合创建成功) else: print(f集合创建失败: {status.message})集合创建后我们可以进行一些基本操作检查集合是否存在status, exists milvus.has_collection(image_features) print(f集合存在: {exists})获取集合信息status, info milvus.get_collection_stats(image_features) print(f集合统计信息: {info})删除集合status milvus.drop_collection(image_features)3. 向量数据操作全流程向量数据库的核心功能是对向量数据的增删改查。下面我们详细讲解每个环节。3.1 向量插入假设我们有一组从图像提取的512维特征向量需要插入到Milvus中import numpy as np # 生成100条随机512维向量作为示例数据 vectors np.random.rand(100, 512).tolist() # 插入向量 status, ids milvus.insert( collection_nameimage_features, recordsvectors ) if status.code Status.SUCCESS: print(f成功插入{len(ids)}条向量) print(f前5个ID: {ids[:5]}) else: print(f插入失败: {status.message}) # 确保数据持久化 milvus.flush([image_features])3.2 向量查询与搜索Milvus最强大的功能是相似性搜索。以下是基本搜索操作# 创建一个查询向量 query_vector np.random.rand(1, 512).tolist() # 执行搜索 search_params { nprobe: 16 # 搜索参数控制搜索精度和性能的平衡 } status, results milvus.search( collection_nameimage_features, query_recordsquery_vector, top_k5, # 返回最相似的5个结果 paramssearch_params ) if status.code Status.SUCCESS: print(搜索结果:) for i, (id, distance) in enumerate(zip(results.id_array[0], results.distance_array[0])): print(f{i1}. ID: {id}, 距离: {distance:.4f})3.3 向量删除与统计管理向量数据还包括删除和统计功能# 删除指定ID的向量 ids_to_delete [1, 2, 3] # 假设要删除的ID列表 status milvus.delete_entity_by_id(image_features, ids_to_delete) milvus.flush([image_features]) # 确保删除操作持久化 # 统计集合中的向量数量 status, count milvus.count_entities(image_features) print(f当前集合中的向量数量: {count})4. 索引构建与性能优化为了提升搜索效率我们需要为集合创建适当的索引# 定义索引参数 index_params { index_type: IVF_FLAT, # 倒排文件索引 params: {nlist: 128}, # 聚类中心数量 metric_type: MetricType.L2 # 与集合创建时一致 } # 创建索引 status milvus.create_index(image_features, index_params) if status.code Status.SUCCESS: print(索引创建成功) else: print(f索引创建失败: {status.message}) # 获取索引信息 status, index_info milvus.describe_index(image_features) print(f索引信息: {index_info})索引创建后搜索性能会显著提升。我们可以比较索引前后的搜索速度import time # 无索引搜索 start time.time() milvus.search(image_features, query_vector, top_k5) no_index_time time.time() - start # 有索引搜索 start time.time() milvus.search(image_features, query_vector, top_k5) with_index_time time.time() - start print(f无索引搜索时间: {no_index_time:.4f}s) print(f有索引搜索时间: {with_index_time:.4f}s) print(f性能提升: {(no_index_time/with_index_time):.1f}倍)5. 实战构建一个完整的图像搜索系统现在我们将前面学到的知识整合起来构建一个简单的图像特征搜索系统class MilvusImageSearch: def __init__(self, hostlocalhost, port19530): self.milvus Milvus(hosthost, portport) self.collection_name image_features def setup_collection(self, dimension512): # 检查并删除已存在的集合 status, exists self.milvus.has_collection(self.collection_name) if exists: self.milvus.drop_collection(self.collection_name) # 创建新集合 params { collection_name: self.collection_name, dimension: dimension, index_file_size: 1024, metric_type: MetricType.L2 } status self.milvus.create_collection(params) return status def insert_features(self, features): 插入图像特征向量 if not isinstance(features, list): features [features] status, ids self.milvus.insert( collection_nameself.collection_name, recordsfeatures ) if status.code Status.SUCCESS: self.milvus.flush([self.collection_name]) return ids else: raise Exception(f插入失败: {status.message}) def search_similar(self, query_feature, top_k5): 搜索相似图像 search_params {nprobe: 16} status, results self.milvus.search( collection_nameself.collection_name, query_records[query_feature], top_ktop_k, paramssearch_params ) if status.code Status.SUCCESS: return list(zip(results.id_array[0], results.distance_array[0])) else: raise Exception(f搜索失败: {status.message}) def create_index(self): 创建索引优化搜索性能 index_params { index_type: IVF_FLAT, params: {nlist: 128}, metric_type: MetricType.L2 } return self.milvus.create_index(self.collection_name, index_params) def close(self): 关闭连接 self.milvus.close()使用这个类可以轻松管理图像特征# 初始化系统 search_system MilvusImageSearch() # 设置集合 search_system.setup_collection(dimension512) # 模拟插入一些图像特征 features np.random.rand(10, 512).tolist() # 10张图像的512维特征 ids search_system.insert_features(features) print(f插入的特征ID: {ids}) # 创建索引 search_system.create_index() # 搜索相似图像 query_feature np.random.rand(1, 512).tolist()[0] # 随机查询特征 similar_images search_system.search_similar(query_feature, top_k3) print(最相似的3张图像:) for img_id, distance in similar_images: print(fID: {img_id}, 相似度: {1/(1distance):.2%}) # 将距离转换为相似度百分比 # 关闭连接 search_system.close()6. 常见问题与调试技巧在实际使用Milvus时可能会遇到各种问题。以下是一些常见问题的解决方法连接问题排查表问题现象可能原因解决方案连接超时Milvus服务未启动检查服务状态docker ps或systemctl status milvus认证失败配置了错误的用户名/密码检查连接参数确保与服务器配置一致端口不可达防火墙阻止了端口检查19530端口是否开放telnet host 19530性能优化建议批量插入数据时建议每次插入1000-5000条向量而不是单条插入根据数据量调整nlist参数数据量越大nlist值应该越大搜索时合理设置nprobe参数平衡精度和性能错误处理最佳实践try: status, results milvus.search( collection_nameimage_features, query_records[query_vector], top_k5 ) if status.code ! Status.SUCCESS: raise Exception(f搜索失败: {status.message}) # 处理搜索结果 for id, distance in zip(results.id_array[0], results.distance_array[0]): print(fID: {id}, 距离: {distance}) except Exception as e: print(f发生错误: {str(e)}) # 可能的恢复操作 milvus.close() milvus Milvus(hostlocalhost, port19530) # 重新连接资源监控# 获取系统统计信息 status, stats milvus.get_system_info() print(系统信息:) for key, value in stats.items(): print(f{key}: {value}) # 获取集合分区信息 status, partitions milvus.list_partitions(image_features) print(f分区列表: {partitions})在实际项目中我发现合理设置索引参数对性能影响最大。经过多次测试对于百万级数据量IVF_FLAT索引配合nlist4096通常能提供较好的平衡。另外定期调用compact接口可以优化存储空间和查询性能status milvus.compact(image_features) print(f压缩状态: {status})

更多文章

前端开发 2026/4/15 6:25:32

Wan2.2-I2V-A14B性能测试：对比不同算法下的视频生成速度与质量

Wan2.2-I2V-A14B性能测试：对比不同算法下的视频生成速度与质量 1. 测试背景与目标视频生成技术正在快速迭代，但实际应用中，生成速度和质量往往难以兼得。本次测试聚焦Wan2.2-I2V-A14B镜像在不同算法配置下的表现，通过量化数据和…

张开发

前端开发 2026/4/15 6:25:20

手把手教学：用DeerFlow的Web界面轻松进行多轮研究对话

手把手教学：用DeerFlow的Web界面轻松进行多轮研究对话 1. DeerFlow简介 DeerFlow是一个强大的深度研究辅助工具，它整合了语言模型、网络搜索、Python代码执行等多种能力，可以帮助用户快速获取专业见解、生成研究报告甚至制作播客内容。这个…

张开发

前端开发 2026/4/15 6:19:46

李慕婉-仙逆-造相Z-Turbo中的STM32嵌入式应用

李慕婉-仙逆-造相Z-Turbo中的STM32嵌入式应用 1. 引言想象一下，一个智能家居的交互面板，或者一个便携式的创意画板，能够根据你随口说出的描述，实时生成一幅精美的动漫角色图。这听起来像是科幻电影里的场景，但现在&…

张开发

前端开发 2026/4/15 6:17:14

光伏发电量计算中的辐照度标准解析与应用

1. 光伏发电量计算中的辐照度标准解析光伏发电量的计算离不开一个关键参数——辐照度。简单来说，辐照度就是单位面积上接收到的太阳辐射功率，单位是瓦每平方米（W/㎡）。这个数值直接决定了光伏组件能产生多少电能。但在实际应用中…

张开发

前端开发 2026/4/15 6:16:38

ArcGIS数据裁剪与掩膜提取：从基础操作到混合数据互裁实战

1. ArcGIS数据裁剪基础操作全解析刚接触GIS数据分析的朋友，最常遇到的场景就是把数据限定到研究区域内。比如你手上有全国土地利用数据，但只需要分析某个城市的状况，这时候数据裁剪（Clip）和掩膜提取（Extra…

张开发

前端开发 2026/4/15 6:15:44

Qwen3-14B私有部署镜像：大模型时代下的操作系统学习助手

Qwen3-14B私有部署镜像：大模型时代下的操作系统学习助手 1. 当操作系统教学遇上AI大模型计算机专业的学生们常常面临一个困境：操作系统这门课概念抽象、原理复杂，仅靠课本和课堂讲解很难真正理解。进程调度、内存管理这些核心概念&#xf…

张开发

前端开发 2026/4/15 6:15:44

基于ChatGLM3-6B的智能文档处理系统：从PDF解析到知识提取

基于ChatGLM3-6B的智能文档处理系统：从PDF解析到知识提取 1. 引言每天都有海量的文档需要处理，从合同协议到技术手册，从财务报告到学术论文。传统的人工处理方式不仅效率低下，还容易出错。想象一下，一个法务团队需要…

张开发

前端开发 2026/4/15 6:15:13

从课堂提问到芯片设计：用Verilog手把手教你实现一个带权重的公平仲裁器

从课堂提问到芯片设计：用Verilog手把手教你实现一个带权重的公平仲裁器在数字电路设计中，仲裁器（Arbiter）是一个至关重要的组件，它负责在多个请求源之间公平合理地分配共享资源。想象一下教室里的场景：老师…

张开发

$3分钟从Word到LaTeX：docx2tex让学术论文排版变得如此简单$

前端开发 2026/4/15 6:10:23

3分钟从Word到LaTeX：docx2tex让学术论文排版变得如此简单

3分钟从Word到LaTeX：docx2tex让学术论文排版变得如此简单【免费下载链接】docx2tex Converts Microsoft Word docx to LaTeX 项目地址: https://gitcode.com/gh_mirrors/do/docx2tex 还在为Word文档转换为LaTeX格式而烦恼吗？docx2tex是您的最佳解…

张开发

前端开发 2026/4/15 6:01:18

3步掌握智能风扇控制：Windows电脑散热优化完全指南

3步掌握智能风扇控制：Windows电脑散热优化完全指南【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gitcode.com/GitHub_Trending/fa/Fa…

张开发

前端开发 2026/4/15 6:00:54

告别命令行恐惧：用VSCode图形化界面搞定ChatGLM2-6B的安装与API调试

告别命令行恐惧：用VSCode图形化界面搞定ChatGLM2-6B的安装与API调试在人工智能技术快速发展的今天，大型语言模型如ChatGLM2-6B已经成为开发者探索AI应用的重要工具。然而，对于许多刚接触这一领域的开发者来说，传统的命令行操作方…

张开发

前端开发 2026/4/15 5:57:11

行业与板块表现 API：获取涨跌幅、成交量等聚合数据

行业和板块的整体表现能帮助用户快速了解市场热点。JKidata 的 performance_list 接口支持按行业（industry）或板块（sector）查询。官方文档：docs.jkidata.com。接口地址 GET http://jk1.jkidata.com:6600/api/performa…

张开发

保姆级教程：用Python 3.6和pymilvus 1.1.0搞定Milvus向量数据库的增删改查

最新文章

天赐范式第11天牛马时间：13 步拆解数学毒丸公式：∇ μ L eff =λ⋅Φ(Con(ZFC+¬CH))，锁死宇宙底层逻辑

absurd-sql多浏览器兼容性终极指南：全面解决Safari等无SharedArrayBuffer环境问题

单例模式

Phi-4-mini-reasoning惊艳效果：同一逻辑题三种解法路径对比生成

模仿学习在AIAgent中为何92%落地失败？——7个被主流论文忽略的时序对齐陷阱，立即自查

YellowLabTools CLI命令详解：从基础操作到高级用法

推荐文章

Spring with AI (): 定制对话——Prompt模板引入技

【AI原生研发灰度发布黄金法则】：20年架构师亲授7步闭环策略，规避92%的线上事故风险

PS3游戏更新下载器完整指南：如何轻松获取官方游戏补丁

别再手动除草了！用Python+OpenCV部署一个田间杂草实时检测系统

YOLO 系列：YOLOv8 引入 DyHead 动态检测头，统一目标检测与旋转框检测

21天机器学习核心算法学习计划（量化方向）

相关文章

别再让PDF图片丢失了！Dify二次开发实战：优化知识库的图文混合检索能力

热点 | Harness 架构深度解析：AI智能体编排框架的核心原理

【Python时序预测实战】融合LSTM与Transformer：从模型构建到单变量预测全流程解析

MySQL分区表实战：从原理到高效数据管理

CSRankings区域筛选功能深度解析：如何找到全球最佳CS研究机构

OpCore-Simplify：让开源系统硬件适配从8小时到30分钟的技术革命

分享文章

更多文章

Wan2.2-I2V-A14B性能测试：对比不同算法下的视频生成速度与质量

手把手教学：用DeerFlow的Web界面轻松进行多轮研究对话

李慕婉-仙逆-造相Z-Turbo中的STM32嵌入式应用

光伏发电量计算中的辐照度标准解析与应用

ArcGIS数据裁剪与掩膜提取：从基础操作到混合数据互裁实战

Qwen3-14B私有部署镜像：大模型时代下的操作系统学习助手

基于ChatGLM3-6B的智能文档处理系统：从PDF解析到知识提取

从课堂提问到芯片设计：用Verilog手把手教你实现一个带权重的公平仲裁器

3分钟从Word到LaTeX：docx2tex让学术论文排版变得如此简单

3步掌握智能风扇控制：Windows电脑散热优化完全指南

告别命令行恐惧：用VSCode图形化界面搞定ChatGLM2-6B的安装与API调试

行业与板块表现 API：获取涨跌幅、成交量等聚合数据

保姆级教程：用Python 3.6和pymilvus 1.1.0搞定Milvus向量数据库的增删改查

最新文章

天赐范式第11天牛马时间：13 步拆解数学毒丸公式：∇ μ​ L eff​ =λ⋅Φ(Con(ZFC+¬CH))，锁死宇宙底层逻辑

absurd-sql多浏览器兼容性终极指南：全面解决Safari等无SharedArrayBuffer环境问题

单例模式

Phi-4-mini-reasoning惊艳效果：同一逻辑题三种解法路径对比生成

模仿学习在AIAgent中为何92%落地失败？——7个被主流论文忽略的时序对齐陷阱，立即自查

YellowLabTools CLI命令详解：从基础操作到高级用法

推荐文章

Spring with AI (): 定制对话——Prompt模板引入技

【AI原生研发灰度发布黄金法则】：20年架构师亲授7步闭环策略，规避92%的线上事故风险

PS3游戏更新下载器完整指南：如何轻松获取官方游戏补丁

别再手动除草了！用Python+OpenCV部署一个田间杂草实时检测系统

YOLO 系列：YOLOv8 引入 DyHead 动态检测头，统一目标检测与旋转框检测

21天机器学习核心算法学习计划（量化方向）

相关文章

别再让PDF图片丢失了！Dify二次开发实战：优化知识库的图文混合检索能力

热点 | Harness 架构深度解析：AI智能体编排框架的核心原理

【Python时序预测实战】融合LSTM与Transformer：从模型构建到单变量预测全流程解析

MySQL分区表实战：从原理到高效数据管理

CSRankings区域筛选功能深度解析：如何找到全球最佳CS研究机构

OpCore-Simplify：让开源系统硬件适配从8小时到30分钟的技术革命

分享文章

更多文章

天赐范式第11天牛马时间：13 步拆解数学毒丸公式：∇ μ L eff =λ⋅Φ(Con(ZFC+¬CH))，锁死宇宙底层逻辑