Lychee-Rerank-MM实战教程：3步启动服务（start.sh / app.py / nohup）详解

张开发

• 2026/6/3 3:57:38 • 15 分钟阅读

分享文章

Lychee-Rerank-MM实战教程3步启动服务start.sh / app.py / nohup详解1. 项目介绍多模态重排序利器Lychee-Rerank-MM是一个基于Qwen2.5-VL的多模态重排序模型专门用于图文检索场景的精排任务。简单来说它就像一个智能的相关性裁判能够判断查询内容文字或图片与候选文档文字或图片之间的匹配程度。这个模型的核心价值在于多模态能力同时处理文本和图像支持文本到文本、文本到图像、图像到文本、图像到图像四种匹配模式精准排序为每个候选文档给出0-1的相关性分数帮你快速找到最相关的内容批量处理支持一次性处理多个文档大幅提升效率技术规格方面模型采用7B参数规模实际8.29B使用BF16精度推理在MIRB-40基准测试中取得了63.85的综合得分表现相当出色。2. 环境准备与快速部署2.1 系统要求检查在开始之前请确保你的环境满足以下要求模型路径/root/ai-models/vec-ai/lychee-rerank-mm必须存在且包含模型文件GPU显存建议16GB以上确保模型能够顺利加载Python版本3.8或更高版本PyTorch版本2.0或更高版本可以通过以下命令检查环境# 检查模型路径 ls -la /root/ai-models/vec-ai/lychee-rerank-mm # 检查GPU信息 nvidia-smi # 检查Python版本 python --version # 检查PyTorch版本 python -c import torch; print(torch.__version__)2.2 依赖安装如果还没有安装依赖可以使用以下命令# 进入项目目录 cd /root/lychee-rerank-mm # 安装所需依赖 pip install -r requirements.txt主要依赖包括torch2.0.0、modelscope1.0.0、gradio4.0.0等具体可以参考项目中的requirements.txt文件。3. 三种启动方式详解3.1 方式一使用启动脚本推荐这是最简单也是最推荐的启动方式# 进入项目目录 cd /root/lychee-rerank-mm # 给启动脚本添加执行权限如果还没有 chmod x start.sh # 运行启动脚本 ./start.shstart.sh脚本做了什么这个脚本会自动完成以下工作检查模型路径是否正确设置必要的环境变量启动Gradio网页界面输出服务访问地址优点一键启动无需记忆复杂参数适合日常使用。3.2 方式二直接运行Python脚本如果你需要更多控制可以直接运行app.py# 进入项目目录 cd /root/lychee-rerank-mm # 直接运行应用 python app.py这种方式会在前台运行服务你可以在终端中实时看到运行日志适合调试和开发时使用。3.3 方式三后台运行服务对于生产环境你可能希望服务在后台持续运行# 进入项目目录 cd /root/lychee-rerank-mm # 使用nohup在后台运行 nohup python app.py /tmp/lychee_server.log 21 参数解释nohup让命令在后台持续运行即使终端关闭也不会停止 /tmp/lychee_server.log将标准输出重定向到日志文件21将错误输出也重定向到同一个日志文件在后台运行查看运行状态# 查看进程是否在运行 ps aux | grep python app.py # 查看日志文件 tail -f /tmp/lychee_server.log4. 服务访问与验证4.1 访问地址服务启动后可以通过以下地址访问本地访问http://localhost:7860远程访问http://你的服务器IP地址:78604.2 服务验证打开浏览器访问上述地址你应该能看到一个Web界面包含两个主要功能选项卡单文档重排序针对单个查询-文档对进行相关性评分批量重排序一次性处理多个文档输出排序结果尝试输入以下测试内容来验证服务是否正常工作指令: Given a web search query, retrieve relevant passages that answer the query 查询: What is the capital of China? 文档: The capital of China is Beijing.如果服务正常你应该能看到一个0-1之间的相关性分数通常应该在0.9以上。5. 核心功能使用指南5.1 单文档重排序模式这个模式适合当你只有一个查询和一个文档需要评估时使用。输入格式指令描述任务目标的提示词建议使用推荐的指令模板查询可以是文本或图片上传文件文档可以是文本或图片上传文件输出结果一个0-1之间的浮点数分数分数越高表示相关性越强。实用技巧对于不同场景使用对应的推荐指令可以获得更好效果文本查询尽量简洁明确图片建议使用清晰、内容明确的图像5.2 批量重排序模式当你有多个候选文档需要排序时使用这个模式效率更高。输入格式第一行指令与单文档模式相同第二行查询内容第三行开始每个候选文档占一行输出结果一个Markdown表格按相关性从高到低排序包含分数和排名。批量处理示例指令: Given a web search query, retrieve relevant passages that answer the query 查询: What is the capital of China? 文档1: Beijing is the capital of China. 文档2: Shanghai is the largest city in China. 文档3: China is located in East Asia.6. 常见问题解决6.1 模型加载失败如果遇到模型加载问题可以尝试以下排查步骤# 检查模型文件是否存在 ls -la /root/ai-models/vec-ai/lychee-rerank-mm/ # 检查GPU内存是否足够 nvidia-smi # 重新安装依赖 pip install -r requirements.txt --force-reinstall6.2 服务无法启动如果服务启动失败检查日志文件中的错误信息# 查看最近的错误日志 tail -n 50 /tmp/lychee_server.log # 或者直接在前台运行查看实时错误 python app.py6.3 性能优化建议如果觉得服务运行速度不够快可以尝试使用批量模式处理多个文档比单个处理更高效确保启用了Flash Attention 2加速默认已开启调整max_length参数根据实际需要设置合适的文本长度限制6.4 停止服务如果需要停止后台运行的服务# 查找服务进程ID ps aux | grep python app.py # 停止进程将PID替换为实际的进程ID kill PID # 强制停止如果普通kill无效 kill -9 PID7. 实际应用场景7.1 电商商品搜索在电商平台中Lychee-Rerank-MM可以帮助改善搜索体验指令: Given a product image and description, retrieve similar products 查询: [上传用户提供的商品图片] 文档: [候选商品的描述和图片]7.2 内容检索系统对于文档、论文、新闻等内容检索系统指令: Given a document search query, retrieve relevant documents 查询: 人工智能发展趋势文档: [候选文档的内容]7.3 智能问答系统提升问答系统的答案匹配精度指令: Given a question, retrieve factual passages that answer it 查询: 如何安装Python包文档: [各种可能的答案段落]8. 总结与下一步通过本教程你已经掌握了Lychee-Rerank-MM模型的三种启动方式和使用方法。这个强大的多模态重排序工具可以帮助你在各种检索场景中提升结果的相关性和准确性。关键要点回顾三种启动方式各有适用场景start.sh最简单直接运行适合调试nohup适合生产环境支持单文档和批量两种处理模式批量模式效率更高针对不同场景使用对应的指令模板可以获得更好效果服务运行在7860端口可以通过浏览器访问Web界面下一步建议尝试在不同的业务场景中应用重排序功能探索不同指令对结果的影响找到最适合你场景的指令模板考虑将服务集成到现有的搜索或推荐系统中关注模型的更新版本及时获取性能改进和新功能现在你已经准备好了开始使用Lychee-Rerank-MM来提升你的多模态检索效果吧获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。