云服务器部署大模型

张开发
2026/4/13 1:18:04 15 分钟阅读

分享文章

云服务器部署大模型
云服务器部署大模型1. 服务器配置2. 大模型下载3. 部署大模型1. 服务器配置2. 大模型下载千问2.5-14B-Instruct https://modelscope.cn/models/Qwen/Qwen2.5-14B-Instructpipinstallmodelscope modelscope download--modelQwen/Qwen2.5-14B-Instruct--local_dir/root/autodl-tmp/Qwen2.5-14B3. 部署大模型PyTorch 2.8.0 Python 3.12 CUDA 12.82×RTX 5090 32GB跑 14B 模型属于降维打击x86 Ubuntu 22.04模型已下载到/root/autodl-tmp/Qwen2.5-14B# vllmpipinstallvllm-U-ihttps://pypi.tuna.tsinghua.edu.cn/simplepython-mvllm.entrypoints.openai.api_server\--model/root/autodl-tmp/Qwen2.5-14B\--tensor-parallel-size2\--host0.0.0.0\--port8000\--dtypeauto\--gpu-memory-utilization0.9\--max-model-len32768\--trust-remote-code

更多文章