从20.03 SP3到24.03 LTS:我的openEuler大版本升级实战与避坑全记录

张开发
2026/4/12 23:28:55 15 分钟阅读

分享文章

从20.03 SP3到24.03 LTS:我的openEuler大版本升级实战与避坑全记录
从20.03 SP3到24.03 LTS我的openEuler大版本升级实战与避坑全记录去年夏天当我第一次在服务器监控面板上看到openEuler 20.03-LTS-SP3即将停止维护的警告时就知道一场硬仗要来了。作为团队里负责基础设施的老运维我经历过太多次系统升级的惊心动魄——服务不可用、依赖地狱、配置丢失...这次我决定用最谨慎的态度对待从20.03到24.03的跨越式升级。本文将完整还原我历时三周的升级历程重点不是教科书式的命令列表而是那些只有实战才会遇到的坑与应对策略。1. 升级前的战略准备在真正执行dnf distro-sync之前我花了整整五天做准备工作。大版本升级不是简单的软件更新而是操作系统的心脏移植手术任何疏忽都可能导致业务中断。1.1 环境全面体检首先用脚本收集系统全貌信息远比简单的cat /etc/openEuler-latest更全面#!/bin/bash echo 系统基础信息 cat /etc/os-release uname -a rpm -qa | grep kernel | sort df -h echo 关键服务状态 systemctl list-units --typeservice --staterunning journalctl --since 1 week ago -p err这个检查让我发现了三个隐患旧内核残留系统存在4.19.90和5.10.0两个内核版本磁盘空间紧张/boot分区只剩200MB空间自定义内核模块NVIDIA驱动和VirtualBox模块需要重新编译1.2 备份策略的陷阱大多数教程都会告诉你备份配置文件但实际生产环境需要更细致的方案备份类型工具/方法恢复测试要点配置文件tar -zcvf /etc_backup.tgz /etc权限保留验证数据库mysqldump binlog数据一致性检查应用数据LVM快照 rsync文件完整性校验服务状态systemctl list-units --all services.txt依赖关系重建特别提醒不要依赖单一种备份方式。我在测试恢复时发现简单的tar备份会丢失SELinux上下文导致某些服务无法启动。2. 升级过程中的六大实战难题2.1 依赖冲突的拆弹艺术执行dnf distro-sync时遭遇的依赖冲突堪称升级路上的第一只拦路虎。典型报错如下Error: Problem: package A-1.0-1.oe1.x86_64 requires B 2.0, but none of the providers can be installed - package C-3.0-1.oe2403.x86_64 conflicts with B 3.0 provided by B-2.0-1.oe1.x86_64我的解决路线图先用dnf repoquery --deplist分析依赖树对非核心包使用--skip-broken临时跳过关键服务依赖则手动下载rpm包强制安装记录操作日志最终通过dnf swap B C实现依赖替换警告强制安装(--nodeps)是最后手段必须记录每个被跳过的依赖项升级后立即验证相关服务。2.2 密钥风暴的平息从20.03升级到24.03会遇到GPG密钥的世代更替问题。错误提示通常是warning: /var/cache/dnf/packages/openEuler-gpg-keys-1.0-3.7.oe2403.x86_64.rpm: Header V4 RSA/SHA256 Signature, key ID fb37bc6f: NOKEY标准解决方案是rpm --import /etc/pki/rpm-gpg/RPM-GPG-KEY-openEuler但真实场景更复杂某些镜像站点的密钥文件路径不同企业内网可能需要先部署本地密钥服务器在CI/CD环境中需要预先注入密钥我最终采用的组合拳# 先清除旧密钥 rpm -e gpg-pubkey-$(rpm -qa gpg-pubkey --qf %{NAME}-%{VERSION}-%{RELEASE}\n) # 安装新版本密钥包 curl -O https://repo.openeuler.org/openEuler-24.03-LTS/OS/x86_64/Packages/openEuler-gpg-keys-1.0-3.7.oe2403.x86_64.rpm rpm -ivh openEuler-gpg-keys-*.rpm # 验证密钥指纹 gpg --quiet --with-fingerprint /etc/pki/rpm-gpg/RPM-GPG-KEY-openEuler3. 升级后的关键验证步骤系统重启只是开始真正的考验在服务恢复阶段。我设计了一套验证checklist3.1 基础环境验证# 内核与用户空间一致性检查 uname -r # 应为6.6.x grep PRETTY_NAME /etc/os-release # 确认24.03 ldd --version # glibc版本兼容性 # 关键路径权限检查 restorecon -Rv /etc /usr/lib/systemd3.2 网络与服务异常排查常见问题包括firewalld规则丢失NetworkManager与network服务冲突容器运行时cgroup驱动不匹配我的诊断脚本核心部分# 检查防火墙规则是否幸存 diff (iptables-save) /backup/iptables.rules # 验证容器运行时 podman info | grep cgroup if [ $? -ne 0 ]; then echo 可能需要更新容器配置 sed -i s/systemd/cgroupfs/ /etc/containers/containers.conf fi4. 性能调优与新特性适配24.03 LTS引入了多项底层改进需要针对性优化4.1 内核参数调整对比新旧版本的内核默认值变化参数20.03默认值24.03默认值建议调整vm.swappiness6030数据库服务器设为10net.ipv4.tcp_keepalive_time7200300根据应用场景调整fs.file-max7941689223372036854775807保持默认即可优化命令示例echo vm.swappiness10 /etc/sysctl.d/99-production.conf sysctl -p /etc/sysctl.d/99-production.conf4.2 开发环境迁移指南对于开发团队需要特别注意GCC从7.3升级到12.3带来的ABI变化Python默认版本变更导致的虚拟环境失效OpenJDK的证书存储路径调整Python虚拟环境迁移示例# 旧环境备份 pip freeze requirements.txt # 新建24.03环境 python3.11 -m venv /opt/new_venv source /opt/new_venv/bin/activate pip install -r requirements.txt # ABI兼容性检查 debuginfo-install python3-libs abi-compliance-checker -lib python3 -old 20.03 -new 24.03这场升级战役最终以零停机时间、零数据丢失的结果收官。最深刻的体会是大版本升级不是技术问题而是风险管理工程。每个生产环境都有其独特性希望我的这些实战记录能帮你少走弯路。

更多文章