解决在RHEL操作系统中因 dnf makecache 造成服务器死机问题

June 5, 2025

881 views

855 words

Last modification：November 8, 2025

如果觉得我的文章对你有用，请随意赞赏

Renzheng
July 5th, 2025 at 10:24 pm IP属地：浙江省杭州市余杭区中国电信

我的阿里云 99 元机（OS: Rocky Linux 9.5 ）最近也出现了周期性 CPU 和磁盘读取飙升导致服务器卡死甚至无法登录的问题，提交工单之后技术支持发现问题也是由 dnf makecache 导致的。CPU和IO 飙升是突发的，卡死前的 top 日志都是正常的，卡死之后服务器便无法登录了，而且云监控和日志记录也都失效了，卡死是无法记录日志，强制重启之后才能恢复正常。
“发现systemd进程在这些时间段内占用了大量的系统资源” 这个是如何做到的呢？

1. 王浩宇
  July 6th, 2025 at 03:56 pm IP属地：山东省济南市中国电信
  
  @Renzheng
  
  通过sar确认在 dnf makecache 运行期间是否出现了异常的 CPU 磁盘 I/O 或内存使用峰值，其实系统每次卡死之前的最后一条日志记录是dnf makecache，从这里就可以大概判断出来了，系统都卡死了肯定不会产生其他的日志，除非自动恢复或者重启，最后一条日志的产生与恢复后日志产生的时间跨度可能比较大