news 2026/6/15 10:29:32

openstack计算节点nova-compute服务启动异常处理

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
openstack计算节点nova-compute服务启动异常处理

#你处理过openstack中计算节点nova-compute服务假死的问题吗,正常状态下,突发指定到该节点的云主机创建失败,本篇介绍两个案例。#

在openstack云计算平台,nova计算节点经常出现nova-compute服务假死的状态,重启也起不来。创建云主机指定该节点创建云主机失败。该问题在我运维过程当中遇到过几次,在节点正常状态下,突然出现指定到该节点的云主机创建失败,但是其已存在的云主机是没有任何影响的时候,可能是存在脏数据,以下故障问题可以借鉴。

实例脏数据导致nova-compute服务启动异常

底层kvm的虚拟机和数据库中的云主机对应不上关系,导致nova-compute服务启动失败

1. 重启nova-conpute服务失败,查看nova-compute日志,因为数据库中的instances表中的数据和kvm层的信息不一致导致

根据uuid确认 instance-ID。

确认该实例状态,如果确实不一致了,定义为脏数据,查询示列ID的UUID,从kvm层销毁该云主机。

virsh dumpxml 实例ID | grep "<entry name='uuid'>"

nova show 379121c9-6ce2-49bc-8fec-a3fb9cbfb588 //没有该uuid virsh list --all |grep instance-00000015 //确认的实例状态 virsh destroy instance-00000015 //关机 virsh undefine instance-00000015 //销毁该云主机

然后重启libvirt服务和nova-compute服务

systemctl restart libvirtd.service systemctl restart openstack-nova-compute

在重新加入computeha 监控

consul members|grep server //登录server节点执行haclient.sh list-dangling haclient.sh list-dangling //加入fence的节点,也就是consul 隔离的节点重新加入monitor架空 haclient.sh monitor node-xx

修复nova-compute服务异常

1.确认libvirt服务运行情况

nova-compute服务异常的原因和ceph存储有关,可能存储网络连通异常。

//nova-compute服务在部分节点启动失败 systemctl stop openstack-nova-compute.service computeha-slave.service wdmd nova service-force-down --unset node-24 nova-compute nova service-enable node-24 nova-compute systemctl start openstack-nova-compute.service sys //重启libvirtd可以修复 systemctl restart libvirtd //检查是否受HAcomputer检测 haclinet.sh list-dangling //如果存在,执行重新加入 haclient.sh monitor node-24

2.查看异常节点nova-compute.log日志

nova-compute如果还是没法恢复,查看节点上nova-compute日志,确认有没有阻碍nova-compute服务启动的虚拟机资源,然后从数据库中

cat /var/log/nova/nova-compute.log|grep -i "InstanceNotFound"

tailf /var/log/nova/nova-compute.log //确认有没有阻碍nova-compute服务启动的虚拟机资源,然后从数据库中 cat /var/log/nova/nova-compute.log|grep -i "InstanceNotFound" mysql -uroot -p set foreign_key_checks = 0 delete from nova.instances where uuid="对应的UUID" //脚本 #!/bin/bash a=($(cat /var/log/nova/nova-compute.log | grep -Eo 'InstanceNotFound: Instance .* could not be found.' | awk '!a[$3]++ {printf"\"%s\"\n",$3}')) passwd=`consul kv get settings/cluster/database_password` echo "${a[@]}" for i in "${a[@]}" ;do mysql -u root -p${passwd} -e"set foreign_key_checks = 0; delete from nova.instances where uuid="$i";" done

3.重新启动nova-compute,接触节点隔离

如果重新加入force监控之后,服务启动正常,但是在server节点执行haclient.sh list-dangling,显示节点还在的问题。可以通过控制节点查看nova-monitor.log日志,很可能是该节点的租户网卡异常。

往期推荐

云计算平台 分析云主机迁移过程

openstack常用命令集

openstack 计算节点nova-compute配置优化

云计算:什么是云计算

云计算:openstack架构

你用的云计算,底层其实是虚拟化

云计算 云平台虚拟机镜像定制化生成方案

关注订阅不迷路

云计算 | 市场分析 | 为梦想启航 | linux命令大全 | linux技术博客

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 13:02:15

Redmi AX3000终极改造指南:从家用路由到专业网络平台

Redmi AX3000终极改造指南&#xff1a;从家用路由到专业网络平台 【免费下载链接】openwrt-redmi-ax3000 Openwrt for Redmi AX3000 / Xiaomi CR8806 / Xiaomi CR8808 / Xiaomi CR8809 项目地址: https://gitcode.com/gh_mirrors/op/openwrt-redmi-ax3000 想要让手中的Re…

作者头像 李华
网站建设 2026/6/10 15:52:34

VMPDump终极指南:简单快速实现VMP脱壳与逆向分析

VMPDump终极指南&#xff1a;简单快速实现VMP脱壳与逆向分析 【免费下载链接】vmpdump A dynamic VMP dumper and import fixer, powered by VTIL. 项目地址: https://gitcode.com/gh_mirrors/vm/vmpdump 在当今软件保护技术日益复杂的背景下&#xff0c;VMPDump作为一款…

作者头像 李华
网站建设 2026/5/31 3:23:51

边缘计算:在迷你设备上优化运行Z-Image-Turbo的奇技淫巧

边缘计算&#xff1a;在迷你设备上优化运行Z-Image-Turbo的奇技淫巧 如果你是一名物联网开发者&#xff0c;想在树莓派或类似边缘设备上集成轻量级图像生成功能&#xff0c;但受限于算力资源&#xff0c;这篇文章就是为你准备的。Z-Image-Turbo作为一款专为边缘计算优化的文生图…

作者头像 李华
网站建设 2026/6/4 21:58:04

Z-Image-Turbo商业授权解析:从部署到上线的完整路径

Z-Image-Turbo商业授权解析&#xff1a;从部署到上线的完整路径 对于创业公司而言&#xff0c;快速部署高效的AI图像生成系统是提升产品竞争力的关键。Z-Image-Turbo作为一款开源的高性能图像生成模型&#xff0c;凭借其亚秒级的生成速度和出色的图像质量&#xff0c;成为许多…

作者头像 李华
网站建设 2026/5/26 1:33:24

告别CAD软件学习曲线:用AI文字描述生成专业机械设计

告别CAD软件学习曲线&#xff1a;用AI文字描述生成专业机械设计 【免费下载链接】text-to-cad-ui A lightweight UI for interfacing with the Zoo text-to-cad API, built with SvelteKit. 项目地址: https://gitcode.com/gh_mirrors/te/text-to-cad-ui 还在为复杂的CA…

作者头像 李华
网站建设 2026/6/4 10:11:38

离线音频转录革命:Buzz让您的语音数据安全无忧

离线音频转录革命&#xff1a;Buzz让您的语音数据安全无忧 【免费下载链接】buzz Buzz transcribes and translates audio offline on your personal computer. Powered by OpenAIs Whisper. 项目地址: https://gitcode.com/GitHub_Trending/buz/buzz 还在为会议录音整理…

作者头像 李华