OpenStack云运营:日志、监控与告警指南
1. OpenStack云运营概述
OpenStack云与传统虚拟化平台不同,它没有预装的一键式操作工具来实现基础设施监控配置。但这并不意味着它 inferior,相反,它具有高度的灵活性,允许管理员根据公司或组织的需求选择和配置工具。在OpenStack云构建、测试并准备好投入运营后,就可以迎接用户和工作负载了。
2. 日志、监控与告警(LMA)的重要性
OpenStack云的运营中,LMA是至关重要的环节。由于OpenStack的规模和弹性,传统的LMA方法往往无法满足需求。传统的二进制告警方式,如“服务已停止”“资源使用率达95%”或“文件系统已满”等,无法提供足够的运营信息来了解OpenStack云的健康状况。
从架构角度来看,LMA解决方案应满足以下要求:
- 提供对OpenStack基础设施的实时或近实时内省和告警。
- 支持某种形式的发现和配置管理。
- 具备可扩展性,以支持企业级云。
- 能够进行自我监控,并可配置为高可用。
3. 日志管理
日志是OpenStack云运营数据的重要来源。不仅主机操作系统有日志,OpenStack的每个项目也都有单独的日志。建议将所有日志以相同的syslog日志级别发送到syslog,并根据需要进行修改。
以下是一个OpenStack日志条目的示例:
2016-07-08 07:36:45.613 3474 INFO nova.osapi_compute.wsgi.serv