部署SQL告警规则
应用场景
华为云云日志服务(LTS)的SQL告警规则功能允许用户基于SQL查询结果设置告警条件,当查询结果满足预设条件时自动触发告警通知。通过配置SQL告警规则,您可以实现日志数据的实时监控、异常检测和自动告警,提高运维效率和系统可靠性。
本最佳实践特别适用于需要实时监控日志数据、检测系统异常、实现自动化告警通知的场景,如应用性能监控、错误日志告警、业务指标监控、安全事件检测等。本最佳实践将介绍如何使用Terraform自动化部署LTS SQL告警规则,包括SMN主题、日志组、日志流和SQL告警规则的创建,实现完整的日志监控和告警解决方案。
相关资源/数据源
本最佳实践涉及以下主要资源和数据源:
数据源
资源
资源/数据源依赖关系
操作步骤
1. 脚本准备
在指定工作空间中准备好用于编写当前最佳实践脚本的TF文件(如main.tf),确保其中(也可以是其他同级目录下的TF文件)包含部署资源所需的provider版本声明和华为云鉴权信息。 配置介绍参考部署华为云资源前的准备工作一文中的介绍。
2. 创建SMN主题
在TF文件(如main.tf)中添加以下脚本以告知Terraform创建SMN主题资源:
参数说明:
name:SMN主题的名称,通过引用输入变量topic_name进行赋值
display_name:SMN主题的显示名称,设置为"The display name of topic"
3. 创建日志组
在TF文件中添加以下脚本以告知Terraform创建日志组资源:
参数说明:
group_name:日志组的名称,通过引用输入变量group_name进行赋值
ttl_in_days:日志组的日志过期天数,通过引用输入变量group_log_expiration_days进行赋值,默认值为14
4. 创建日志流
在TF文件中添加以下脚本以告知Terraform创建日志流资源:
参数说明:
group_id:日志流所属的日志组ID,引用前面创建的日志组资源的ID
stream_name:日志流的名称,通过引用输入变量stream_name进行赋值
ttl_in_days:日志流的日志过期天数,通过引用输入变量stream_log_expiration_days进行赋值,默认值为null(继承日志组设置)
5. 查询LTS通知模板信息
在TF文件中添加以下脚本以告知Terraform查询LTS通知模板信息:
参数说明:
count:条件创建,当notification_template_name变量不为空字符串时创建此数据源
domain_id:域ID,通过引用输入变量domain_id进行赋值,默认值为null
6. 创建SQL告警规则
在TF文件中添加以下脚本以告知Terraform创建SQL告警规则资源:
参数说明:
name:SQL告警规则的名称,通过引用输入变量alarm_rule_name进行赋值
condition_expression:告警条件表达式,通过引用输入变量alarm_rule_condition_expression进行赋值
alarm_level:告警级别,通过引用输入变量alarm_rule_alarm_level进行赋值,默认值为"MINOR"
send_notifications:是否发送通知,设置为true表示启用通知
trigger_condition_count:触发条件计数,通过引用输入变量alarm_rule_trigger_condition_count进行赋值,默认值为2
trigger_condition_frequency:触发条件频率,通过引用输入变量alarm_rule_trigger_condition_frequency进行赋值,默认值为3
send_recovery_notifications:是否发送恢复通知,通过引用输入变量alarm_rule_send_recovery_notifications进行赋值,默认值为true
recovery_frequency:恢复频率,当send_recovery_notifications为true时使用alarm_rule_recovery_frequency的值
notification_frequency:通知频率,通过引用输入变量alarm_rule_notification_frequency进行赋值,默认值为15
alarm_rule_alias:告警规则别名,通过引用输入变量alarm_rule_alias进行赋值,默认值为空字符串
sql_requests:SQL请求配置块
title:请求标题,通过引用输入变量alarm_rule_request_title进行赋值
sql:SQL查询语句,通过引用输入变量alarm_rule_request_sql进行赋值
log_group_id:日志组ID,引用前面创建的日志组资源的ID
log_stream_id:日志流ID,引用前面创建的日志流资源的ID
search_time_range_unit:搜索时间范围单位,通过引用输入变量alarm_rule_request_search_time_range_unit进行赋值,默认值为"minute"
search_time_range:搜索时间范围,通过引用输入变量alarm_rule_request_search_time_range进行赋值,默认值为5
log_group_name:日志组名称,引用前面创建的日志组资源的名称
log_stream_name:日志流名称,引用前面创建的日志流资源的名称
frequency:频率配置块
type:频率类型,通过引用输入变量alarm_rule_frequency_type进行赋值,默认值为"HOURLY"
notification_save_rule:通知保存规则配置块
template_name:通知模板名称,优先使用notification_template_name变量,如果为空则尝试从查询结果中获取"sql_template"
user_name:通知用户名,通过引用输入变量alarm_rule_notification_user_name进行赋值
language:通知语言,通过引用输入变量alarm_rule_notification_language进行赋值,默认值为"en-us"
topics:主题配置块
name:主题名称,引用前面创建的SMN主题资源的名称
topic_urn:主题URN,引用前面创建的SMN主题资源的URN
display_name:主题显示名称,引用前面创建的SMN主题资源的显示名称
push_policy:推送策略,引用前面创建的SMN主题资源的推送策略
7. 预设资源部署所需的入参(可选)
本实践中,部分资源、数据源使用了输入变量对配置内容进行赋值,这些输入参数在后续部署时需要手工输入。 同时,Terraform提供了通过.tfvars文件预设这些配置的方法,可以避免每次执行时重复输入。
在工作目录下创建terraform.tfvars文件,示例内容如下:
使用方法:
将上述内容保存为工作目录下的
terraform.tfvars文件(该文件名可使用户在执行terraform命令时自动导入该tfvars文件中的内容,其他命名则需要在tfvars前补充.auto定义,如variables.auto.tfvars)根据实际需要修改参数值
执行
terraform plan或terraform apply时,Terraform会自动读取该文件中的变量值
除了使用terraform.tfvars文件外,还可以通过以下方式设置变量值:
命令行参数:
terraform apply -var="group_name=my-group" -var="stream_name=my-stream"环境变量:
export TF_VAR_group_name=my-group自定义命名的变量文件:
terraform apply -var-file="custom.tfvars"
注意:如果同一个变量通过多种方式进行设置,Terraform会按照以下优先级使用变量值:命令行参数 > 变量文件 > 环境变量 > 默认值。
8. 初始化并应用Terraform配置
完成以上脚本配置后,执行以下步骤来创建资源:
运行
terraform init初始化环境运行
terraform plan查看资源创建计划确认资源计划无误后,运行
terraform apply开始创建SQL告警规则运行
terraform show查看已创建的SQL告警规则详情
参考信息
Last updated