全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

自动化运维功能介绍

最近更新时间:2025-12-17 13:14:15

一、使用前准备-授权说明

主账号:

  • 在角色管理板块中,将权限策略绑定到角色以控制自动化运维功能中可调用的openAPI。

  • 将自动化运维权限分配给子用户。

操作流程:

  1. 在访问控制-子用户管理中,为子用户分配自动化运维的全量权限。

  1. 主账号-访问控制-集成管理-角色-新建角色

  1. 选择“金山云服务”分类,授信云服务选择“云监控”,角色名称定义为OOSRole。

将相关权限通过“关联策略”绑定到角色OOSRole,以控制自动化运维功能中可调用的openAPI。

二、功能特性

模块

核心功能

配置信息

功能界面

跟其他模块的关系

触发器

  • 定义触发源&触发规则

  • 触发源:支持云监控事件、事件聚合、定时任务

  • 触发规则:当触发源选择“事件”&“事件聚合”时,可通过事件信息定义触发规则。其中事件信息包括:机房、实例ID、实例名称、事件类型、事件名称、事件等级、事件状态、事件内容、xid。

  • 触发动作:选择关联的自动化场景。

  • 数据处理:编辑触发规则中用于将原始参数转换为目标动作所需参数的数据处理代码。

  • 通知订阅:配置通知发送节点。

  • 通知联系人、通知回调:配置通知途径。

  • 熔断机制:配置熔断规则,滑动窗口期内本触发器触发动作超过设置次数时将开启熔断。默认值为0,不会触发熔断机制

  • 可绑定一个自动化场景。

自动化场景

  • 定义运维处理流程

  • 场景流程:通过拖拽,定义场景处理流程。支持节点:

    • 开始:表示流程开始节点。

    • 数据处理:定义输入参数及数据处理流程,支持测试。

    • 验证:可通过逻辑判断验证输入参数及输出参数是否符合预期。

    • 子场景:支持引用其他自动化场景包含的处理流程。

    • 结束:表示流程结束节点。

    • 定时器:支持设置延迟时长。

    • 人工介入:支持配置审批联系人&审批回调地址。

  • 可绑定多个触发器,当满足某一触发器规则时,自动触发流程。

  • 除触发器触发方式,亦支持通过配置执行表单,手动输入参数触发执行。

执行记录

  • 记录执行结果及日志详情

  • 基本信息:包括实际执行开始&结束时间、关联自动化场景、输入参数、输出参数及执行结果。

  • 日志详情:详细记录自动化流程中每个节点的操作时间及相关备注。

  • 支持评价。

  • 记录每一次自动化场景流程的执行结果。

公共函数

  • 将使用频率高的功能定义为公共函数,便于调用。

    • 分为系统预置函数&用户定义函数。

  • 创建函数所需信息:函数名称、参数、特殊变量、脚本内容、备注、示例。

  • 系统预置函数:g_aggregator、g_get_credential、g_limiter、g_print、g_timestamp

  • 触发器&自动化场景的代码编辑中可使用。

功能特性

作用

支持模块

说明

版本控制

留存及管理运维过程中的历史代码及配置。

触发器、自动化场景、公共函数

历史版本触发器、自动化场景和公共函数支持查看及编辑。

审核发布

对各版本进行审批后发布,确保发布内容的安全性及准确性。

触发器、自动化场景、公共函数

每版本触发器、自动化场景和公共函数均需要审批发布。

通知渠道

使用云监控通知渠道,支持短信、邮箱、webhook方式,将运维作业开始及执行结果推送至用户。

执行记录

/

三、使用示例

以运维动作“CPU故障自动重启”为案例说明使用流程:

  1. 确保自动化运维OOSRole角色已绑定相关权限

  2. 于“自动化场景”中定义运维故障处理流程

  1. 于触发器中定义触发源为“CPU故障发生”事件,完成通知相关设置

  1. 完成设置后,事件发生时,将自动执行运维处理流程。可于“执行记录”中查看执行进度及执行结果。

文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈