Meraki 网络链路质量监测与告警自动化工作流

该工作流通过调用Cisco Meraki Dashboard API,定期获取网络设备的链路质量数据,自动计算最近5分钟的平均丢包率和延迟,识别异常网络节点。它避免了重复告警,并通过Microsoft Teams快速通知技术团队,同时在Redis数据库中记录告警状态,实现智能告警管理和持续监测。此系统提升了网络运维的自动化水平,确保了及时响应和业务连续性。

流程图
Meraki 网络链路质量监测与告警自动化工作流 工作流程图

工作流名称

Meraki 网络链路质量监测与告警自动化工作流

主要功能和亮点

本工作流通过调用 Cisco Meraki Dashboard API,定时获取组织下所有网络设备的上行链路的丢包率和延迟数据,自动计算最近5分钟内的平均丢包率和延迟,并结合阈值过滤出表现异常的网络节点。针对异常节点,工作流会判断是否已有未处理的告警,避免重复通知,若无告警则自动发送Microsoft Teams消息提醒技术团队,并在Redis数据库中记录告警状态,实现智能告警去重和持续监测。支持手动触发和工作日工作时间内定时执行(每5分钟一次),保证监控的及时性和自动化。

解决的核心问题

  • 自动化获取和整合Meraki网络设备的链路质量数据
  • 实时计算链路的平均丢包率和延迟,有效识别链路性能异常
  • 避免重复告警,减少运维人员告警疲劳
  • 快速通知技术团队,提升问题响应速度
  • 通过Redis缓存告警状态,实现告警的自动清理与重新触发

应用场景

  • 企业IT网络运维团队对Cisco Meraki设备链路质量的实时监控与告警
  • 网络服务提供商监测客户网络链路健康状态
  • 自动化运维系统中链路性能异常检测与告警集成
  • 需要通过Microsoft Teams即时通知网络异常的场景
  • 结合Redis实现告警状态管理和去重的自动化告警流程

主要流程步骤

  1. 触发方式:通过定时触发(周一到周五,8:00-17:00,每5分钟一次)或手动执行工作流
  2. 获取组织信息:调用Meraki API获取所有组织列表及其ID
  3. 获取网络ID:针对每个组织,查询所属网络的ID和名称
  4. 获取链路丢包率和延迟数据:调用Meraki API获取每个组织下设备的上行链路丢包率和延迟时间序列数据
  5. 数据整合与重组:合并组织、网络与链路性能数据,整理成易于分析的格式
  6. 计算平均值:通过JavaScript代码节点计算最近5个时间点的平均丢包率和延迟
  7. 异常过滤:筛选出平均延迟超过300ms或丢包率超过2%的网络
  8. 告警去重:查询Redis数据库判断该网络是否已有未清除告警
  9. 发送告警通知:对无重复告警的异常网络发送带有网络名称和链接的Microsoft Teams消息
  10. 告警记录:将告警信息写入Redis,设置3小时过期,过期后若问题未解决将重新触发告警

涉及的系统或服务

  • Cisco Meraki Dashboard API:获取组织、网络及设备链路性能数据
  • Redis数据库:存储和管理告警状态,实现告警去重和TTL过期机制
  • Microsoft Teams:推送链路异常告警消息,快速通知技术团队
  • n8n自动化平台:实现流程自动化编排,包括HTTP请求、代码处理、数据合并、触发器等节点

适用人群或使用价值

  • 网络运维工程师和IT支持团队,提升网络健康状态监控的自动化和精准度
  • 企业级网络管理员,减少因链路异常问题导致的业务中断风险
  • 运维自动化专家,构建可扩展、可维护的网络告警系统
  • 使用Cisco Meraki设备的组织,通过本工作流实现无缝集成的链路性能监测和告警
  • 需要实时通过协作工具(如Teams)响应网络异常的技术团队

此工作流通过紧密结合Meraki设备API与现代自动化技术,打造了一套高效、智能的网络链路质量监控与告警系统,显著提升了网络故障的发现速度和响应效率,助力企业保障业务连续性。