Meraki 网络链路质量监测与告警自动化工作流
该工作流通过调用Cisco Meraki Dashboard API,定期获取网络设备的链路质量数据,自动计算最近5分钟的平均丢包率和延迟,识别异常网络节点。它避免了重复告警,并通过Microsoft Teams快速通知技术团队,同时在Redis数据库中记录告警状态,实现智能告警管理和持续监测。此系统提升了网络运维的自动化水平,确保了及时响应和业务连续性。
流程图

工作流名称
Meraki 网络链路质量监测与告警自动化工作流
主要功能和亮点
本工作流通过调用 Cisco Meraki Dashboard API,定时获取组织下所有网络设备的上行链路的丢包率和延迟数据,自动计算最近5分钟内的平均丢包率和延迟,并结合阈值过滤出表现异常的网络节点。针对异常节点,工作流会判断是否已有未处理的告警,避免重复通知,若无告警则自动发送Microsoft Teams消息提醒技术团队,并在Redis数据库中记录告警状态,实现智能告警去重和持续监测。支持手动触发和工作日工作时间内定时执行(每5分钟一次),保证监控的及时性和自动化。
解决的核心问题
- 自动化获取和整合Meraki网络设备的链路质量数据
- 实时计算链路的平均丢包率和延迟,有效识别链路性能异常
- 避免重复告警,减少运维人员告警疲劳
- 快速通知技术团队,提升问题响应速度
- 通过Redis缓存告警状态,实现告警的自动清理与重新触发
应用场景
- 企业IT网络运维团队对Cisco Meraki设备链路质量的实时监控与告警
- 网络服务提供商监测客户网络链路健康状态
- 自动化运维系统中链路性能异常检测与告警集成
- 需要通过Microsoft Teams即时通知网络异常的场景
- 结合Redis实现告警状态管理和去重的自动化告警流程
主要流程步骤
- 触发方式:通过定时触发(周一到周五,8:00-17:00,每5分钟一次)或手动执行工作流
- 获取组织信息:调用Meraki API获取所有组织列表及其ID
- 获取网络ID:针对每个组织,查询所属网络的ID和名称
- 获取链路丢包率和延迟数据:调用Meraki API获取每个组织下设备的上行链路丢包率和延迟时间序列数据
- 数据整合与重组:合并组织、网络与链路性能数据,整理成易于分析的格式
- 计算平均值:通过JavaScript代码节点计算最近5个时间点的平均丢包率和延迟
- 异常过滤:筛选出平均延迟超过300ms或丢包率超过2%的网络
- 告警去重:查询Redis数据库判断该网络是否已有未清除告警
- 发送告警通知:对无重复告警的异常网络发送带有网络名称和链接的Microsoft Teams消息
- 告警记录:将告警信息写入Redis,设置3小时过期,过期后若问题未解决将重新触发告警
涉及的系统或服务
- Cisco Meraki Dashboard API:获取组织、网络及设备链路性能数据
- Redis数据库:存储和管理告警状态,实现告警去重和TTL过期机制
- Microsoft Teams:推送链路异常告警消息,快速通知技术团队
- n8n自动化平台:实现流程自动化编排,包括HTTP请求、代码处理、数据合并、触发器等节点
适用人群或使用价值
- 网络运维工程师和IT支持团队,提升网络健康状态监控的自动化和精准度
- 企业级网络管理员,减少因链路异常问题导致的业务中断风险
- 运维自动化专家,构建可扩展、可维护的网络告警系统
- 使用Cisco Meraki设备的组织,通过本工作流实现无缝集成的链路性能监测和告警
- 需要实时通过协作工具(如Teams)响应网络异常的技术团队
此工作流通过紧密结合Meraki设备API与现代自动化技术,打造了一套高效、智能的网络链路质量监控与告警系统,显著提升了网络故障的发现速度和响应效率,助力企业保障业务连续性。