有线服务级别预期 (SLE)
瞻博网络 Mist™ 云持续收集网络遥测数据,并使用机器学习来分析最终用户体验。您可以通过瞻博网络 Mist 有线服务级别预期 (SLE) 仪表板访问此信息,这些仪表板可帮助您评估网络的用户体验并主动解决任何问题。有线 SLE 仪表板显示任何给定时间点网络上有线客户端的用户体验。您可以使用这些交互式仪表板,在用户痛点变得太大之前识别出来,从而主动衡量和管理您的网络。
如需快速了解瞻博网络 Mist 有线 SLE,请观看以下视频:
查看系统性红斑狼疮指标
有线 SLE 仪表板显示 SLE 指标在特定时间范围内达到指定服务级别预期目标的时间百分比。这些指标分为分类器和子分类器,它们提供了更多详细信息来识别故障的具体原因。使用此信息,您可以轻松识别和解决影响最终用户体验的问题。
Mist 有线 SLE 提供以下指标来帮助您评估网络上的最终用户体验:
-
吞吐量
-
交换机运行状况
-
成功连接
若要在有线 SLE 仪表板上查看 SLE 指标,请单击 “监控 > 服务级别”,然后选择“ 有线 ”选项卡。
每个指标都有分类器和子分类器,它们显示信息以帮助你识别故障并缩小特定问题范围。要查看关联的子分类器,只需单击分类器。您将看到一个选项卡式视图,其中包括:
-
统计数据 - 显示 SLE 指标的总体成功率。
-
时间轴 - 显示故障的时间线。例如,仪表板可以显示一段时间内属于特定分类器的问题导致的不良用户分钟数。
-
分布 — 显示跨接口、交换机、VLAN 和客户端等不同属性的影响百分比。
-
受影响的项目—显示未能达到服务级别目标的特定项目。示例:交换机、接口和客户端。
下面是 吞吐量 指标视图的示例:
上图显示,网络仅在 38% 的时间内满足吞吐量要求。而且用户在剩下的 62% 的时间里都面临着吞吐量问题。分类器视图显示,影响吞吐量的问题中有 98% 属于接口异常类别,而 2% 的问题属于网络问题。
要访问分类器视图,请单击指标(例如,吞吐量),然后选择一个分类器(例如,接口异常)。下面是接口异常指标视图的示例:
当指标显示成功率为 100% 时,分类器不显示任何数据。
吞吐量
吞吐量指标显示有线用户可以在不中断的情况下传递流量的时间百分比。此分类器可帮助您评估网络并确定是否需要更高的带宽才能无缝运行。有几个因素会影响网络吞吐量,例如 MTU 不匹配、电缆故障以及设备以错误的速度协商。
吞吐量 SLE 有五个分类器:
-
拥塞 - 此分类器显示拥塞如何导致低吞吐量。它计算因拥塞而导致的输出丢弃次数。当数据包到达接口时,它们存储在缓冲区中。如果缓冲区已满,设备将开始丢弃数据包 (TxDrops)。分类器使用考虑以下三个比率的公式来确定“不良用户分钟数”是否由拥塞引起:
-
Tx丢弃到 TxPackets(传输的总字节数丢弃到传输的总数据包数)
-
Txbps 到链路速度(每秒传输到链路速度的总字节数)
-
Rx速度到链路速度(每秒接收的总字节数到链路速度)
-
-
拥塞上行链路 — 在以下情况下,SLE 仪表板会显示高拥塞上行链路:
-
其中一个邻居是交换机或路由器(通过 LLDP 知道)。
-
该端口是 STP 根端口。
-
与其他端口相比,上行链路端口的传输和接收数据包数更多。
聚合以太网链路和模块端口也可能造成拥塞。
-
-
接口异常 — 此分类器显示接口异常如何导致吞吐量低。SLE 仪表板从交换机收集有关接口异常的信息。接口异常分类器分为以下子分类器:
-
MTU 不匹配 — 作为管理员可以为每个接口设置最大传输单元 (MTU) 值。千兆以太网接口的默认值为 1514。要支持巨型帧,您需要配置 MTU 值 9216,这是路由 VLAN 接口上巨型帧的上限。请务必确保数据包路径上的 MTU 值一致,因为任何 MTU 不匹配都会导致数据包被丢弃或分段。在瞻博网络交换机中,您可以在命令输出的
show interface extensive
MTU 错误和输入错误部分中检查 MTU 不匹配。在 MTU 不匹配的情况下,每个输入错误或 MTU 错误都会导致“错误用户分钟”。 -
电缆问题 - 此子分类器显示受网络中电缆故障影响的用户分钟数。
-
协商失败 — 由于自动协商失败、双工冲突或用户设备设置配置错误,可能会出现端口延迟。此外,较旧的设备可能无法实现最大速度,并且可以以 100 Mbps 的较慢链路速度运行。此子分类器可识别并帮助缓解这些问题导致的用户时间错误实例。
-
-
风暴控制 — 风暴控制允许设备监控流量级别,并在超过设定的阈值或流量级别时丢弃广播、未知单播和组播数据包。这些阈值称为风暴控制级别或风暴控制带宽。默认情况下,风暴控制级别设置为瞻博网络交换机所有第 2 层接口上组合广播、组播和未知单播流量的 80%。风暴控制有助于防止流量风暴,但它也可能限制应用程序或客户端设备。此分类器可识别这些情况,并帮助用户主动缓解吞吐量问题。
-
网络 — 此分类器允许您在由于上行链路容量限制而导致吞吐量低于预期时监控用户分钟数。它根据从交换机发送到 Mist 云的数据包的往返时间 (RTT) 值来识别问题。网络分类器有两个子分类器,可帮助您查找这些问题:
-
延迟 - 显示受延迟影响的用户分钟数。延迟值是根据一段时间内 RTT 的平均值计算的。
-
抖动 - 显示受抖动影响的用户分钟数。抖动值是通过比较短时间内(过去 5 或 10 分钟)的 RTT 标准偏差与较长时间(一天或一周)内 RTT 的总体偏差来计算的。您可以查看特定交换机或站点的此信息。
-
交换机运行状况
交换机运行状况受多个因素影响,包括工作温度、功耗、CPU 和内存使用情况。监控交换机运行状况至关重要,因为 CPU 使用率高等问题会直接影响连接的客户端。例如,如果 CPU 利用率峰值达到 100%,则连接的接入点可能会失去连接,从而影响客户端的体验。“交换机运行状况”衡量指标可识别由以下情况(列为分类器)导致的不良用户分钟数:
-
无法访问交换机 — 无法访问交换机。
-
内存 - 内存利用率高于 80%。
-
CPU — 交换机 CPU 使用率高于 90%。
-
温度 — 交换机工作温度超过规定的阈值范围,高于最大限制或低于最低要求。有关瞻博网络交换机支持的工作温度的信息,请参阅瞻博网络 文档门户中的交换机硬件指南。
-
功率 — 交换机功耗高于可用功率的 90%。
成功连接
“成功连接”指标显示客户端是否成功连接到网络。它有助于评估连接失败的影响,并确定阻止客户端设备连接到网络的问题。
“成功连接”指标有两个分类器:
-
身份验证 — 每次客户端进行身份验证时,都会生成一个客户端事件。这些事件可以是成功事件,也可以是失败事件。此分类器可帮助您识别导致身份验证失败的问题。以下是 dot1x 身份验证失败的可能原因列表:
-
如果单个交换机端口无法进行身份验证,则可能是由于用户错误或端口配置错误。
-
如果所有交换机端口都无法进行身份验证,可能是因为:
- 交换机不会作为 NAS 客户端添加到 RADIUS 服务器中。
- 交换机和 RADIUS 服务器之间存在路由问题。
-
RADIUS 服务器已关闭。
-
如果所有交换机上的所有交换机端口都无法进行身份验证,则可能表示 RADIUS 服务器在该特定时刻暂时出现故障。
-
如果特定类型的设备(如 Windows 设备)无法进行身份验证,则可能表明存在与认证相关的问题。
-
-
DHCP — DHCP 侦听使交换机能够检查 DHCP 数据包并跟踪侦听表中的 IP-MAC 地址绑定。每次客户端连接到网络并且无法在一分钟内达到“绑定”状态时,此分类器都会添加失败事件。
注意:SLE 仪表板仅显示配置了 DHCP 侦听的交换机的 DHCP 故障。