Help us improve your experience.

Let us know what you think.

Do you have time for a two-minute survey?

 
在此页面上
 

示例:在 QFX 系列交换机上使用叠加 ping 和叠加跟踪路由对 VXLAN 叠加网络进行故障排除

在虚拟可扩展 LAN (VXLAN) 叠加网络中,现有的 pingtraceroute 命令可以验证在底层物理网络中充当虚拟隧道端点 (VTEP) 的两台瞻博网络设备之间的基本连接。但是,在两个 VTEP 之间,可能存在通过中间设备到相同目标的多个路由,并且 ping 和 traceroute 数据包可能会成功到达其目标,而数据包通常转发的另一个路由中存在连接问题。

在适用于QFX5100交换机的 Junos OS 14.1X53-D30 版中引入overlay参数和其他选项后,您可以使用和traceroute命令对 ping VXLAN 叠加网络进行故障排除。

要使 ping 和跟踪路由机制在 VXLAN 叠加网络中正常工作,ping 和跟踪路由数据包(也称为操作、管理和管理 (OAM) 数据包)必须使用与通过 VXLAN 网段转发的数据包相同的 VXLAN UDP 标头(外部标头)进行封装,并可能存在连接问题。如果出现任何连接问题,叠加 OAM 数据包会遇到与数据包相同的问题。

此示例说明如何在 VTEP 上使用叠加 ping 和 traceroute 来验证 VXLAN 叠加网络中的以下内容:

  • 场景 1 — 验证是否在另一个 VTEP 上配置了特定的 VXLAN。

  • 场景 2 — 验证特定端点的 MAC 地址是否与其他 VTEP 上的 VXLAN 相关联。

  • 方案 3 - 验证发送和接收终结点之间的特定数据流中不存在任何问题。

注意:

发出 ping overlaytraceroute overlay 命令时,发出命令的源 VTEP 和接收 ping 或 traceroute 数据包的目标 VTEP 必须是支持叠加 ping 和 traceroute 的瞻博网络设备。

要求

此示例使用以下硬件和软件组件:

  • 直接运行应用程序的三个物理(裸机)服务器。

  • 两台运行 Junos OS 14.1X53-D30 或更高版本软件的 QFX5100 交换机。这些交换机用作 VTEP。

  • 两个第 3 层路由器,可以是瞻博网络路由器或其他供应商提供的路由器。

在发出 ping overlaytraceroute overlay 命令之前,请收集用于特定方案的每个参数(例如 IP 地址或 MAC 地址)所需的信息。请参阅 表 1 以确定每个方案使用哪些参数。

概述和拓扑

图 1 所示的 VXLAN 叠加网络拓扑包括直接运行应用程序的物理服务器 A、B 和 C。物理服务器 A 和 B 上的应用程序需要与物理服务器 C 上的应用程序通信。这些服务器位于同一子网上,因此应用程序之间的通信在第 2 层进行,VXLAN 封装或隧道用于通过第 3 层网络传输其数据包。

图 1:使用叠加 ping 和路由跟踪对 VXLAN 叠加网络 Using Overlay Ping and Traceroute to Troubleshoot a VXLAN Overlay Network进行故障排除

在此拓扑中,有两台用作 VTEP 的 QFX5100 交换机。VTEP1 为物理服务器 A 和 B 启动和终止 VXLAN 隧道,VTEP2 对物理服务器 C 执行相同的操作。VTEP1 和 VTEP2 位于 VXLAN 100 中。

从物理服务器 A 发送的数据包通常会路由到 IP 地址为 192.0.2.30 的第 3 层路由器,以到达物理服务器 C。

在此 VXLAN 叠加网络拓扑中,物理服务器 A 和 C 之间会出现通信问题。要排除此数据流的问题,您可以在 VTEP1(源 VTEP 或 )上启动ping overlaytraceroute overlay和命令,并将 VTEP2 指定为目标 VTEP 或 tunnel-dsttunnel-src

ping overlaytraceroute overlay命令包括多个参数。表 1 说明了用途,并为方案 1、2 和 3 中使用的每个参数提供了一个值。

表 1 不包括所有可用 ping overlay 参数和 traceroute overlay 参数。此示例使用这些省略参数的默认值。

表 1:方案 1、2 和 3 的 Ping 和跟踪路由叠加网络参数值

ping overlaytraceroute overlay 参数

描述

应用参数的方案

价值

tunnel-type

标识要排除故障的隧道类型。

VXLAN

vni

此示例中使用的 VXLAN 的 VXLAN 网络标识符 (VNI)。

100

tunnel-src

VTEP1 的 IP 地址,您可以在其上启动叠加 ping 或跟踪路由。

192.0.2.10

tunnel-dst

VTEP2 的 IP 地址,接收叠加 ping 或路由跟踪数据包。

192.0.2.20

mac

物理服务器 C 的 MAC 地址,即目标端点。

仅限方案 2 和 3

00:00:5E:00:53:cc

count

VTEP1 发送的叠加 ping 请求数。

注意:

count 参数不适用于叠加跟踪路由。

5

hash-source-mac

物理服务器 A 的 MAC 地址,即源端点。

仅限方案 3

00:00:5E:00:53:aa

hash-destination-mac

物理服务器 C 的 MAC 地址,即目标端点。

注意:

为场景 3 指定此参数时,MAC 地址必须与为参数指定的 mac MAC 地址相同。

仅限方案 3

00:00:5E:00:53:cc

hash-source-address

物理服务器 A 的 IP 地址。

仅限方案 3

198.51.100.1

hash-destination-address

物理服务器 C 的 IP 地址。

仅限方案 3

198.51.100.3

hash-vlan

源端点的 VLAN ID。

注意:

如果源端点不是 VLAN 的成员,则无需使用此参数。

仅限方案 3

150

hash-input-interface

源自数据流的 VTEP1 接口。

仅限方案 3

xe-0/0/2

hash-protocol

数据流中使用的协议的值。

仅限方案 3

17

hash-source-port

外部 TCP/UDP 源端口的值。

仅限方案 3

4456

hash-destination-port

外部 UDP 目标端口的值。

仅限方案 3

4540

表 1 包括几个哈希参数,用于方案 3。对于其中每个参数,必须指定与要进行故障排除的数据流关联的值。根据您指定的值,系统会计算一个 VXLAN UDP 报头源端口散列,该散列包含在叠加 ping 和 traceroute 数据包的 VXLAN UDP 报头中。在 VXLAN UDP 报头中包含计算出的散列可以让叠加 ping 和 traceroute 数据包模拟您要排除故障的流中的数据包。

最佳实践:

使用哈希参数时,建议您为每个参数指定一个值。此准则的例外情况是 hash-vlan 参数,如果源端点不是 VLAN 的成员,则不必使用该参数。这种做法可确保覆盖 ping 和 traceroute 过程成功,并且每个命令的输出都是准确的。如果未为一个或多个哈希参数指定值,系统将发送可能包含不正确哈希值的 OAM 请求,并生成警告消息。

验证

本节包括以下验证任务:

场景 1:验证是否已在 VTEP2 上配置 VXLAN 100

目的

验证 VTEP2 上是否配置了 VNI 为 100 的 VXLAN。您可以使用叠加 ping 或跟踪路由来执行此验证。

行动

叠加平

在 VTEP1 上,启动叠加 ping:

叠加路由跟踪

在 VTEP1 上,启动叠加跟踪路由:

意义

示例叠加 ping 输出指示以下内容:

  • VTEP1 向 VTEP2 发送了 5 个 ping 请求,VTEP2 响应了每个请求。

  • VTEP2 表示未配置 100 的 VNI (Overlay-segment not present at RVTEP 192.0.2.20),并在对 VTEP1 的响应中包含此信息。

示例叠加跟踪路由输出指示以下内容:

  • 收到生存时间 (TTL) 值为 1 跳的叠加路由跟踪数据包后,第 3 层路由器会响应 VTEP1。

  • 收到 TTL 值为 2 跳的叠加跟踪路由数据包后,VTEP2 会响应 VTEP1。

  • VTEP2 表示未配置 100 的 VNI (Overlay-segment not present at RVTEP 192.0.2.20),并在对 VTEP1 的响应中包含此信息。

注意:

叠加 traceroute 输出的接收方时间戳列中的星号 (*) 表示接收叠加 traceroute 数据包的第 3 层路由器不是瞻博网络设备,或者是不支持叠加跟踪路由的瞻博网络设备。

鉴于叠加 ping 和 traceroute 的输出都指示 VXLAN 100 不存在,请在 VTEP2 上检查此配置。如果必须在 VTEP2 上配置 VNI 100,请在层次结构级别使用vni[edit vlans vlan-id vxlan]配置语句,然后重新发出 ping overlay or traceroute overlay 命令以验证现在是否已识别 VXLAN 100。

场景 2:验证目标端点的 MAC 地址是否在 VTEP2 上

目的

验证作为目标端点的物理服务器 C 的 MAC 地址 (00:00:5E:00:53:cc) 是否在 VTEP2 的转发表中。您可以使用叠加 ping 或跟踪路由来执行此验证。

行动

叠加平

在 VTEP1 上,启动叠加 ping:

叠加路由跟踪

在 VTEP1 上,启动叠加跟踪路由:

意义

示例叠加 ping 输出指示以下内容:

  • VTEP1 向 VTEP2 发送了 5 个 ping 请求,VTEP2 响应了每个请求。

  • VTEP2 已验证是否配置了 100Overlay-segment present at RVTEP 192.0.2.20 的 VNI,但物理服务器 C 的 MAC 地址不在转发表 (End-System Not Present) 中。VTEP2在对VTEP1的答复中纳入了这一信息。

示例叠加跟踪路由输出指示以下内容:

  • 收到 TTL 值为 1 跳的叠加路由跟踪数据包后,第 3 层路由器会响应 VTEP1。

  • 收到 TTL 值为 2 跳的叠加跟踪路由数据包后,VTEP2 会响应 VTEP1。

  • VTEP2 已验证是否配置了 100Overlay-segment present at RVTEP 192.0.2.20 的 VNI,但物理服务器 C 的 MAC 地址不在转发表 (End-System Not Present) 中。VTEP2在对VTEP1的答复中纳入了这一信息。

注意:

叠加 traceroute 输出的接收方时间戳列中的星号 (*) 表示接收叠加 traceroute 数据包的第 3 层路由器不是瞻博网络设备,或者是不支持叠加跟踪路由的瞻博网络设备。

鉴于叠加 ping 和 traceroute 的输出都指示 VTEP2 不知道物理服务器 C 的 MAC 地址,因此您必须进一步调查以确定此 MAC 地址不在 VTEP2 的转表中的原因。

方案 3:验证数据流

目的

验证不存在可能阻碍从物理服务器 A 到物理服务器 C 的数据流的问题。支持此流程的网络设备包括 VTEP1、IP 地址为 192.0.2.30 的第 3 层路由器和 VTEP2(请参阅 图 1)。

首先,使用叠加 ping,如果叠加 ping 结果指示存在问题,则使用叠加 traceroute 来确定问题存在于路径的哪一段中。

对于叠加 ping 和 traceroute,请使用散列参数指定有关此数据流中设备的信息,以便系统可以计算 VXLAN UDP 报头源端口散列,该散列包含在叠加 ping 和 traceroute 数据包的 VXLAN UDP 报头中。通过将计算出的哈希包含在 VXLAN UDP 报头中,叠加 ping 和 traceroute 数据包可以模拟此流中的数据包,这应该会产生更准确的 ping 和 traceroute 结果。

最佳实践:

使用哈希参数时,建议为每个参数指定一个值。此准则的例外情况是 hash-vlan 参数,如果源端点不是 VLAN 的成员,则不必使用该参数。这种做法可确保覆盖 ping 和 traceroute 过程成功,并且每个命令的输出都是准确的。如果未为一个或多个哈希参数指定值,系统将发送可能包含不正确哈希值的 OAM 请求,并生成警告消息。

行动

叠加平

在 VTEP1 上,启动叠加 ping:

叠加路由跟踪

如果需要,在 VTEP1 上,启动叠加跟踪路由:

意义

示例叠加 ping 输出表明 VTEP1 向 VTEP2 发送了 5 个 ping 请求,但 VTEP2 没有响应任何请求。VTEP2 未响应表示 VTEP1 与第 3 层路由器之间的路径或第 3 层路由器与 VTEP2 之间的路径存在连接问题。

要进一步排除问题所在路径,请使用叠加跟踪路由。示例叠加跟踪路由输出指示以下内容:

  • 收到 TTL 值为 1 跳的叠加跟踪路由数据包后,第 3 层路由器会响应 VTEP1,这表示 VTEP1 和第 3 层路由器之间的路径已打开。

  • VTEP2 不响应叠加跟踪路由数据包,这表示第 3 层路由器与 VTEP2 之间的路径可能已关闭。

注意:

叠加 traceroute 输出的接收方时间戳列中的星号 (*) 表示接收叠加 traceroute 数据包的第 3 层路由器不是瞻博网络设备,或者是不支持叠加跟踪路由的瞻博网络设备。

鉴于叠加 traceroute 输出表明第 3 层路由器与 VTEP2 之间存在连接问题,您必须进一步调查此路径段以确定问题的根源。