帮助我们改善您的体验。

让我们了解您的想法。

您是否能抽出两分钟的时间完成一份问卷调查?

close
keyboard_arrow_left
SRX 系列设备机箱群集用户指南
Table of Contents Expand all
list Table of Contents
keyboard_arrow_right

机器翻译对您有帮助吗?

starstarstarstarstar
Go to English page
免责声明:

我们将使用第三方机器翻译软件翻译本页面。瞻博网络虽已做出相当大的努力提供高质量译文,但无法保证其准确性。如果对译文信息的准确性有任何疑问,请参阅英文版本. 可下载的 PDF 仅提供英文版.

对 SRX 机箱群集中不进行故障切换的冗余组进行故障排除

date_range 30-May-23

问题

描述

高可用性 (HA) SRX 机箱群集中的冗余组 (RG) 不会进行故障切换。

环境

SRX 机箱群集

诊断

在属于机箱群集的 SRX 系列服务网关的命令提示符下,运行 show chassis cluster status 命令。

示例输出:

content_copy zoom_out_map
Cluster ID: 1
Node                     Priority     Status     Preempt    Manual failover


Redundancy group: 0 , Failover count: 0
node0                       150       primary        no               no
node1                       100       secondary      no               no


Redundancy group: 1 , Failover count: 0
node0                       255       primary        yes              no
node1                       100       secondary      yes              no

在示例输出中,检查不故障转移的冗余组的优先级。

分辨率

冗余组手动故障切换

  1. 检查之前是否使用命令启动 show chassis cluster status 了冗余组的手动故障转移。

    示例输出:

    content_copy zoom_out_map
    Cluster ID: 1
    Node                     Priority     Status     Preempt    Manual failover
    
    
    Redundancy group: 0 , Failover count: 0
    node0                       150       primary        yes             no
    node1                       100       secondary      yes             no
    
    
    Redundancy group: 1 , Failover count: 0
    node0                       255       primary        no              yes
    node1                       100       secondary      no              yes
    

    在示例输出中,Priority冗余组 1 (RG1) 255 的值为 ,状态Manual failoveryes为 ,这意味着之前启动了冗余组的手动故障转移。您必须重置冗余组优先级。

    注意:

    对冗余组进行手动故障切换后,我们建议您重置群集状态中的手动故障切换标志,以允许进一步的故障切换。

  2. 使用 重置 request chassis cluster failover reset redundancy-group <1-128>冗余组优先级。

    例如:

    content_copy zoom_out_map
    user@host> request chassis cluster failover reset redundancy-group 1
    root@srx> request chassis cluster failover reset redundancy-group 1    
    node0:
    --------------------------------------------------------------------------
    Successfully reset manual failover for redundancy group 1
    
     
    
    node1:
    --------------------------------------------------------------------------
    No reset required for redundancy group 1.
  3. 这必须解决问题并允许进一步的冗余组故障转移。如果这些步骤不能解决问题,请继续执行下一步部分。

  4. 如果要手动启动冗余组 x(编号为 1 到 128 的冗余组)故障切换,请参阅 了解机箱群集冗余组手动故障切换

冗余组自动故障切换

  1. 使用 show chassis cluster interfaces 命令检查控制和结构链路的配置和链路状态。

    分支 SRX 系列服务网关的示例输出:

    content_copy zoom_out_map
    {primary:node0}
    root@SRX_Branch> show chassis cluster interfaces
    Control link 0 name: fxp1
    Control link status: Up
    
    Fabric interfaces:
    Name Child-interface Status
    fab0 ge-0/0/2 down
    fab0
    fab1 ge-9/0/2 down
    fab1
    Fabric link status: down
    

    高端 SRX 系列服务网关的示例输出:

    content_copy zoom_out_map
    {primary:node0}
    root@SRX_HighEnd> show chassis cluster interfaces
    Control link 0 name: em0
    Control link 1 name: em1
    Control link status: up
    
    Fabric interfaces:
    Name Child-interface Status
    fab0 ge-0/0/5 down
    fab0
    Fabric link status: down
  2. 如果控制链路和交换矩阵链路均已启动,请继续执行步骤 3

  3. 检查已启动的接口监控或 IP 监控配置。如果配置不正确,请更正配置。如果配置正确,请继续执行步骤 4

  4. 检查命令输出 show chassis cluster status 中每个节点的优先级。

    • 如果优先级为 0,请参阅 JSRP(Junos OS 服务冗余协议)机箱群集的知识库文章 KB16869 和分支 SRX 系列防火墙的知识库文章 KB19431

    • 如果优先级为 255,请参阅 冗余组手动故障切换

    • 如果优先级介于 和 254 之间1,冗余组仍未进行故障转移,请继续执行下一步操作部分。

下一步是什么

  1. 如果这些步骤不能解决问题,请参阅知识库文章 KB15911 ,了解冗余组故障转移提示。

  2. 如果要进一步调试,请参阅知识库文章 KB21164 以检查调试日志。

  3. 要向瞻博网络支持团队提交 JTAC 案例,请参阅 客户支持数据收集 ,了解在创建 JTAC 案例之前应收集的数据以帮助排除故障。

external-footer-nav