首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >网工干货|华为 iStack 堆叠 & CSS 集群全解析,园区 / 数据中心组网必看

网工干货|华为 iStack 堆叠 & CSS 集群全解析,园区 / 数据中心组网必看

作者头像
ICT系统集成阿祥
发布2026-06-24 19:41:40
发布2026-06-24 19:41:40
1460
举报
文章被收录于专栏:数通数通

导语

做企业园区、数据中心运维的网工,一定绕不开交换机横向虚拟化。华为两大核心技术:盒式交换机用iStack 堆叠,高端框式核心交换机用CSS 集群,二者都能把多台物理交换机虚拟成一台逻辑设备,简化运维、消除单点故障、提升链路利用率。

很多新手配置堆叠只做基础堆叠口,漏掉 MAD 多主检测,一旦堆叠线缆断裂发生「堆叠分裂」,两套相同 IP/MAC 的堆叠会全网 ARP 冲突、大面积断网。今天完整覆盖概念、选型、原理、完整含 MAD 配置、避坑指南,看完直接落地生产组网!

一、基础概念:堆叠 iStack vs 集群 CSS,先分清

1. iStack 智能堆叠(接入 / 汇聚盒式交换机专用)

将多台盒式交换机(S5700/S6720 等)通过堆叠线缆互联,逻辑合并为单台设备

  • 适用场景:企业接入层、中小型汇聚层,高密度端口扩展
  • 连接方式两种: 1)堆叠卡堆叠:专用堆叠卡 + 高速堆叠线缆,带宽高、稳定性强 2)业务口堆叠:复用设备万兆 / 40G 业务光口做堆叠端口,无需额外硬件,灵活低成本

2. CSS 集群交换系统(核心框式交换机专用)

仅支持2 台高端框式交换机(S7700/S9700/S12700)组合,虚拟成一台核心设备,分为传统 CSS、CSS2 两代架构。

  • 适用场景:园区核心、中小型数据中心骨干,大带宽、高可靠核心层
  • 架构优势(CSS2):转发与主控分离,单框单主控故障不影响整机流量转发,实现「1+N 主控备份」

堆叠 & 集群核心相同点

  1. 统一管理:整套系统共用1 个管理 IP、1 套配置、1 个系统 MAC,任意设备 Console / 远程登录即可全局运维
  2. 无环组网:搭配跨设备 Eth-Trunk 链路聚合,无需部署 MSTP、VRRP,链路全部负载分担,带宽利用率拉满
  3. 自动同步:新增设备自动同步主设备系统软件、完整配置,即插即用

堆叠 & 集群核心区别对照表

二、iStack 堆叠深度拆解:角色、选举、拓扑、风险防护

1. 堆叠三大角色

一套堆叠系统固定三类设备,由堆叠优先级决定角色(数值越大优先级越高):

  1. Master 主交换机:全局管理整个堆叠,唯一一台,保存整套系统配置
  2. Standby 备交换机:主设备故障时毫秒级接管业务,唯一备份设备
  3. Slave 从交换机:负责业务转发,多台存在;备机故障时自动晋升为备用

2. 主备交换机选举规则

(1)Master 主交换机选举优先级(依次判断
  1. 已上电运行设备 > 刚启动设备(上电先后优先)
  2. 堆叠优先级数值高优先
  3. 优先级相同,MAC 地址更小胜出
(2)Standby 备交换机选举

主设备选定后,剩余设备中优先级最高、MAC 最小的设备自动成为备机。

3. 两种堆叠拓扑

  1. 链形堆叠:串联设备,布线简单;中间设备断电会造成堆叠分裂,适合小型固定机房
  2. 环形堆叠:首尾设备互联形成环路,堆叠链路冗余,单条堆叠线故障不分裂,生产环境推荐

4. 堆叠致命隐患:堆叠分裂 & MAD 多主检测(必配!)

什么是堆叠分裂?

堆叠线缆断裂、设备热拔插,一套堆叠拆分成两套独立子堆叠。两套系统共用同一个 IP、MAC,全网出现 ARP / 表项冲突,直接大面积断网、卡顿丢包。

MAD 多主检测:堆叠分裂的 “急救方案”

MAD 会实时探测堆叠状态,分裂后两套堆叠自动竞争:

  • Detect(竞争成功):正常转发业务
  • Recovery(竞争失败):自动关闭所有业务端口(仅保留管理 / 堆叠口),杜绝 IP/MAC 冲突

MAD 两种部署方式(互斥,不可同时配置)

  1. 直连检测:设备之间单独拉一条 MAD 检测线缆,适合设备数量少的场景,分 Full-mesh 全互联、中间设备中转两种模式
  1. 代理检测:复用现有上联 Eth-Trunk 链路,无需额外布线,不占用单独端口,企业组网首选

5. 堆叠关键运维机制

  1. 软件 & 配置自动同步:新加入交换机自动从 Master 同步系统版本、完整配置,版本不兼容会自动升级重启并入堆叠
  2. 成员上下线自动调整 新增设备:上电后自动成为从机,分配唯一堆叠 ID,同步配置不影响现有业务 设备退出:主设备故障,备机自动升主;从机下线,系统重新计算拓扑,流量自动切换
  3. 堆叠平滑升级:支持分区升级(active/backup 区域),升级过程业务不中断,适合 7×24 小时在线业务

三、CSS 集群核心详解(高端核心专属)

1. 集群基础角色

仅两台框式设备,分为 Master 主框、Standby 备框,通过 CSS-Link 集群链路同步控制平面、转发平面所有表项。

  • CSS ID:每台框式设备唯一标识,接口编号携带 ID 区分两台设备端口
  • CSS 优先级:数值越高,越容易选举为主核心交换机

2. 两代 CSS 架构差异

  • 传统 CSS:集群流量、框内转发全部经过主控板,主控故障会中断整机流量,仅支持集群卡、业务口两种连接方式
  • CSS2(第二代集群):交换网板转发分离,跨框、框内流量无需经过主控;单块主控故障不影响业务转发,支持「1+N 主控冗余」,大型数据中心标配

3. CSS 集群组网优势

两台核心虚拟为一台,下联接入堆叠做跨设备 Eth-Trunk,完美替代传统「双核心 + VRRP+MSTP」老旧方案:

  • 无需三层网关冗余协议,简化配置,减少故障点
  • 上下行链路全部负载分担,带宽利用率翻倍
  • 单台核心整机断电,业务毫秒级切换,无感知故障

四、完整配置示例(快速上手)

示例 1:三台盒式环形 iStack 堆叠(基础堆叠配置)

拓扑:SW0 (Master,slot0) ↔ SW1 (Slave,slot1) ↔ SW2 (Slave,slot2),环形堆叠

SW0(堆叠 ID0,优先级 200,优先成为 Master)
代码语言:javascript
复制
system-view
sysname SW0
# 配置堆叠优先级,数值越大越优先为主
stack slot 0 priority 200
# 创建逻辑堆叠口0/1,绑定物理堆叠端口G0/0/27
interface stack-port 0/1
 port interface GigabitEthernet 0/0/27 enable
# 创建逻辑堆叠口0/2,绑定物理堆叠端口G0/0/28
interface stack-port 0/2
 port interface GigabitEthernet 0/0/28 enable
SW1(堆叠 ID1)
代码语言:javascript
复制
system-view
sysname SW1
# 修改堆叠ID,修改后需重启生效
stack slot 0 renumber 1
# 逻辑堆叠口
interface stack-port 1/1
 port interface GigabitEthernet 0/0/27 enable
interface stack-port 1/2
 port interface GigabitEthernet 0/0/28 enable

SW2(堆叠 ID2)

代码语言:javascript
复制
system-view
sysname SW2
stack slot 0 renumber 2
interface stack-port 2/1
 port interface GigabitEthernet 0/0/27 enable
interface stack-port 2/2
 port interface GigabitEthernet 0/0/28 enable

接线规则:本端 stack-port n/1 必须对接对端 stack-port m/2,否则堆叠无法建立

示例 2:MAD 直连检测配置(独立线缆,小型堆叠推荐)

三台堆叠设备两两拉一根专用 MAD 检测线,接口 G0/0/5 做 MAD 直连口

代码语言:javascript
复制
# SW0配置
system-view
interface GigabitEthernet 0/0/5
 mad detect mode direct
# SW1配置
system-view
interface GigabitEthernet 1/0/5
 mad detect mode direct
# SW2配置
system-view
interface GigabitEthernet 2/0/5
 mad detect mode direct

⚠️ 注意:配置mad detect mode direct后该端口会被阻塞,不能承载业务,仅做检测链路。

示例 3:MAD 代理检测配置(复用上联 Eth-Trunk,园区主流)

堆叠上联核心交换机 SW-D 做代理,Eth-Trunk1 承载业务 + MAD 检测,无需额外布线

堆叠系统(SW0/SW1/SW2 统一配置,堆叠内一次配置全局生效)
代码语言:javascript
复制
system-view
# 创建上联聚合口
interface Eth-Trunk 1
 mode lacp-static
 # 开启代理MAD检测
 mad detect mode relay
# 将三台设备上联口加入聚合
interface GigabitEthernet 0/0/10
 eth-trunk 1
interface GigabitEthernet 1/0/10
 eth-trunk 1
interface GigabitEthernet 2/0/10
 eth-trunk 1

代理交换机 SW-D 配置

代码语言:javascript
复制
system-view
interface Eth-Trunk 1
 # 开启MAD代理转发功能
 mad relay
# 接入堆叠上联端口
interface GigabitEthernet 0/0/10
 eth-trunk 1
interface GigabitEthernet 0/0/11
 eth-trunk 1
interface GigabitEthernet 0/0/12
 eth-trunk 1

示例 4:CSS 集群(业务口 LPU 模式完整配置)

主框 SwitchA(CSS ID1,优先级 100)
代码语言:javascript
复制
system-view
sysname SwitchA
# 设置集群模式为业务口集群
set css mode lpu
set css id 1
set css priority 100
# 创建集群逻辑端口
interface css-port 1
 port interface XGigabitEthernet 1/0/1 to XGigabitEthernet 1/0/2 enable
interface css-port 2
 port interface XGigabitEthernet 2/0/1 to XGigabitEthernet 2/0/2 enable
# 使能集群,重启生效
css enable
reboot

备框 SwitchB(CSS ID2,优先级 10)

代码语言:javascript
复制
system-view
sysname SwitchB
set css mode lpu
set css id 2
set css priority 10
interface css-port 1
 port interface XGigabitEthernet 1/0/1 to XGigabitEthernet 1/0/2 enable
interface css-port 2
 port interface XGigabitEthernet 2/0/1 to XGigabitEthernet 2/0/2 enable
css enable
reboot

常用 MAD & 堆叠查看排错命令

代码语言:javascript
复制
# 查看完整MAD检测配置、状态
display mad verbose
# 查看堆叠拓扑、成员角色、优先级
display stack
# 查看堆叠端口状态
display interface stack-port
# 查看集群运行状态
display css status

五、组网选型 & 避坑指南

1. 什么时候选堆叠 iStack?

  • 接入层、中小型汇聚,需要大量接入端口
  • 预算有限,复用现有业务光口做堆叠,无需额外堆叠卡
  • 设备数量≥3 台,需要横向扩展端口密度

2. 什么时候选集群 CSS?

  • 园区核心、数据中心骨干,使用 S7700/S12700 高端框式交换机
  • 对转发可靠性、主控冗余要求极高,业务不能中断
  • 核心仅部署两台设备,追求毫秒级整机故障切换

3. 运维避坑 5 条黄金规则

  1. 生产堆叠必须配置 MAD 检测,只做堆叠不做 MAD 属于重大网络隐患,堆叠分裂直接全网瘫痪
  2. MAD 两种模式互斥,一套堆叠只能选直连 / 代理其中一种,不能同时配置
  3. 生产环境优先环形堆叠,链形堆叠仅用于临时测试;环形堆叠搭配代理 MAD 最优
  4. 修改堆叠 ID、优先级前必须 save 保存配置,修改后设备需要重启生效
  5. 跨设备 Eth-Trunk 搭配流量本地优先转发,减少堆叠线缆流量压力
  6. MAD 直连检测端口禁止跑业务;代理检测复用现有上联聚合口,不额外占用端口,推荐园区使用

结尾

iStack 堆叠、CSS 集群是华为企业网虚拟化的核心技术,把多台设备 “合而为一”,大幅降低运维成本、提升网络可靠性。接入用堆叠、核心用集群,搭配链路聚合 + MAD 多主检测,才能搭建一套零环、高可用、无分裂风险的标准园区网络。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-06-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 ICT系统集成阿祥 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 导语
  • 一、基础概念:堆叠 iStack vs 集群 CSS,先分清
    • 1. iStack 智能堆叠(接入 / 汇聚盒式交换机专用)
    • 2. CSS 集群交换系统(核心框式交换机专用)
    • 堆叠 & 集群核心相同点
  • 二、iStack 堆叠深度拆解:角色、选举、拓扑、风险防护
    • 1. 堆叠三大角色
    • 2. 主备交换机选举规则
      • (1)Master 主交换机选举优先级(依次判断)
      • (2)Standby 备交换机选举
    • 3. 两种堆叠拓扑
    • 4. 堆叠致命隐患:堆叠分裂 & MAD 多主检测(必配!)
      • 什么是堆叠分裂?
  • 三、CSS 集群核心详解(高端核心专属)
    • 1. 集群基础角色
    • 2. 两代 CSS 架构差异
    • 3. CSS 集群组网优势
  • 四、完整配置示例(快速上手)
    • 示例 1:三台盒式环形 iStack 堆叠(基础堆叠配置)
      • SW0(堆叠 ID0,优先级 200,优先成为 Master)
      • SW1(堆叠 ID1)
    • 示例 2:MAD 直连检测配置(独立线缆,小型堆叠推荐)
    • 示例 3:MAD 代理检测配置(复用上联 Eth-Trunk,园区主流)
      • 堆叠系统(SW0/SW1/SW2 统一配置,堆叠内一次配置全局生效)
    • 示例 4:CSS 集群(业务口 LPU 模式完整配置)
      • 主框 SwitchA(CSS ID1,优先级 100)
  • 五、组网选型 & 避坑指南
    • 1. 什么时候选堆叠 iStack?
    • 2. 什么时候选集群 CSS?
    • 3. 运维避坑 5 条黄金规则
  • 结尾
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档