首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >ZoL块设备(zvol)导出的iSCSI - LIO失败,逻辑单元通信失败/读/写失败

ZoL块设备(zvol)导出的iSCSI - LIO失败,逻辑单元通信失败/读/写失败
EN

Ask Ubuntu用户
提问于 2021-02-11 11:51:10
回答 1查看 200关注 0票数 0

我有一个Ubuntu (20.04.2 -5.4.0-52-泛型#57-Ubuntu )存储设置,其中一个加密块设备通过ZoL导出到另一个Ubuntu (18.04.5-4.15.0-135-泛型),其中它被格式化为一个LVM设备。设置正常,直到重新安装服务器(因为它有一个问题,不能升级任何软件包)和客户端有一个NIC升级(2x10G-LACP)。重新安装后,它正常工作了大约三天(读和写),然后失败了。由于i/o错误,无法再访问存储挂载点。我已经检查了连接(网络和iscsi),它是好的,iscsi会话仍然连接和登录。我尝试过xfs_repair,但是在编写阶段(5,6和7)失败了。zfs将所有设备联机,并执行0错误的清除操作,使用smartctl进行检查,并且在任何磁盘上都没有问题。dd工作正常(读和写),但是任何其他类型的写都失败了。

在客户机上,我收到了以下错误消息:

代码语言:javascript
复制
[  387.103390] sd 7:0:0:0: [sde] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[  387.103417] sd 7:0:0:0: [sde] tag#0 Sense Key : Not Ready [current] [descriptor]
[  387.103423] sd 7:0:0:0: [sde] tag#0 Add. Sense: Logical unit communication failure
[  387.103437] sd 7:0:0:0: [sde] tag#0 CDB: Write(16) 8a 00 00 00 00 00 00 00 08 08 00 00 00 01 00 00

存储上的配置如下:

代码语言:javascript
复制
targetcli shell version 2.1.51
Copyright 2011-2013 by Datera, Inc and others.
For help on commands, type 'help'.

/> ls
o- / ......................................................................................................................... [...]
  o- backstores .............................................................................................................. [...]
  | o- block .................................................................................................. [Storage Objects: 1]
  | | o- name-disk ................................... [/dev/zvol/tank/dataset-name/name-iscsi (67.0TiB) write-thru activated]
  | |   o- alua ................................................................................................... [ALUA Groups: 1]
  | |     o- default_tg_pt_gp ....................................................................... [ALUA state: Active/optimized]
  | o- fileio ................................................................................................. [Storage Objects: 0]
  | o- pscsi .................................................................................................. [Storage Objects: 0]
  | o- ramdisk ................................................................................................ [Storage Objects: 0]
  o- iscsi ............................................................................................................ [Targets: 1]
  | o- iqn.2003-01.org.linux-iscsi.storage-name.x8664:sn.0e03591de8ee .............................................. [TPGs: 1]
  |   o- tpg1 .................................................................................................. [gen-acls, no-auth]
  |     o- acls .......................................................................................................... [ACLs: 0]
  |     o- luns .......................................................................................................... [LUNs: 1]
  |     | o- lun0 .............................. [block/name-disk (/dev/zvol/tank/dataset-name/name-iscsi) (default_tg_pt_gp)]
  |     o- portals .................................................................................................... [Portals: 1]
  |       o- 0.0.0.0:3260 ..................................................................................................... [OK]
  o- loopback ......................................................................................................... [Targets: 0]
  o- vhost ............................................................................................................ [Targets: 0]
  o- xen-pvscsi ....................................................................................................... [Targets: 0]

对于每个写命令,在存储中,我都出现了如下dmesg中的错误:

代码语言:javascript
复制
[  316.061150] bio error: 00000000970258be,  err: 3
[  316.061153] bio error: 00000000a3caa1b4,  err: 3
[  316.061161] bio error: 00000000b8d1298b,  err: 3
[  316.061166] bio error: 000000001e0ef7b8,  err: 3
[  316.061168] bio error: 00000000a6d861a8,  err: 3
[  316.061185] bio error: 00000000a58973e3,  err: 3
[  316.061206] bio error: 00000000c05c3fc4,  err: 3
[  316.061210] bio error: 000000000ddb63f1,  err: 3
[  316.061213] bio error: 0000000060438ff5,  err: 3
[  316.061218] bio error: 00000000cd469a8e,  err: 3
[  316.061223] bio error: 000000000b873ec9,  err: 3
[  316.061227] bio error: 00000000730b5a09,  err: 3
[  316.061230] bio error: 00000000652b9a7c,  err: 3
[  316.061233] bio error: 00000000969b8d13,  err: 3
[  316.061237] bio error: 0000000079fd9679,  err: 3

在客户端,我有一个版本:

代码语言:javascript
复制
 iscsiadm --version
iscsiadm version 2.0-874

我还尝试用Ubuntu20.04将iscsi目标导出到另一个客户端,我也遇到了同样的问题,这让我认为它来自存储。我已经从一个保存文件中恢复了targetcli配置,甚至重新安装了存储,但是没有帮助。我已经在网上搜索了一个多星期了,一直找不到解决办法。我还发现我有这样的警告:

代码语言:javascript
复制
WARNING: PV /dev/PV-name in VG VG-name is using an old PV header, modify the VG to update.

所以我试着:

代码语言:javascript
复制
$vgck --updatemetadata VG

它删除了VG中的元数据,但由于同样的问题而无法写入它。

其他可能不相关的检查,我在存储上有MTU=9000,并将其从netplan配置中删除。

如果我漏掉了什么请告诉我。任何想法都会受到赞赏。

EN

回答 1

Ask Ubuntu用户

发布于 2021-06-23 13:25:48

我终于发现了造成这一切的原因。显然配额被绕过了,存储空间也被填满了,我不知道为什么,也不知道到底是怎么回事。我添加了另一个zfs池(将磁盘移动到一个更大的底盘上),删除了原来的内存,这样我就可以快照它,zfs将快照发送到新的池中。在此之后,我能够修复LVM和XFS元数据,并用数据重新挂载块设备。

票数 1
EN
页面原文内容由Ask Ubuntu提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://askubuntu.com/questions/1315536

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档