我有一个Ubuntu (20.04.2 -5.4.0-52-泛型#57-Ubuntu )存储设置,其中一个加密块设备通过ZoL导出到另一个Ubuntu (18.04.5-4.15.0-135-泛型),其中它被格式化为一个LVM设备。设置正常,直到重新安装服务器(因为它有一个问题,不能升级任何软件包)和客户端有一个NIC升级(2x10G-LACP)。重新安装后,它正常工作了大约三天(读和写),然后失败了。由于i/o错误,无法再访问存储挂载点。我已经检查了连接(网络和iscsi),它是好的,iscsi会话仍然连接和登录。我尝试过xfs_repair,但是在编写阶段(5,6和7)失败了。zfs将所有设备联机,并执行0错误的清除操作,使用smartctl进行检查,并且在任何磁盘上都没有问题。dd工作正常(读和写),但是任何其他类型的写都失败了。
在客户机上,我收到了以下错误消息:
[ 387.103390] sd 7:0:0:0: [sde] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[ 387.103417] sd 7:0:0:0: [sde] tag#0 Sense Key : Not Ready [current] [descriptor]
[ 387.103423] sd 7:0:0:0: [sde] tag#0 Add. Sense: Logical unit communication failure
[ 387.103437] sd 7:0:0:0: [sde] tag#0 CDB: Write(16) 8a 00 00 00 00 00 00 00 08 08 00 00 00 01 00 00存储上的配置如下:
targetcli shell version 2.1.51
Copyright 2011-2013 by Datera, Inc and others.
For help on commands, type 'help'.
/> ls
o- / ......................................................................................................................... [...]
o- backstores .............................................................................................................. [...]
| o- block .................................................................................................. [Storage Objects: 1]
| | o- name-disk ................................... [/dev/zvol/tank/dataset-name/name-iscsi (67.0TiB) write-thru activated]
| | o- alua ................................................................................................... [ALUA Groups: 1]
| | o- default_tg_pt_gp ....................................................................... [ALUA state: Active/optimized]
| o- fileio ................................................................................................. [Storage Objects: 0]
| o- pscsi .................................................................................................. [Storage Objects: 0]
| o- ramdisk ................................................................................................ [Storage Objects: 0]
o- iscsi ............................................................................................................ [Targets: 1]
| o- iqn.2003-01.org.linux-iscsi.storage-name.x8664:sn.0e03591de8ee .............................................. [TPGs: 1]
| o- tpg1 .................................................................................................. [gen-acls, no-auth]
| o- acls .......................................................................................................... [ACLs: 0]
| o- luns .......................................................................................................... [LUNs: 1]
| | o- lun0 .............................. [block/name-disk (/dev/zvol/tank/dataset-name/name-iscsi) (default_tg_pt_gp)]
| o- portals .................................................................................................... [Portals: 1]
| o- 0.0.0.0:3260 ..................................................................................................... [OK]
o- loopback ......................................................................................................... [Targets: 0]
o- vhost ............................................................................................................ [Targets: 0]
o- xen-pvscsi ....................................................................................................... [Targets: 0]对于每个写命令,在存储中,我都出现了如下dmesg中的错误:
[ 316.061150] bio error: 00000000970258be, err: 3
[ 316.061153] bio error: 00000000a3caa1b4, err: 3
[ 316.061161] bio error: 00000000b8d1298b, err: 3
[ 316.061166] bio error: 000000001e0ef7b8, err: 3
[ 316.061168] bio error: 00000000a6d861a8, err: 3
[ 316.061185] bio error: 00000000a58973e3, err: 3
[ 316.061206] bio error: 00000000c05c3fc4, err: 3
[ 316.061210] bio error: 000000000ddb63f1, err: 3
[ 316.061213] bio error: 0000000060438ff5, err: 3
[ 316.061218] bio error: 00000000cd469a8e, err: 3
[ 316.061223] bio error: 000000000b873ec9, err: 3
[ 316.061227] bio error: 00000000730b5a09, err: 3
[ 316.061230] bio error: 00000000652b9a7c, err: 3
[ 316.061233] bio error: 00000000969b8d13, err: 3
[ 316.061237] bio error: 0000000079fd9679, err: 3在客户端,我有一个版本:
iscsiadm --version
iscsiadm version 2.0-874我还尝试用Ubuntu20.04将iscsi目标导出到另一个客户端,我也遇到了同样的问题,这让我认为它来自存储。我已经从一个保存文件中恢复了targetcli配置,甚至重新安装了存储,但是没有帮助。我已经在网上搜索了一个多星期了,一直找不到解决办法。我还发现我有这样的警告:
WARNING: PV /dev/PV-name in VG VG-name is using an old PV header, modify the VG to update.所以我试着:
$vgck --updatemetadata VG它删除了VG中的元数据,但由于同样的问题而无法写入它。
其他可能不相关的检查,我在存储上有MTU=9000,并将其从netplan配置中删除。
如果我漏掉了什么请告诉我。任何想法都会受到赞赏。
发布于 2021-06-23 13:25:48
我终于发现了造成这一切的原因。显然配额被绕过了,存储空间也被填满了,我不知道为什么,也不知道到底是怎么回事。我添加了另一个zfs池(将磁盘移动到一个更大的底盘上),删除了原来的内存,这样我就可以快照它,zfs将快照发送到新的池中。在此之后,我能够修复LVM和XFS元数据,并用数据重新挂载块设备。
https://askubuntu.com/questions/1315536
复制相似问题