如何读取通过lzf压缩过滤器压缩的数据集,并将其更改为原生HDF5第三方过滤器,如szip或zlib?简单地像How to read HDF5 files in Python中显示的那样读取它,并在编写数据集时使用指定的压缩来写入它是否可行?
发布于 2020-10-29 22:53:10
正如@bnaecker所说,您可以复制现有的数据集,并使用不同的压缩过滤器创建新的数据集。新数据集可以在同一文件中,也可以在新文件中。注意:szip需要特殊的许可,所以我创建了一个从lzf到gzip的示例。请参见下面的示例。对于任何两个压缩过滤器,该过程都是相同的。只需更改compression=value即可。
import h5py
import numpy as np
filename = "SO_64582861.h5"
# Create random data
arr1 = np.random.uniform(-1, 1, size=(10, 3))
# Create intial HDF5 file
with h5py.File(filename, "w") as h5f:
h5f.create_dataset("ds_lzf", data=arr1, compression="lzf")
# Re-Open HDF5 file in 'append' mode
# Copy ds_lzf to ds_gzip with different compression setting
# could also copy to a second HDF5 file
with h5py.File(filename, "a") as h5f:
# List all groups
print("Keys: %s" % h5f.keys())
arr2 = h5f["ds_lzf"][:]
h5f.create_dataset("ds_gzip", data=arr2, compression="gzip")https://stackoverflow.com/questions/64582861
复制相似问题