问如何用dask_ml运行主成分分析。我得到一个错误，“这个函数(tsqr)在高瘦矩阵的情况下支持QR分解”？
EN

Stack Overflow用户

提问于 2019-02-16 23:45:50

回答 1查看 270关注 0票数 0

我想对大约3000行6000列的数据进行降维。这里观察的数量(n_samples) <特征的数量(n_columns)。我不能使用dask-ml来达到这个效果，而同样的结果可以通过scikit学习来实现。我需要对现有代码进行哪些修改？

#### dask_ml
from dask_ml.decomposition import PCA
from dask_ml import preprocessing
import dask.array as da
import numpy as np

train = np.random.rand(3000,6000)
train = da.from_array(train,chunks=(100,100))
complete_pca = PCA().fit(train)

#### scikit learn
from sklearn.decomposition import PCA
from sklearn import preprocessing
import numpy as np

train = np.random.rand(3000,6000)
complete_pca = PCA().fit(train)

dask

dask-ml

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-02-20 08:30:32

Dask-ML中的PCA算法仅适用于瘦高矩阵。您可以尝试在dask.array中使用原始奇异值分解算法。此外，对于3000x6000矩阵，您可能也可以只使用一台机器。

对于这种规模的问题，添加像Dask-ML这样的东西可能会增加比您需要的更多的复杂性。如果Scikit-Learn对你有效，那么我会坚持下去。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/54724818

复制

相似问题

问如何用dask_ml运行主成分分析。我得到一个错误，“这个函数(tsqr)在高瘦矩阵的情况下支持QR分解”？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何用dask_ml运行主成分分析。我得到一个错误，“这个函数(tsqr)在高瘦矩阵的情况下支持QR分解”？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何用dask_ml运行主成分分析。我得到一个错误，“这个函数(tsqr)在高瘦矩阵的情况下支持QR分解”？
EN