Dask-ML支持pandas、Numpy、Sklearn、XGBoost、XArray、RAPIDS等等,对于常用的数据处理、建模分析是完全够用的。
得出结论:特征向量,加载矢量中,下采样,orthiter / gd / sgd(OnlinePCA.jl)和PCA(dask-ml)都会随着PC尺寸的增加而变得不准确,PCA实施不正确可能会降低加载矢量的准确性
Dask-ML 是一个用于分布式和并行机器学习的库,可与 Scikit-Learn 和 XGBoost 一起使用,以针对大型模型和数据集创建可扩展的训练和预测。