问K-均值与感知器泛化能力
EN

Data Science用户

提问于 2016-09-19 00:22:02

回答 1查看 308关注 0票数 0

我实现了简单Widrow感知器和k均值聚类，并将结果与MNIST数据集进行了比较。由于这些算法的线性性质，我没有期望得到很好的结果。WH感知器的准确率为70%，k-均值为50%(我有单元测试，并与纯粹的随机机会1/10进行比较，我认为它们在某种程度上是正确的)。

我也给出了“提示”k-意思是在不同的数字周围设置初始的质心，这样它就能更快地收敛。

我认为k均值显示了这个结果，因为数字非常相似(6类似于8，8类似于9)。然后假设WH感知器的泛化能力优于k-均值.有人看过关于这个话题的文章/书吗？我想从严谨的数学角度来理解结果。

发布于 2016-09-19 00:53:26

比较K均值和感知器没有意义，它们是不同类型的算法。

K-均值根本没有泛化能力，因为它是一个无监督算法和泛化是有监督学习算法的一种性质。.

如果您将其更改为类似于一种监督算法，那么它的泛化能力将比感知器差，因为K-意味着它会倾向于对数据进行超适合，因为它被迫为每个数据点分配一个集群。

如果您想要比较感知器的性能与其他算法，您应该比较它的k-NN (K最近的邻居)，随机森林，或支持向量机。

票数 -1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/14073

复制

相似问题

问K-均值与感知器泛化能力EN