我实现了简单Widrow感知器和k均值聚类,并将结果与MNIST数据集进行了比较。由于这些算法的线性性质,我没有期望得到很好的结果。WH感知器的准确率为70%,k-均值为50%(我有单元测试,并与纯粹的随机机会1/10进行比较,我认为它们在某种程度上是正确的)。
我也给出了“提示”k-意思是在不同的数字周围设置初始的质心,这样它就能更快地收敛。
我认为k均值显示了这个结果,因为数字非常相似(6类似于8,8类似于9)。然后假设WH感知器的泛化能力优于k-均值.有人看过关于这个话题的文章/书吗?我想从严谨的数学角度来理解结果。
发布于 2016-09-19 00:53:26
比较K均值和感知器没有意义,它们是不同类型的算法。
K-均值根本没有泛化能力,因为它是一个无监督算法和泛化是有监督学习算法的一种性质。.
如果您将其更改为类似于一种监督算法,那么它的泛化能力将比感知器差,因为K-意味着它会倾向于对数据进行超适合,因为它被迫为每个数据点分配一个集群。
如果您想要比较感知器的性能与其他算法,您应该比较它的k-NN (K最近的邻居),随机森林,或支持向量机。
https://datascience.stackexchange.com/questions/14073
复制相似问题