我的数据有问题
这是我的医疗数据库
(姓名、Value1、Value2、Value3、Value4)
联合10、20、30、40
联合9、12、21、33
诺亚8,22,18,10
安娜9,19,29,32
克拉克11,4,17,20
在医疗保健数据库中,一个人可能生病两次,三次或更多次--你可以看到我的数据库的例子--有两个jhon有两次记录,因为他病了两次
我使用k-表示的目的是获得两个集群(第1组:第1组,第2组:第2组)及其成员。
我想得到这样的输出:
第一组: jhon,clark
第二组:诺亚,安娜,约翰
你看,有两个jhon,一个成员可以是第1组和第2组,那么我如何解决这个问题呢?
发布于 2016-02-10 11:35:15
K-指的是每对步骤之间的迭代。你基本上是在
因此,如果您有约束,例如,所有them (sic)都应该属于同一个集群,则可以将其合并到步骤2中:您将需要找到最有可能同时分配它们的集群。
详情请参见带背景的约束k-均值聚类。
https://stackoverflow.com/questions/35312704
复制相似问题