早些时候,我发布了一个关于可视化和集群的问题。我想我的问题还不够清楚,所以我又发了一次。我希望这次我能更好地解释一下。我也为我以前的问题没有“接受答案”而道歉。直到有人指出我才知道我能做到。从现在起我一定会这么做的。
好吧。回到问题上。以前,我已经编写了一个python脚本来计算文档之间的相似性。现在,我将所有的数据写到记事本上,看起来如下:
(1, 6821): inf
(1, 8): 3.458911570
(1, 9): 7.448105193
(1, 10): inf
(1, 11): inf
(6821, 8): inf
(6821, 9): inf
(6821, 10): inf
(6821, 11): inf
(8, 9): 2.153308936
(8, 10): inf
(8, 11): 16.227647992
(9, 10): inf
(9, 11): 34.943139430
(10, 11): inf括号中的数字表示文档编号。它之后的值,是两个文档之间的距离。我想要的实际上是可视化工具或方法,可以创建表示每个文档编号的节点。例如,这里有6个不同的文档。因此,我希望创建6个表示文档编号的不同节点。然后,我希望有根据这些节点的距离将它们连接在一起的边。例如,文档1和8之间的距离是3.46,而文档1和9之间的距离是7.45。因此,1&8需要比1& 9更接近于集群。而具有'inf‘距离的文档对不应该有任何连接或边缘将它们连接在一起。
这听起来很容易,但我真的很难找到一个开源可视化工具,它可以有效地帮助我完成这个任务。我感谢任何建议。
发布于 2010-07-14 20:48:09
http://www.graphviz.org/
特别是,neato包:
$ cat similar.dot
graph g {
n1 -- n8 [ weight = 3.458911570 ];
n1 -- n9 [ weight = 7.448105193 ];
n8 -- n9 [ weight = 2.153308936 ];
n8 -- n11 [ weight = 16.227647992 ];
n9 -- n11 [ weight = 34.943139430 ];
n10;
n6821;
}
$ neato -Tpng similar.dot -o similar.png

发布于 2010-07-14 20:49:32
你试过GraphViz了吗?我用在这种情况下。我还没有试着改变节点连接的长度,您将不得不找出其中的一个。以示例图列表作为起点。
发布于 2010-07-14 21:37:01
处理是一个非常好的数据可视化工具(也是基于Java的语言)。可以把它看作是在Java中编写简化的OpenGL (您甚至可以在其中使用OpenGL ),再加上使用所有Java库的自由。您甚至可以将处理应用程序嵌入到另一个Swing或AWT应用程序中。
这是主页面和全新的维基。
你说你利用了皮顿。这里有一个黑客,所以您可以在这篇博客文章中使用Jython而不是Java。我还没试过但也许效果不错。使用另一种语言(还有一个JavaScript‘端口’,Processing.js)的唯一不足是,所有的示例都是针对处理语言的(基于Java的)。
https://stackoverflow.com/questions/3250328
复制相似问题