首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >可视化和聚类

可视化和聚类
EN

Stack Overflow用户
提问于 2010-07-14 20:42:31
回答 3查看 982关注 0票数 1

早些时候,我发布了一个关于可视化和集群的问题。我想我的问题还不够清楚,所以我又发了一次。我希望这次我能更好地解释一下。我也为我以前的问题没有“接受答案”而道歉。直到有人指出我才知道我能做到。从现在起我一定会这么做的。

好吧。回到问题上。以前,我已经编写了一个python脚本来计算文档之间的相似性。现在,我将所有的数据写到记事本上,看起来如下:

代码语言:javascript
复制
(1, 6821): inf

(1, 8): 3.458911570

(1, 9): 7.448105193

(1, 10): inf

(1, 11): inf

(6821, 8): inf

(6821, 9): inf

(6821, 10): inf

(6821, 11): inf

(8, 9): 2.153308936

(8, 10): inf

(8, 11): 16.227647992

(9, 10): inf

(9, 11): 34.943139430

(10, 11): inf

括号中的数字表示文档编号。它之后的值,是两个文档之间的距离。我想要的实际上是可视化工具或方法,可以创建表示每个文档编号的节点。例如,这里有6个不同的文档。因此,我希望创建6个表示文档编号的不同节点。然后,我希望有根据这些节点的距离将它们连接在一起的边。例如,文档1和8之间的距离是3.46,而文档1和9之间的距离是7.45。因此,1&8需要比1& 9更接近于集群。而具有'inf‘距离的文档对不应该有任何连接或边缘将它们连接在一起。

这听起来很容易,但我真的很难找到一个开源可视化工具,它可以有效地帮助我完成这个任务。我感谢任何建议。

EN

回答 3

Stack Overflow用户

回答已采纳

发布于 2010-07-14 20:48:09

http://www.graphviz.org/

特别是,neato包:

代码语言:javascript
复制
$ cat similar.dot
graph g {
   n1 -- n8 [ weight = 3.458911570 ];
   n1 -- n9 [ weight = 7.448105193 ];
   n8 -- n9 [ weight = 2.153308936 ];
   n8 -- n11 [ weight = 16.227647992 ];
   n9 -- n11 [ weight = 34.943139430 ];
   n10;
   n6821;
}
$ neato -Tpng similar.dot -o similar.png

票数 1
EN

Stack Overflow用户

发布于 2010-07-14 20:49:32

你试过GraphViz了吗?我用在这种情况下。我还没有试着改变节点连接的长度,您将不得不找出其中的一个。以示例图列表作为起点。

票数 2
EN

Stack Overflow用户

发布于 2010-07-14 21:37:01

处理是一个非常好的数据可视化工具(也是基于Java的语言)。可以把它看作是在Java中编写简化的OpenGL (您甚至可以在其中使用OpenGL ),再加上使用所有Java库的自由。您甚至可以将处理应用程序嵌入到另一个Swing或AWT应用程序中。

这是主页面和全新的维基

你说你利用了皮顿。这里有一个黑客,所以您可以在这篇博客文章中使用Jython而不是Java。我还没试过但也许效果不错。使用另一种语言(还有一个JavaScript‘端口’,Processing.js)的唯一不足是,所有的示例都是针对处理语言的(基于Java的)。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/3250328

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档