我试图分析数据集中用户的一种称为“情感翻转”的行为,但我无法继续下去。
假设我有两组用户,分别是好用户和坏用户。
我的数据集包含分为6个主题的N个tweet。这些推文是由坏用户和好用户创建的。
这6个主题是关于一般问题,其中3个是关于“坏”用户支持的组织/个人,另3个是反对(B)他们的意识形态。
坏用户和好用户在推特行为上的区别是:
我如何用分数/值来衡量/显示这种翻转行为;假设每条推文都由一个向量表示,比如: Pos的<#,Neg words>的#。
我认为一个好的解决方案将考虑如何密集和意识形态清楚的不良用户行为。
此图像总结了前面的描述:

发布于 2019-08-23 13:30:03
所以我对此有一个理论。我们希望能够区分那些情感和偏见的用户和那些没有情感和没有偏见的用户。
M是情绪化的,因为它计算出单词将是情感的频率(而不是描述性的)。
B是偏见,因为有偏见的推文会有更多的好(或坏)字比那些保持双方平等的。
我不知道这一预测是否成立,但我认为如果你把每条推文都画成偏见,把y画成带有好或坏色彩的情绪化,那么就会有两大类(我渴望被证明是错的--这听起来肯定是个有趣的问题)!
https://datascience.stackexchange.com/questions/57910
复制相似问题