背景:
1000名参与者对他们对200个对象(S)的满意度进行了评估,并提供了关于参与者自身的4个不同的心理变量(A、B、C、D)。有5000个唯一的对象要评分,因此由于资源限制,并不是每个参与者都对每个对象进行评级。这导致了一个稀疏的数据集,其中每个对象由大约30名参与者进行评级。
从这个设计中,检索基本的描述性统计信息(例如,每个对象的平均满意度)是非常简单的。我现在的任务是建立一个心理变量(A,B,C,D)和对象之间的关系。“如果你在A,B,C,D上取得一定的分数,你可能会觉得满意的对象是什么?”
其思想是运行一个回归,随后提取中介系数。公式(可能还有设计)相当复杂,我甚至不知道如何在R.
数据集:
数据集如下-
参与者ID,对象ID,S评级,A,B,C,D
对于一个分词,A、B、C、D值总是相同的,即它们不依赖于对象。对象ID从1到5000不等,一个参与者ID与从5000池中随机选择的200个对象配对。
示例:
+----------------+-----------+----------+-----+------+------+------+
| Participant ID | Object ID | S Rating | A | B | C | D |
+----------------+-----------+----------+-----+------+------+------+
| 1 | 23 | 2 | 0.2 | 0.7 | 0.42 | 0.9 |
+----------------+-----------+----------+-----+------+------+------+
| 1 | 69 | 1 | 0.2 | 0.7 | 0.42 | 0.9 |
+----------------+-----------+----------+-----+------+------+------+
| 1 | 769 | 1 | 0.2 | 0.7 | 0.42 | 0.9 |
+----------------+-----------+----------+-----+------+------+------+
| 1 | 1357 | 5 | 0.2 | 0.7 | 0.42 | 0.9 |
+----------------+-----------+----------+-----+------+------+------+
| ... 196 more | | | | | | |
+----------------+-----------+----------+-----+------+------+------+
| 2 | 84 | 1 | 0.3 | 0.12 | 0.6 | 0.86 |
+----------------+-----------+----------+-----+------+------+------+
| 2 | 345 | 5 | 0.3 | 0.12 | 0.6 | 0.86 |
+----------------+-----------+----------+-----+------+------+------+
| 2 | 1357 | 4 | 0.3 | 0.12 | 0.6 | 0.86 |
+----------------+-----------+----------+-----+------+------+------+公式:
为了建立项目级对象评级与参与者级心理测量变量之间的关系,我希望使用以下公式进行回归:
S级~ (A +B+C+ D) *I+ (1/P)
当S评级是数据集中的S评级时,A、B、C、D是数据集中的心理变量,I是我要提取的项目级系数,P是参与者级系数。
该公式将为数据集中的每个项(对象)提供项级系数- IA、IB、IC、ID .这样就可以回答这样的问题:“对于对象931,在A上得分高在预测满意度方面尤为重要”。
问题:
是否有可能在R中实现这一目标?
我是否正确地认为,上面的公式会让我获得项目水平系数,让我能够看到心理变量A,B,C,D如何帮助预测S,独立地预测每个项目I?
是否有可能从R中的回归中检索这些系数?我希望最后得到一个表格,例如:对象ID,A的贡献,B的贡献,C的贡献,D的贡献,这将分别告诉每个心理变量对预测S的贡献。
在R中,这是怎么做的?
发布于 2017-06-21 15:17:37
当然,您应该能够在R中这样做,关键是正确地定义变量的类。我认为我和P应该是因素。
然后简单地使用lm()函数:
obj =1M(评级~ (A +B+C+ D):I + P)
https://stackoverflow.com/questions/44679466
复制相似问题