我有GPA数据,我想要对这些数据进行分类,以便运行方差分析来测试辅导的重要性。
基本上,在一列中,有学生的辅导小时,在下一列中,有相应的GPA。我不知道如何在这个网站上创建一个表格,所以我希望这个描述是有意义的。
我想要的是在一列中0小时的人的GPA,在另一列中>0<6小时的人的GPA,以及在另一列中超过6小时的人的GPA。
然后我会对那些0小时的,那些少于6小时的和那些超过6小时的进行方差分析。
使用R可以做到这一点吗?
发布于 2013-04-30 10:39:37
在R中实现这一点的方法是构造一个因子变量:
dfrm$Hour.fc <- cut( dfrm$hours, c(0,6, Inf), include.lowest=TRUE)类别将是0,06,因为默认的cut行为是在右侧具有关闭的间隔。。如果您希望类别边界为6或更大,则将中间数字设置为5.99。所有的方差分析和回归函数都是为了处理因素而设计的。
https://stackoverflow.com/questions/16291208
复制相似问题