read.csv("https://stats.idre.ucla.edu/stat/data/binary.csv") dim(mydata) head(mydata) install.packages("skimr ") skimr::skim(mydata) sapply(mydata,sd) sapply(mydata,mean) xtabs(~admit+rank,data=mydata) 可选择的分析方法
www.kaggle.com/jonathanbouchet/nuclear-power-plant-geo-dataNuclear Power Plant Locations data 新遇到的R包 skimr : skimr is designed to provide summary statistics about variables. 简单理解 skim()函数是 summary()函数的升级版 运行 help(package="skimr")命令查看帮助文档里面提供的小例子 >summary(iris) Sepal.Length
github.com/vqv/ggbiplot 展示PCA分析结果,出图非常漂亮 https://blog.csdn.net/woodcorpse/article/details/78863454 详细介绍 skimr
library(survival) library(tableone) library(skimr) ## Load data data(pbc) pbc=pbc %>% as.tbl() %>%
工具 1、skimr - A frictionless, pipeable approach to dealing with summary statistics[5] 通过字符可视化数据汇总信息。
本次学习主要探讨3个问题: 开始探索缺失值 探索缺失值的机制 模型化缺失值 如何开始探索缺失值 当你面对新的数据时,可能首先会使用各种汇总函数查看数据的基本情况,比如: summary() str() skimr