R中基本统计分析方法整理
面对一大堆的数据,往往会让人眼花缭乱。但是只要使用一些简单图形和运算,就可以了解数据更多的特征。R提供了很多关于数据描述的函数,通过这些函数可以对数据进行一个简单地初步分析。
获取描述性统计量的R函数
(1)常用统计函数(参数x为向量)
mean(x):平均值
median(x):中位数
sd(x):标准差
var(x):方差
sum(x):求和
min(x):最小值
max(x):最大值
range(x):值域
......等等
(2)summary()函数;提供最小值、下四分位数、中位数、平均值、上四分位数、最大值。
(2)apply()或sapply函数:计算参数指定的任意描述性统计量。
其中sapply()用法:sapply(x,FUNC,options) ,x是待处理的数据框,FUNC是用户指定的函数,如sum()、max()、mean()等等,指定了的options会传递给FUNC。
(3) Hmisc包中的describe()函数:返回变量和观测值的数目、缺失值和唯一值的数目、平均值、分位数、五个最大的值和五个最小的值。
(4)pastecs包中的stat.desc()函数,可以计算种类繁多的描述性统计量
(5)psych包也提供了一个describe()函数,它可以计算非缺失值的数量、平均数、标准差、中位数、截尾均值、绝对中位差、最小值、最大值、值域、偏度、峰度等。