分类 - ___ 基本数据分析

2017-01-26 16:45:23    1658    3    0

title

[第二版配套资料] https://gitee.com/Py-R/dstatR

title

2017-01-26 16:45:26    1045    0    1

教程大纲

title

教程目录

内容提要/

1 引言—如何成为数据分析师/

1.1 数据分析的未来/1

1.2 工欲善其事必先利其器/2

1.3 数据统计分析语言R简介/10

2 数据收集过程/

2.1 统计数据/21

2.2 收集数据/22

2.3 数据管理/24

3 数据处理步骤/

3.1 基本方法/31

3.2 数据选择/38

3.3 数据转换/42

3.4 数据整理/46

4 基本统计描述/

4.1 基本图形显示函数/50

4.2 单变量(向量)数据分析/55

4.3 多变量(数据框)数据分析/67

5 随机变量及其分布/

5.1 随机变量及其分布/79

5.2 随机抽样与随机数/86

5.3 统计量及其抽样分布/89

6 基本统计推断方法/

6.1 正态总体的参数估计/98

6.2 正态总体的假设检验/101

6.3 分布自由的非参数统计/106

7 常用统计分析模型/

7.1 相关分析模型/115

7.2 回归分析模型/120

7.3 数据分类与模型选择/133

8 R语言的高级应用/

8.1 R语言的编程概述/144

8.2 R语言高级编程举例/159

8.3 R语言高级绘图功能/164

8.4 R语言统计模拟实验/176

9 数据库与调查分析/

9.1 R语言中数据库的使用/192

9.2 调查数据的设计与分析/195

9.3 生成统计分析报告/201

附录 Rstudio简介

2017-01-26 16:45:28    2978    0    0

1 引言

  1. rm(list=ls()) #清理内存
  2. options(digits=4) #输出结果位数
  3. library(dstatR)
  4. X=c(164,162,186,165,165,187,169,151,157);X
  5. UG=read.csv('UnderGraduate.csv') #大学生个人信息数据
  6. UG
  7. head(UG)
  8. tail(UG)
  9. dim(UG)
  10. names(UG)
  11. summary(UG)
  12. t.test(height~sex,data=UG)
  13. fm=lm(weight~height,data=UG);fm
  14. summary(fm)
  15. plot(weight~height,data=UG);abline(fm) #模型方程

2 数据收集过程

  1. x=c(1,3,5,7,9,2,4,6,8);x
  2. i=1:9;i
  3. j=9:1;j
  4. seq(0.5,9.5,length=20)
  5. df=data.frame(x,i,j);df
  6. UG1=data.frame(g=UG$sex,x=UG$height,y=UG$weight)
  7. head(UG1) #当数据较多时,可用head 显示数据集的前6行,等价于UG[1:6,]
  8. UG2=UG[,c('sex','height','weight')]
  9. head(UG2)
  10. UG3=UG[1:6,1:5]
  11. UG3

3 数据处理步骤

  1. Sq.sum <- function(x) {
  2. S=sum(x^2) # S=???x2
  3. S # return(S)
  4. }
  5. Sq.sum <- function(x){ sum(x^2) }
  6. Sq.sum(1:9)
  7. Sq.sum (UG$height)
  8. welcome <- function() print("welcome to use R")
  9. welcome()
  10. welcome <- function(names) print(paste("welcome",names,"to use R"))
  11. welcome("Mr fang")
  12. welcome("Mr Wang")
  13. welcome()
  14. w