数据科学资源共享
暨南大学 王斌会
Toggle navigation
数据科学资源共享
1. 数据分析简介@
2. Excel数据分析:
___ 数据统计分析
___及Python应用
3. R语言数据分析:
___ 基本数据分析
___ 多元统计分析
___ 计量经济分析
___ 统计模拟实验
4.Python数据分析:
___ *数据可视化*
___ 数据挖掘应用
___ 时间序列模型
5. 数据分析应用#
___ 数据库及应用
___ 案例分析应用
关于我们
5.1-5 大数据分析案例
2017-11-04 13:50:26
629
0
0
rstat
# 一、数据格式  ## (一)按度量尺度分 ### 1. 定性数据(也称计数数据) ``` 性别: 女,男,男,女,男,男,女,男,女,男,…… ,女,男,女,女,男,男,女,男,女 ``` ### 2. 定量数据(也称计量数据) ``` 体重: 67,66,83,68,70,90,70,58,63,72,……,65,76,71,66,65,68,65,77,70 ``` ## (二)按时间状况分 ### 1. 横向数据(也称截面数据) ``` 地区 北京 天津 河北 山西 ... 甘肃 青海 宁夏 新疆 GDP 162.519 113.073 245.158 112.376 … 50.204 16.704 21.022 66.101 ``` ### 2. 纵向数据(也称时间序列) ``` 年份 2004 2005 2006 2007 …… 2011 2012 2013 2014 GDP 15.988 18.494 21.631 26.581 …… 47.310 51.947 58.802 63.646 ``` # 二、数据收集  ## (一)单变量数据---学生个人信息 ### 1. 基本信息 >某大学统计学系2012级共招收的48名本科生的基本信息 指标体系: >>学号(id) 性别(sex) 来源地(region) 出生日期(birth) 家庭收入(income) 身高(height) 体重(weight) 成绩(score)  ### 2. 数据分析(Excel+R) >(1)探索性分析 (2)透视表分析 (3)基本统计分析 ## (二)时序型数据---宏观经济数据 ### 1. 基本信息 >收集1978-2013年我国宏观经济数据(单位:百亿元) 指标体系: >>TAX:全国年税收收入 GDP:当年国内生产总值(支出法) EXP:当年财政支出 IE:当年的进出口额总额 RS:社会消费品零售总额 COM:城乡居民全年消费额 INV:全社会固定资产投资总额 DEP:城乡居民储蓄存款年底余额  ### 2. 数据分析(Excel+R) >(1)探索性分析 (2)相关回归分析 (3)时序模型分析 ## (三)多变量数据---居民人均消费 ### 1. 基本信息 >为了研究全国31个省、市、自治区2007年城镇居民生活消费的分布规律,根据调查资料做区域消费类型划分。 指标体系: >>衣着:人均衣着商品支出(元/人) 食品:人均食品支出(元/人) 居住:人均居住支出(元/人) 交通:人均交通和通讯支出(元/人) 设备:人均家庭设备用品及服务支出(元/人) 医疗:人均医疗保健支出(元/人) 教育:人均娱乐教育文化服务支出(元/人) 杂项:人均杂项商品和服务支出(元/人)  ### 2. 数据分析(Excel+R) >(1)探索性分析:可视化 (2)分类分析:聚类分析 (3)综合分析:综合评价
上一篇:
5.1-4 大数据教学内容
下一篇:
5.2-1 经济运行大数据分析
0
赞
629 人读过
新浪微博
微信
腾讯微博
QQ空间
人人网
提交评论
立即登录
, 发表评论.
没有帐号?
立即注册
0
条评论
More...
文档导航
没有帐号? 立即注册