数据科学资源共享
暨南大学 王斌会
Toggle navigation
数据科学资源共享
1. 数据分析简介@
2. Excel数据分析:
___ 数据统计分析
___及Python应用
3. R语言数据分析:
___ 基本数据分析
___ 多元统计分析
___ 计量经济分析
___ 统计模拟实验
4.Python数据分析:
___ *数据可视化*
___ 数据挖掘应用
___ 时间序列模型
5. 数据分析应用#
___ 数据库及应用
___ 案例分析应用
关于我们
4.2-4 自定义函数
2019-06-02 15:40:01
526
0
0
rstat
###**自定义函数: [PyDm_fun.py](http://leanote.com/api/file/getAttach?fileId=5b1e58bfab64412c17001a2e)** > (1)安装库:将PyDm_fun.py文档拷贝到当前工作目录下 (2)调用包:from PyDm_fun import * (3)使用函数:mcor_test(X) ------------------------------ ###**函数举例:** **def tab(x):** #计数频数表 >f=x.value_counts();f s=sum(f);s p=round(f/s*100,3);p T1=pd.concat([f,p],axis=1);T1 T1.columns=['例数','构成比'];T1 T2=pd.DataFrame({'例数':s,'构成比':100.00},index=['合计']) Tab=T1.append(T2) return(round(Tab,3)) **def freq(X,bins=10,density=False):** #计量频数表与直方图 > if density: H=plt.hist(X,bins,density=density) plt.plot(H[1],st.norm.pdf(H[1]),color='r'); else: H=plt.hist(X,bins); a=H[1][:-1];a b=H[1][1:];b f=H[0];f p=f/sum(f)*100;p cp=np.cumsum(p);cp Freq=pd.DataFrame([a,b,f,p,cp],index=['[下限','上限)','频数','频率(%)','累计频数(%)']) return(round(Freq.T,2))
上一篇:
4.2-3 教程数据
下一篇:
5.1-1 实验教学平台
0
赞
526 人读过
新浪微博
微信
腾讯微博
QQ空间
人人网
提交评论
立即登录
, 发表评论.
没有帐号?
立即注册
0
条评论
More...
文档导航
没有帐号? 立即注册