分类 - ___ 数据分析基础

2019-06-02 15:35:17    411    0    0

勘误表(按页码排列):2020-1-1

P36

P100

title

P101

title

P106

title

P111

title

P127

title

P128

title

P129

title
title

133

title

135

title

160

title
title

164

title

2019-06-02 15:37:18    573    0    0

《Python数据分析基础教程》

函数库 DaPy_fun.py

王斌会 王术 2018-6-1

(1)安装库:将DaPy_fun.py文档拷贝到当前工作目录下
(2)调用包:from DaPy_fun import *
(3)使用函数:tab(x)


def tab(x,plot=False): #计数频数表和绘图

f=x.value_counts();f
s=sum(f);
p=round(f/s*100,3);p
T1=pd.concat([f,p],axis=1);
T1.columns=['例数','构成比'];
T2=pd.DataFrame({'例数':s,'构成比':100.00},index=['合计'])
Tab=T1.append(T2)
if plot:
fig,ax = plt.subplots(1,2,figsize=(15,6))
ax[0].bar(f.index,f); # 条图
ax[1].pie(p,labels=p.index); # 饼图
return(round(Tab,3))

def freq(X,bins=10,density=False): #计量频数表与直方图

if density:
H=plt.hist(X,bins,density=density)
plt.plot(H[1],st.norm.pdf(H[1]),color='r');
else:
H=plt.hist(X,bins);
a=H[1][:-1];a
b=H[1][1:];b
f=H[0];f
p=f/sum(f)*100;p
cp=np.cumsum(p);cp
Freq=pd.DataFrame([a,b,f,p,cp],index=['[下限','上限)',