分类 - ___ 数据挖掘应用

2019-06-02 15:40:01    573    0    0

自定义函数: PyDm_fun.py

(1)安装库:将PyDm_fun.py文档拷贝到当前工作目录下
(2)调用包:from PyDm_fun import *
(3)使用函数:mcor_test(X)


函数举例:

def tab(x): #计数频数表

f=x.value_counts();f
s=sum(f);s
p=round(f/s*100,3);p
T1=pd.concat([f,p],axis=1);T1
T1.columns=['例数','构成比'];T1
T2=pd.DataFrame({'例数':s,'构成比':100.00},index=['合计'])
Tab=T1.append(T2)
return(round(Tab,3))

def freq(X,bins=10,density=False): #计量频数表与直方图

if density:
H=plt.hist(X,bins,density=density)
plt.plot(H[1],st.norm.pdf(H[1]),color='r');
else:
H=plt.hist(X,bins);
a=H[1][:-1];a
b=H[1][1:];b
f=H[0];f
p=f/sum(f)*100;p
cp=np.cumsum(p);cp
Freq=pd.DataFrame([a,b,f,p,cp],index=['[下限','上限)','频数','频率(%)','累计频数(%)'])
return(round(Freq.T,2))