数据科学资源共享
暨南大学 王斌会
Toggle navigation
数据科学资源共享
1. 数据分析简介@
2. Excel数据分析:
___ 数据统计分析
___及Python应用
3. R语言数据分析:
___ 基本数据分析
___ 多元统计分析
___ 计量经济分析
___ 统计模拟实验
4.Python数据分析:
___ *数据可视化*
___ 数据挖掘应用
___ 时间序列模型
5. 数据分析应用#
___ 数据库及应用
___ 案例分析应用
关于我们
关于Python数据分析
2018-10-12 10:11:17
2183
0
0
rstat
**—— “人生苦短,我要用Python”,这是网上对Python评价最多的一句话,说明Python作为一种新兴的编程语言,已深入人心,是人工智能算法的首选语言。** ** 为了顺应形势发展和大数据专业课程的需求,我们编写了用于数据分析的Python教程,目前已有两本教材供大家学习使用:** **(1)《Python数据分析基础教程》 电子工业出版社 2018.10 ** **(2)《Python数据挖掘及应用》 电子工业出版社 2019.3 ** —— 本书内容丰富、图文并茂、可操作性强且便于查阅,主要面向数据分析的读者,能有效地帮助读者提高数据处理与分析的水平,提升工作效率。本书适合各个层次的数据分析用户,即可作为初学者的入门指南,又可作为中、高级用户的参考手册。同时也可作为各大中专院校和培训班的数据分析教材。 ---为了方便读者学习和使用基本数据分析技术,本书具有三大有点: >**(1)使用Python科学计算发行版Anaconda,方便数据分析者使用。可从https://www.anaconda.com/下载安装并直接使用。** **(2)公开了本书自编函数的源代码,使用者可以深入理解Python函数的编程技巧,用这些函数建立自己的开发包。并建立了本书的资源管理网站(https://gitee.com/Py-R),书中的数据、代码、例子、习题都可在网上下载直接使用。** **(3)采用网络化教学平台:Python的基础版缺少一个面向一般人群的菜单界面,对那些只想用其进行数据分析的使用者是一大困难,于是采用流行的Python网络平台Jupyter(https://jupyter.org/try),可作为数据分析教学软件使用。** ### Anaconda下载与安装 基本的Pyhton环境只包含基本的编程模块,基本不包含数据分析和科学计算模块,所以作为数据分析工作者,我们需选择一个方便的Python编程环境。现在有许多公司为了迎接大数据时代的来临,构建了许多基于Python的发行版,其中包含了用于编程的集成开发环境和常用的编程和数据分析库。 给大家推荐一款用于科学计算和数据分析的Python的发行版Anaconda,可从https://www.anaconda.com/下载其安装包。建议大家下载Python3.6及以上版本。 ### Anaconda启动与运行 (1)系统安装导航  (2)命令行执行Python  但通常第三方程序包需在此安装,安装命令为 pip install 包名 或 conda install 包名 1)列出当前安装的包: pip list 2)列出可升级的包: pip list --outdate 3)升级一个包: pip install --upgrade jupyterlab 4)卸载一个包: pip uninstall jupyterlab ### Jupyter Notebook使用 如果你安装的是Anaconda,那它已包含有Jupyter Notebook,由于Jupyter具有网页功能,所以直接打开不易确定当前执行目录,有几种在当前目录中打开Jupyter Notebook的方法: 一、命令行法 > 在Anaconda Prompt命令行上输入 jupyter notebook --notebook-dir= D:\\DaPy1 > 也可以将目录切换的D:\DaPy1,然后运行jupyter notebook D:\>cd DaPy1 D:\DaPy1>jupyter notebook  二、Powershell法 进入工作目录文件夹(如D:/DaPy1)—>键盘Shift+鼠标右键—>在此处打开Powershell窗口—>在弹出的命令窗口中输入:Jupyter Notebook,如: > PS D:\DaPy1\>Jupyter Notebook 三、修改config.py 在CMD(Win+R)中使用jupyter notebook --generate-config创建jupyter_notebook_config.py文档, 在文档中将 c.NotebookApp.notebook_dir = '' 修改为 > c.NotebookApp.notebook_dir = 'D:\\DaPy1' 这样以后每次启动自动到目录'D:\\DaPy1'下运行。 四、修改config.json 打开Anaconda安装目录下的etc文件如:C:\Anaconda3\etc\jupyter我的安装目录在 C:\Anaconda3,打开jupyter_notebook_config.json文件作如下修改即可: >{ "NotebookApp": { "nbserver_extensions": { "jupyterlab": true, "jupyter_nbextensions_configurator": true }, "notebook_dir":"D:\\DaPy1" } } 这样以后每次启动自动到目录'D:\\DaPy1'下运行。 ### 在浏览器中使用Jupyter 如果你不想安装庞大的Python和Jupyter Notebook,只是想简单使用一下,那Jupyter社区为大家准备了一个浏览器版的Jupyter Notebook,只要点击【在浏览器中试用】按钮或在网址中输入 https://jupyter.org/try即可使用,强烈推荐大家练习使用!当然这个版本只包含了常用的程序包,一些复杂的程序包还得在本地安装版中使用。 ### 为Jupyter Notebook添加目录 (1)安装Jupyter Notebook extensions conda install -c conda-forge jupyter_contrib_nbextensions (2)开启toc2插件 运行Jupyter Notebook, 在打开的Notebook界面里, 你会发现多了一个Nbextensions,点击这个tab, 勾选Table of Contents (有的版本是toc2). 然后创建或者打开一个Jupter Notebook ### 初始化代码 > from IPython.core.interactiveshell import InteractiveShell InteractiveShell.ast_node_interactivity = "all" #多项输出 import numpy as np #加载数组运算包 np.set_printoptions(precision=4) #设置numpy输出精度 import pandas as pd #加载数据分析包 pd.set_option('display.width', 120) #设置pandas输出宽度 pd.set_option('display.precision',4) #设置pandas输出精度 import matplotlib.pyplot as plt #加载基本绘图包 plt.rcParams['font.sans-serif']=['KaiTi'];#SimHei黑体 plt.rcParams['axes.unicode_minus']=False;#正常显示图中负号 plt.figure(figsize=(5,4)); #图形大小 --- ### 初始化文件 可将上述代码放到一个py文件中,如initpython.py >[initpython.py](http://leanote.com/api/file/getAttach?fileId=5b10bd91ab644116b70008e1) 下载到当前目录,然后在编辑环境中应用%run运行,即 > %run initpython.py
上一篇:
5.2-4 综合景气监测图
下一篇:
数据分析的未来
0
赞
2183 人读过
新浪微博
微信
腾讯微博
QQ空间
人人网
提交评论
立即登录
, 发表评论.
没有帐号?
立即注册
0
条评论
More...
文档导航
没有帐号? 立即注册