Python数据分析从入门到精通
上QQ阅读APP看书,第一时间看更新

2.5 Jupyter Notebook开发工具

Jupyter Notebook被誉为“文学式开发工具”。为什么这样说呢?因为Jupyter Notebook将代码、说明文本、数学方程式、数据可视化图表等内容全部组合到一起显示在一个共享的文档中,可以实现一边写代码一边记录,而这些功能是Python自带的IDLE和集成开发环境PyCharm无法比拟的。

2.5.1 认识Jupyter Notebook

Jupyter Notebook是一个在线编辑器、Web应用程序,它可以在线编写代码、创建和共享文档,以及支持实时编写代码、数学方程式、说明文本和可视化数据分析图表。

Jupyter Notebook的用途包括数据清理、数据转换、数值模拟、统计建模、机器学习等。目前,数据挖掘领域中很热门的比赛Kaggle(举办机器学习竞赛、托管数据库、编写和分享代码的平台)里的资料均为Jupyter格式。对于机器学习新手来说,学会使用Jupyter Notebook非常重要。

下面为笔者使用Jupyter Notebook分析的天气数据,效果如图2.55所示。

图2.55 在Jupyter Notebook中编写代码

从图2.55中可以看出,Jupyter Notebook将编写的代码、说明文本和可视化数据分析图表全部组合在一起并同时显示出来,非常直观,而且还支持导出各种格式,如HTML、PDF、Python等格式。

2.5.2 新建一个Jupyter Notebook文件

在系统开始菜单的搜索框中输入Jupyter Notebook(不区分大小写),运行Jupyter Notebook,新建一个Jupyter Notebook文件,单击右上角的New按钮,由于我们创建的是Python文件,因此选择Python 3,如图2.56所示。

图2.56 新建Jupyter Notebook文件

2.5.3 在Jupyter Notebook中编写“Hello World”

2.5.2节我们已经创建好了文件,下面开始编写代码。文件创建完成后会打开如图2.57所示的窗口,在代码框中输入代码,如print('Hello World'),结果如图2.58所示。

图2.57 代码编辑窗口

图2.58 编写代码

1.运行程序

单击“运行”按钮或者使用快捷键Ctrl+Enter,然后将输出Hello World,结果如图2.59所示,这就表示程序运行成功了。

图2.59 运行程序

2.重命名Jupyter Notebook文件

例如,重命名为“Hello World”,首先选择File→Rename命令(见图2.60),然后在打开的“重命名”对话框中输入文件名(见图2.61),最后单击“重命名”按钮即可。

3.保存Jupyter Notebook文件

最后一步保存Jupyter Notebook文件,也就是保存程序。常用格式有以下两种:一种是Jupyter Notebook的专属格式;另一种是Python文件。

 Jupyter Notebook的专属格式:选择File→Save and Checkpoint命令,将Jupyter Notebook文件保存在默认路径下,文件格式默认为ipynb。

 Python格式:它是我们常用的文件格式。选择File→Download as→Python(.py)命令,如图2.62所示。打开“新建下载任务”对话框,此处选择文件保存路径,如图2.63所示。单击“下载”按钮,即可将Jupyter Notebook文件保存为Python格式,并保存在指定路径下。

图2.60 重命名菜单

图2.61 重命名

图2.62 选择Python菜单项

图2.63 指定保存路径