一、jupyter notebook是什么

官网的介绍是:Jupyter Notebook是一个Web应用程序,允许您创建和共享包含实时代码,方程,可视化和说明文本的文档。 用途包括:数据清理和转换,数值模拟,统计建模,机器学习等等。

简单的介绍就是:Jupyter Notebook是Ipython的升级版,而Ipython可以说是一个加强版的交互式 Shell,也就是说,它比在terminal里运行python会更方便,界面更友好,功能也更强大。怎么强大法,往下看就知道了。

此架构的一个优点是,内核无需运行 Python。由于 notebook 和内核分开,因此可以在两者之间发送任何语言的代码。例如,早期的两个非 Python 内核分别是 R 语言和 Julia 语言。使用 R 内核时,用 R 编写的代码将发送给执行该代码的 R 内核,这与在 Python 内核上运行 Python 代码完全一样。IPython notebook 已被改名,因为 notebook 变得与编程语言无关。新的名称 Jupyter 由 Julia、Python 和 R 组合而成。如果有兴趣,不妨看看可用内核的列表。

另一个优点是,你可以在任何地方运行 notebook 服务器,并且可通过互联网访问服务器。通常,你会在存储所有数据和 notebook 文件的自有计算机上运行服务器。但是,你也可以在远程计算机或云实例(如 Amazon 的 EC2)上设置服务器。之后,你就可以在世界上任何地方通过浏览器访问 notebook。

二、jupyter notebook的安装和配置

1. 安装

安装非常简单,只需要在终端输入:

pip install jupyter

打开jupyter notebook 也只需要在终端输入:

jupyter notebook

运行上面的命令之后,你将看到类似下面这样的输出:


如上图,它打开了一个端口,并且会在你的浏览器中打开这个页面,主目录是图中的那个directory(可能第一次打开没有这个目录)。

2、配置

jupyter notebook --generate-config

打开“C:\Users\Administrator\.jupyter”文件夹,可以看到里面有个配置文件。


修改jupyter_notebook_config.py配置文件

打开这个配置文件,找到“c.NotebookApp.notebook_dir=……”,把路径改成自己的工作目录。


配置文件修改完成后, 以后在 jupyter notebook 中写的代码等都会保存在自己创建的目录中。

jupyter notebook的自定义启动(变了)

配置文件修改成后,就可以启动 jupyter notebook 了,命令行窗口中输入 jupyter notebook,

默认浏览器就会打开一个页面

jupyter notebook的启动

命令行窗口输入: jupyter notebook


三、使用

1、打开一个新文档

在主页面的右上角点new即可新建一个你想要的文件类型。


如上图,jupyter也可以打开一个terminal,还可以作为一个text文本编辑器,功能明显是比terminal强大了。

下面的Notebooks类型除了python 也是可以加入其他类型的文档的,具体方法百度一下就好。

2、python编辑器介绍

点击python2后会出现一下界面:


稍微介绍一下notebook 界面的组成部分1)notebook 的名称2)主工具栏提供了保存、导出、重载 notebook,以及重启内核等选项3)快捷键4)notebook 编辑区

最下面的哪个 In [ ]: 的框叫做单元格,你可以把你的代码分成一段段的单元格输入,然后可以逐个单元格地运行。注意,这个功能是非常友好的,有时候只修改了中间的一小段代码,又不想全部代码都要重新运行的时候这个功能就非常有用了。另外,单元格是可以改变顺序的。而且可以输出图片和绘图!非常强大吧!

这些只要稍微尝试一下就懂的,下面主要介绍一些常用的技巧

**注意,jupyter notebook 是支持 TAB 键自动补充单词的,再一次展示了其强大友好的一面!

(1).修改文档名称


方法一:点上图的Untitled

方法二:点File,再点rename

(2).导出文档

步骤:点File,再点Download as


发现里面支持好几种格式的导出,第一个ipynb是notebook的格式,是一种类json的格式保存,其他的建议你们都试一试,你会感到非常惊喜的。

(3).保存

Ctrl + S 快捷键的可以保存你的文档的,默认是保存为ipynb,保存在你的主目录下!

(4).单元格格式

注意到快捷键栏中有一个code的下拉框,点开发现有几个选项:


这里介绍一下

Code格式就是正常的python代码格式

Markdown的一个text文档编辑格式,就像在word里编写一样

Heading就是给Markdown的句子设置标题等级,像word的标题一,标题二...

Raw NBConvert 没用过不了解,可以自行百度或者看官网介绍

下面举例说明一下

选择一个空的单元格,code下拉框选择Heading,会出现一个不同类型的 cell:


改变单元格类型时弹出消息中有解释,后面那个单元格以 # 标记开头,意味着这是一个一级标题。如果需要子标题,可以使用以下标记表示:

# : 一级标题## : 二级标题### : 三级标题...

输入内容后再运行一下(快捷栏里有),会出现类似下面的情况:


我一共输入了三级标题,点其中一个,你会发现它的code下拉栏显示是markdown类型

你以后代码里print 的内容都是以markdown的格式显示的。

(5).快捷键

常用的快捷键是:

Ctrl + Enter: 执行单元格代码

Shift + Enter: 执行单元格代码并且移动到下一个单元格

Alt + Enter: 执行单元格代码,新建并移动到下一个单元格

这几个快捷键都是非常常用的。

(6).历史输入和输出变量

与标准 Shell 类似,IPython 中也可以通过 _ 和 _ _ 访问上一次和上上一次的输出。

当你写的单元格多了,肯定会注意到,IPython 中每一次的输入输出都有序号。你可以通过一下方法访问这些输入和输出:

_:访问上一次输出

__:访问上上一次输出

_X:访问历史 X 行输出

_iX:访问历史 X 行输入

其中小写字母 “i”,代表 “in”。

四、外部功能

上面讲的是jupyter 的一些使用方法和技巧,其实它还有很多强大的外部功能的,下面给大家介绍一下。

(1).魔术命令

在 IPython 的会话环境中,所有文件都可以通过 %run 命令来当做脚本执行,并且文件中的变量也会随即导入当前命名空间。

即,对于一个模块文件,你对他使用 %run 命令的效果和 from module import * 相同

这种以 % 开头的命令在 IPython 中被称为魔术命令,用于加强 shell 的功能。

常用的魔术命令有:

%quickref

显示 IPython 快速参考

%magic

显示所有魔术命令的详细文档

%debug

从最新的异常跟踪的底部进入交互式调试器

%pdb

在异常发生后自动进入调试器

%reset

删除 interactive 命名空间中的全部变量

%run script.py

执行 script.py

%prun statement

通过 cProfile 执行对 statement 的逐行性能分析

%time statement

测试 statement 的执行时间

%timeit statement

多次测试 statement 的执行时间并计算平均值

%who、%who_ls、%whos

显示 interactive 命名空间中定义的变量,信息级别/冗余度可变

%xdel variable

删除 variable,并尝试清除其在 IPython 中的对象上的一切引用

!cmd

在系统 shell 执行 cmd

output=!cmd args

执行cmd 并赋值

%bookmark

使用 IPython 的目录书签系统

%cd direcrory

切换工作目录

%pwd

返回当前工作目录(字符串形式)

%env

返回当前系统变量(以字典形式)

对魔术命令不熟悉的话可以通过 %magic 查看详细文档;对某一个命令不熟悉的话,可以通过 %cmd? 内省机制查看特定文档

(2).添加插件

a)侧边栏目录导航


当文章内容非常长的时候,前后找内容,很麻烦,不如加一个sidebar,方便导航方法:https://github.com/ipython-contrib/IPython-notebook-extensions/tree/master/nbextensions/usability/toc2

b)隐藏代码按钮

有时候,希望代码可以隐藏,这样子文档看起来,就会干净一些


(3).运行python文件

利用jupyter的cell是可以运行python文件的。

方法一:

%run file.py

方法二:在unitx command前面加入一个感叹号“!” ,如:

!python myfile.py

(4).导入外部代码

比如有一个test.py文件,需要将其载入到jupyter的一个cell中

在需要导入该段代码的cell中输入

%load test.py #test.py是当前路径下的一个python文件

shift + enter运行后,%load test.py被自动加入了注释符号#,test.py中的所有代码都被load到了当前的cell中

或者从从网络load代码到jupyter

在cell中输入%load http://.....,然后运行该cell,就会将load后面所对应地址的代码load到当前的cell中;

(5).自定义快捷键