PYTHON如何去掉br python如何去掉最后一个逗号_数据分析


要使用python进行数据分析,首先需要了解这两个环境,Anaconda 和 Jupyter notebook他们已成为数据分析的标准环境。

Anaconda:是包管理器和环境管理器,

Jupyter notebook:可以将数据分析的代码、图像和文档全部组合到一个web文档中。

1.Jupyter notebook 是什么? 2.如何启动Jupyter notebook? 3.新手如何快速使用notebook?

1.Jupyter notebook 是什么?

在没有notebook之前,在IT领域工作的我都是这样工作的:

在普通的 Python shell 或者在IDE(集成开发环境)如Pycharm中写代码,然后在word中写文档来说明你的项目。

这个过程很反锁,通常是写完代码,再写文档的时候我还的重头回顾一遍代码。最蛋疼的地方在于,有些数据分析的中间结果,我还的重新跑代码,然后把结果弄到文档里给客户看。

有了notebook之后,我的世界突然美好了许多,因为notebook 可以直接在代码旁写出叙述性文档,而不是另外编写单独的文档。也就是它可以能将代码、文档等这一切集中到一处,让用户一目了然。

Jupyter Notebook 已迅速成为数据分析,机器学习的必备工具。因为它可以让数据分析师集中精力向用户解释整个分析过程。

Jupyter这个名字是它要服务的三种语言的缩写:Julia,PYThon和R,这个名字与“木星(jupiter)”谐音。

2.如何启动 Jupyter notebook?

安装 Jupyter 的最简单方法是使用 Anaconda。该发行版附带了 Jupyter notebook。你能够在默认环境下使用 notebook。

启动notebook 服务器后,在浏览器中会自动打开notebook页面地址

http://localhost:8888

(其中localhost 表示你的计算机,而 8888 是服务器的默认端口)

3.新手如何快速使用notebook?

3.1)顶部的3个选项卡

顶部的3个选项卡是:Files(文件)、Running(运行)和 Cluster(集群)

Files(文件)显示当前“notebook工作文件夹”中的所有文件和文件夹。
点击 Running(运行)选项卡会列出所有正在运行的 notebook。可以在该选项卡中管理这些 notebook。
Clusters一般不会用到。因为过去在 Clusters(集群)中创建多个用于并行计算的内核。现在,这项工作已经由 ipyparallel 接管。

3.2)如何创建一个新的notebook?

【如何新建程序】:

在右侧点击“New”(新建),创建新的 notebook、文本文件、文件夹或终端。

【执行程序的方式】:

点击运行按钮,或者按住ctrl+enter键来执行代码

【如何找存储文件夹】:

(其实Notebook 就是个扩展名为 .ipynb 的大型JSON文件。)


PYTHON如何去掉br python如何去掉最后一个逗号_数据分析_02


import os
print(os.path.abspath('.'))


PYTHON如何去掉br python如何去掉最后一个逗号_数据分析_03


【json文件是什么】

数据(data)最终可以分解成三种类型第一种类型是标量scalar,也就是一个单独的字符串string或数字numbers,比如“成都”这个单独的词。 第二种类型是序列sequence,也就是若干个相关的数据按照一定顺序并列在一起,又叫做 数组array,或者列表list,比如“成都,重庆”。 第三种类型是映射mapping,也就是一个名/值name/value,即数据有一个名称,还有一个与之相对应的值,这又称作散列hash或字典dictionary,比如“蓉城:成都”。
是啊,原来数据构成的最小单元经如此简单。难怪在编程语言中,只要有了数组array和对象object就能够存储一切数据了。
那么json呢?json这种文本文件又是怎么存储数据的呢?
21世纪初。Douglas crockford寻找一种简便的 数据交换格式,能够在服务器之间交换数据。当时通用的数据交换语言是xml,但是Douglas crockford觉得xml的生成和解析都太麻烦,所以他提出了一种简化格式,也就是json。 json的格式非常简单,只用一个页面几百个字就能说清楚,而且Douglas crockford声称这个规格永远不必升级,因为该规定的都规定了。

  1. 并列的数据之间用逗号(,)分隔
  2. 映射用冒号(:)表示
  3. 并列数据的集合(数组)用方括号([])表示
  4. 映射的集合(对象)用大括号({})表示

以上四条规则,就是json格式的所有内容。 [1]
由此可见,json非常易学易用,所以,在短短几年中,她就取代了xml,成为了互联网上最受欢迎的数据交换格式。

【Jupyter的各种快捷键】[2]

执行当前cell,并自动跳到下一个cell:Shift Enter
执行当前cell,执行后不自动调转到下一个cell:Ctrl-Enter
是当前的cell进入编辑模式:Enter
退出当前cell的编辑模式:Esc
删除当前的cell:双D
为当前的cell加入line number:单L
将当前的cell转化为具有一级标题的maskdown:单1
将当前的cell转化为具有二级标题的maskdown:单2
将当前的cell转化为具有三级标题的maskdown:单3
为一行或者多行添加/取消注释:Crtl /
撤销对某个cell的删除:z
浏览器的各个Tab之间切换:Crtl PgUp和Crtl PgDn
快速跳转到首个cell:Crtl Home
快速跳转到最后一个cell:Crtl End

【如何定义一个变量,且为之命名,方便下次调用】

#定一个
pat={'001':'猴子','002':'马云'}

在后面代码中用到这个变量是,我只要输入第一个变量的第一个字母p,然后按下Tab键,边会自动查找到代码中以p开头的变量名称,这可以大幅度提供你写代码的效率。

不正确的原因可能有如下,我就犯了第三个错

  1. 网上一搜答案,说有中文状态下的括号,这个确实是个原因;
  2. 还有一个原因是代码的末尾有空格,把空格去掉后,代码果断运行了
  3. 逗号也要注意,是英文环境下的逗号

【如何关闭 notebook文件】

通过在服务器主页上选中 notebook 旁边的复选框,然后点击“Shutdown”(关闭),你就可以关闭各个 notebook。


PYTHON如何去掉br python如何去掉最后一个逗号_json_04


【如何共享你的notebook?】

点击File->Download as,你可以选择多种格式下载你的notebook。一般我都会根据下面的用途来选择不同的下载格式:

  • 如果我想和客户分享我的数据分析成果,我会选择将notebook下载为HTML文件。
  • 如果我希望将自己的数据分析成果和代码嵌入到项目中,比如为药店管理系统做个数据分析子模块,我就会选择Python(.py)模块,这可以将我的代码融入项目中,成为子模块,方便和其他开发人员共同完成任务。
  • 如果要在博客或文档中使用 notebook,我就选择Markdown格式。


PYTHON如何去掉br python如何去掉最后一个逗号_json_05


【如何关闭Jupler notebook服务器】[3]

直接关闭打开notebook的页面就可以。再次提醒,这会立即关闭所有运行中的 notebook,因此,请确保你保存了工作!

关闭notebook服务器后,下次启动再打开notebook,当你继续在该notebook中写代码时,发现之前的变量无法访问了。需要你在该notebook的Kernerl选项卡中选择“Run All”重新编译下之前的代码。


PYTHON如何去掉br python如何去掉最后一个逗号_python 去掉方括号_06