>>上一篇《Python二级(11)——Python标准库概览》
一、知识导图
二、Python第三方库的获取和安装
1、Python第三方库依照安装方式灵活性和难易程 度有三个方法:
pip工具安装、自定义安装和文件安装。
I、pip工具安装
①最常用且最高效的Python第三方库安装方式是 采用pip工具安装。pip是Python官方提供并维 护的在线第三方库安装工具。
$color{red}{pip install }$:>pip install pygame ... Installing collected packages: pygame Successfully installed pygame-1.9.2b1
②pip是Python第三方库最主要的安装方式,可以安装超 过90%以上的第三方库。然而,还有一些第三方库无法 暂时用pip安装,此时,需要其他的安装方法。
③pip工具与操作系统也有关系,在Mac OS X和Linux等操 作系统中,pip工具几乎可以安装任何Python第三方库, 在Windows操作系统中,有一些第三方库仍然需要用其 他方式尝试安装。
II、自定义安装
①自定义安装指按照第三方库提供的步骤和方式安装。第 三方库都有主页用于维护库的代码和文档。以科学计算 用的numpy为例,开发者维护的官方主页是:http://www.numpy.org/
②浏览该网页找到下载链接,如下:
http://www.scipy.org/scipylib/download.html
③进而根据指示步骤安装。
III、文件安装
①为了解决这类第三方库安装问题,美国加州大学尔湾分 校提供了一个页面,帮助Python用户获得Windows可直 接安装的第三方库文件,链接地址如下:
http://www.lfd.uci.edu/~gohlke/pythonlibs/
②这里以scipy为例说明,首先在上述页面中找到scipy库 对应的内容。选择其中的.whl文件下载,这里选择适用 于Python 3.5版本解释器和32位系统的对应文件:scipy- 0 . 1 7 . 1 - cp3 5 - cp3 5m-win3 2 .whl,下载该文件到 D:pycodes目录。
③然后,采用pip命令安装该文件。
:>pip install D:pycodesscipy-0.17.1-cp35-cp35m-win32.whl Processing d:pycodesscipy-0.17.1-cp35-cp35m-win32.whl Installing collected packages: scipy Successfully installed scipy-0.17.1
对于上述三种安装方式,一般优先选择采用pip 工具安装,如果安装失败,则选择自定义安装或 者文件安装。另外,如果需要在没有网络条件下 安装Python第三方库,请直接采用文件安装方 式。其中,.whl文件可以通过pip download指 令在有网络条件的情况下获得。
2、pip工具使用
I、执行pip -h将列出pip常用的子命令
II、pip支持安装(install)、下载(download)、 卸载(uninstall)、列表(list)、查看(list)、 查找(search)等一系列安装和维护子命令。
①pip的uninstall子命令可以卸载一个已经安装的 第三方库,格式如下:
pip uninstall
②pip的list子命令可以列出当前系统中已经安装的 第三方库,格式如下:
pip list
③pip的show子命令列出某个已经安装库的详细信 息,格式如下:
pip show
④pip的download子命令可以下载第三方库的安装 包,但并不安装,格式如下:
pip download
⑤pip的search子命令可以联网搜索库名或摘要中关键字, 格式如下:
pip search
以查询含有installer单词的库为例,执行效果如下:
三、PyInstaller库概述
1、PyInstaller是一个十分有用的Python第三方库,它能够 在Windows、Linux、Mac OS X等操作系统下将Python 源文件打包,变成直接可运行的可执行文件。
2、通过对源文件打包,Python程序可以在没有安装Python 的环境中运行,也可以作为一个独立文件方便传递和管 理。
:>pip install PyInstaller
四、PyInstaller库与程序打包
1、使用PyInstaller库对Python源文件打包十分简单, 使用方法如下:
2、执行完毕后,源文件所在目录将生成dist和build 两个文件夹。最终的打包程序在dist内部与源文 件同名的目录中。
3、可以通过-F参数对Python源文件生成一个独立的 可执行文件,如下:
:>PyInstaller -F SnowView.py
4、执行后在dist目录中出现了SnowView.exe文件, 没有任何依赖库,执行它即可显示雪景效果。
五、jieba库概述
1、由于中文文本中的单词不是通过空格或者标点符 号分割,中文及类似语言存在一个重要的“分词” 问题。
2、jieba(“结巴”)是Python中一个重要的第三 方中文分词函数库
:>pip install jieba
3、jieba库的分词原理是利用一个中文词库,将待分 词的内容与分词词库进行比对,通过图结构和动 态规划方法找到最大概率的词组。除了分词, jieba还提供增加自定义中文单词的功能
4、jieba库支持三种分词模式:
精确模式,将句子最 精确地切开,适合文本分析;
全模式,把句子中 所有可以成词的词语都扫描出来,速度非常快, 但是不能解决歧义;
搜索引擎模式,在精确模式 基础上,对长词再次切分,提高召回率,适合用 于搜索引擎分词
5、对中文分词来说,jieba库只需要一行代码即可。
>>>import jieba>>>jieba.lcut("全国计算机等级考试")Building prefix dict from the default dictionary ... Loading model from cache C:AppDataLocalTempjieba.cache Loading model cost 1.001 seconds.Prefix dict has been built succesfully.['全国', '计算机', '等级', '考试']
六、jieba库与中文分词
1、ieba.lcut(s)是最常用的中文分词函数,用于精准 模式,即将字符串分割成等量的中文词组,返回 结果是列表类型。
>>>import jieba>>>ls = jieba.lcut("全国计算机等级考试Python科目")>>>print(ls)['全国', '计算机', '等级', '考试', 'Python', '科目']
2、jieba.lcut(s, cut_all = True)用于全模式,即将字 符串的所有分词可能均列出来,返回结果是列表 类型,冗余性最大
>>>import jieba>>>ls = jieba.lcut("全国计算机等级考试Python科目