Anaconda
Anaconda 是一个包含数据科学常用包的发行版本。它基于 conda ——一个包和环境管理器——衍生而来。
Anaconda 实际上是一个软件发行版,它附带了 conda
、Python 和 150 多个科学包及其依赖项。应用程序 conda
是包和环境管理器。Anaconda 的下载文件比较大(约 500 MB),因为它附带了 python 中最常用的数据科学包。如果只需要某些包,或者需要节省带宽或存储空间,也可以使用 Miniconda 这个较小的发行版(仅包含 conda 和 Python)。
安装Anaconda
Anaconda 可用于 Windows、Mac OS X 和 Linux。可以在 https://www.continuum.io/downloads 上找到安装程序和安装说明。
如果计算机上已经安装了 Python,这不会有任何影响。实际上,脚本和程序使用的默认 Python 是 Anaconda 附带的 Python。
这里需要注意的是选对自己操作系统对应的版本。
安装完后打开cmd
,输入conda list
可以查看当前
安装的内容。
输入conda upgrade --all
,可以更新默认环境下的所有包。并在提示是否更新的时候输入y(Yes)以便让更新继续。初次安装下的软件包版本一般都比较老旧,因此提前更新可以避免未来不必要的问题。
管理包
conda
是一种只能通过命令行来使用的程序。类似于pip那样可以对Python库的包进行管理。
安装命令:conda install package_name
。如安装numpy,输入conda install numpy
同时安装多个包:conda install numpy scipy pandas
安装指定版本的包:conda install numpy=1.11
conda会自动安装依赖库。
卸载包:conda remove package_name
更新包:conda update package_name
更新环境中的所有包:conda update --all
列出已安装的包:conda list
为conda添加清华镜像源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
如果不知道要找的包的确切名称,可以使用 conda search search_term
进行搜索。
管理环境
除了管理包之外,conda 还是虚拟环境管理器。它类似于另外两个很流行的环境管理器,即 virtualenv 和 pyenv。
环境可以分隔不同项目的包。因为我们使用的时候会依赖于某个库的不同版本的代码或在py2和py3之间进行切换。
也可以将环境中的包的列表导出为文件,然后将该文件与代码包括在一起。这能让其他人轻松加载代码的所有依赖项。pip 提供了类似的功能,即 pip freeze > requirements.txt
创建环境:
conda create -n env_name list of packages
,-n env_name
设置环境的名称(-n
是指名称),而 list of packages
是要安装在环境中的包的列表。
创建环境时,可以指定要安装在环境中的 Python 版本。 conda create -n py3 python=3
或 conda create -n py2 python=2
。要安装特定版本(例如 Python 3.3),请使用 conda create -n py python=3.3
。
进入环境
创建了环境后,在 OSX/linux 上使用 source activate my_env
进入环境。在 Windows 上,请使用 activate my_env
。
要离开环境,请键入 source deactivate
(在 OSX/Linux 上)。在 Windows 上,请使用 deactivate
。
保存和加载环境
共享环境这项功能确实很有用,它能让其他人安装你的代码中使用的所有包,并确保这些包的版本正确。可以使用 conda env export > environment.yaml
将包保存为 YAML。第一部分 conda env export
写出环境中的所有包(包括 Python 版本)。
第二部分 > environment.yaml
将导出的文本写入到 YAML 文件 environment.yaml
中。现在可以共享此文件,而且其他人能够创建和你用于项目相同的环境。
要通过环境文件创建环境,请使用 conda env create -f environment.yaml
。这会创建一个新环境,而且它具有在 environment.yaml
中列出的同一库。
列出环境
如果忘记了环境的名称,可以使用 conda env list
或conda info -e
列出你创建的所有环境。你会看到环境的列表,而且你当前所在环境的旁边会有一个星号。默认的环境(即当你不在环境中时使用的环境)名为 root
。
删除环境
不再使用某些环境,可以使用 conda env remove -n env_name
删除指定的环境(在这里名为 env_name
)。
共享环境
共享环境
在 GitHub 上共享代码时,最好同样创建环境文件并将其包括在代码库中。这能让其他人更轻松地安装你的代码的所有依赖项。对于不使用 conda 的人,我通常还会使用 pip freeze
(在此处了解详情)将一个 pip requirements.txt
文件包括在内。
> pip freeze > requirements.txt
> pip install -r requirements.txt