目的:学习以Python为基础的生物信息学数据处理。这里的所有工作在MacOS进行。
笔记1:Python运行环境的安装
Anaconda是免费的Python运行平台,从官网下载安装:https://www.anaconda.com/。程序中的Jupyter Notebook是一个非常好的学习python的应用,可用于作笔记和运行python代码。
编写Python代码,建议使用PyCharm(或者Vim),使用txt编辑器会有一些隐藏格式上的问题。PyCharm下载地址:https://www.jetbrains.com/pycharm/。PyCharm是收费软件,但可以选择试用,到期后仍可继续使用,但每30分软件会重启。由于软件会自动保存数据,所以可以继续使用。
Bioconda是一个可以方便安装很多生物信息学包的平台,我选择使用它进行数据分析。Bioconda是Conda下的一个Channel。选择安装Bioconda之前,需要安装Conda。由于Conda是Anaconda的一部分,如果已经安装了Anacoda,则不必安装Conda,否则需要安装Minicoda。Miniconda是Conda的安装包名称,用于与Anaconda区分。
安装方式:在MacOS Terminal中分别运行以下代码。后两个是分别安装r和conda-forge
conda config --add channels bioconda
conda config --add channels r
conda config --add channels conda-forge
查看安装是否成功:打开Anaconda,在Environments - Channels 下可看到已安装的Channel,如下:
使用代码查看所有Channel:在Home - Jupyter Lab中,进入Console,输入以下代码,按Shift + 回车(在别的地方可能只需要回车即可)
conda config --show channels
查看所有Package:在Console中,输入并执行代码:conda list
当要使用一个package时,在代码开始写入import package_name。比如安装好Bioconda后,系统自动安装了numpy这一个package,我们使用它,并查看它的版本信息。代码如下:
import numpy as np
print(np.__version__)
这里import as可以将package名称进行临时修改,方便下面使用