一
导入pandas包
In [1]:
import pandas as pd
二
读取数据
读取文本文件pd.read_table,读取excel文件,
可以用df = pd.read_excel('*.xlsx',sheet_name='*')。
In [2]:
df = pd.read_table('subsample_otu.tax.0.03.xls')
如下图所示,门水平有12个门的数据。
三
查看待拆分的门
In [3]:
df['phylum'].unique()
Out[3]:
array(['Acidobacteria', 'Actinobacteria', 'Armatimonadetes', 'Bacteroidetes', 'Chloroflexi', 'Firmicutes', 'Fusobacteria', 'Gemmatimonadetes', 'Planctomycetes', 'Proteobacteria', 'Spirochaetes', 'Synergistetes'], dtype=object)
四
生成Excel文件
根据门水平名称,提取对应门水平的信息,并生成以门水平名称命名的Excel文件。
In [4]:
for i in df['phylum'].unique(): df[df['phylum']==i].to_excel(i+".xls",index=False)
Out[4]:
作者:大熊
审核:有才