导入pandas包

In [1]:

import pandas as pd

读取数据


读取文本文件pd.read_table,读取excel文件, 可以用df = pd.read_excel('*.xlsx',sheet_name='*')。 In [2]:

df = pd.read_table('subsample_otu.tax.0.03.xls')


如下图所示,门水平有12个门的数据。

5个一行 python输出1数 怎么一行输出5个数python_数据

查看待拆分的门

In [3]:

df['phylum'].unique()

Out[3]:

array(['Acidobacteria', 'Actinobacteria', 'Armatimonadetes',       'Bacteroidetes', 'Chloroflexi', 'Firmicutes', 'Fusobacteria',       'Gemmatimonadetes', 'Planctomycetes', 'Proteobacteria',       'Spirochaetes', 'Synergistetes'], dtype=object)

生成Excel文件

根据门水平名称,提取对应门水平的信息,并生成以门水平名称命名的Excel文件。

In [4]:

for i in df['phylum'].unique():    df[df['phylum']==i].to_excel(i+".xls",index=False)

Out[4]:

5个一行 python输出1数 怎么一行输出5个数python_数据_02


作者:大熊

审核:有才