三种常用的方式

如果在运行python脚本时需要传入一些参数,例如gpusbatch_size,可以使用如下三种方式。

  1.  
    python script.py 0,1,2 10
  2.  
    python script.py -gpus=0,1,2 --batch-size=10
  3.  
    python script.py -gpus=0,1,2 --batch_size=10

这三种格式对应不同的参数解析方式,分别为sys.argvargparsetf.app.run, 前两者是python自带的功能,后者是tensorflow提供的便捷方式。

sys.argv

sys模块是很常用的模块, 它封装了与python解释器相关的数据,例如sys.modules里面有已经加载了的所有模块信息,sys.path里面是PYTHONPATH的内容,而sys.argv则封装了传入的参数数据。

使

用sys.argv接收上面第一个命令中包含的参数方式如下:
1.  
import2.  
gpus = sys.argv[1]3.  
#gpus = [int(gpus.split(','))]4.  
batch_size = sys.argv[2]5.  
print6.

  1. print

argparse

1.  
import2.  
parser = argparse.ArgumentParser(description='manual to this script')3.  
parser.add_argument('--gpus', type=str, default4.  
parser.add_argument('--batch-size', type=int, default=32)5.  
args = parser.parse_args()6.  
print7.  
print

需要注意的是,脚本运行命令python script.py -gpus=0,1,2 --batch-size=10中的--batch-size会被自动解析成batch_size.

parser.add_argument 方法的type参数理论上可以是任何合法的类型, 但有些参数传入格式比较麻烦,例如list,所以一般使用boolintstrfloat这些基本类型就行了,更复杂的需求可以通过str传入,然后手动解析。bool类型的解析比较特殊,传入任何值都会被解析成True,传入空值时才为False

1.  
python script.py --bool-val=0 # args.bool_val=True2.  
python script.py --bool-val=False # args.bool_val=True3.  
python script.py --bool-val=     # args.bool_val=什么都不写False

通过这个方法还能指定命令的帮助信息。具体请看API文档:https://docs.python.org/2/library/argparse.html

tf.app.run

tensorflow也提供了一种方便的解析方式。
脚本的执行命令为:

python script.py -gpus=0,1,2 --batch_size=10

对应的python代码为:

1.  
import tensorflow as2.  
tf.app.flags.DEFINE_string('gpus', None, 'gpus to use')3.  
tf.app.flags.DEFINE_integer('batch_size', 5, 'batch size')4.   
5.  
FLAGS = tf.app.flags.FLAGS6.   
7.  
def main(_):8.  
print9.  
print10.   
11.  
if __name__=="__main__":12.  
tf.app.run()

几点需要注意:

tensorflow

  1. 只提供以下几种方法:

tf.app.flags.DEFINE_string

tf.app.flags.DEFINE_integer

  1. ,

tf.app.flags.DEFINE_boolean

  1. ,

tf.app.flags.DEFINE_float

  1.  四种方法,分别对应

str

int

  1. ,

bool

  1. ,

float

  1. 类型的参数。这里对

bool

  1. 的解析比较严格,传入1会被解析成

True

  1. ,其余任何值都会被解析成

False

  1. 脚本中需要定义一个接收一个参数的

main

  1. 方法:

def main(_):

  1. ,这个传入的参数是脚本名,一般用不到, 所以用下划线接收。

batch_size

  1. 参数为例,传入这个参数时使用的名称为

--batch_size

  1. ,也就是说,中划线不会像在

argparsetf.app.run()

  1. 会寻找并执行入口脚本的

main

  1. 方法。也只有在执行了

tf.app.run()

  1. 之后才能从

FLAGS

  1. 中取出参数。
    从它的签名来看,它也是可以自己指定需要执行的方法的,不一定非得叫

main

  1.  
    run(
  2.  
    None,
  3.  
    None
  4.  
    )

5 . tf.app.flags只是对argpars的简单封装。代码见

https://github.com/tensorflow/tensorflow/blob/r1.2/tensorflow/python/platform/flags.py