Colab简介

Colab的使用界面类似jupyter notebook。运行于虚拟机(VM)上。虚拟机配置K80 GPU,12G内存,39G硬盘空间。缺点是最多只能运行12小时,时间一到就会清空VM上所有数据。这包括我们安装的软件,包括我们下载的数据,存放的计算结果。

Colaboratory 是免费的 Jupyter 笔记本环境,不需要进行任何设置就可以使用,并且完全在云端运行。

 

支持 GPU 的 TensorFlow,简单设置即可:

gpu 云服务 gpu 云服务 colab_Google

gpu 云服务 gpu 云服务 colab_Google Colab_02

目前Colab只提供Tesla K80 GPU,你同时可以利用下面的指令来查看:

from tensorflow.python.client import device_lib 
device_lib.list_local_devices()

能显示出你的所有使用的硬件;

gpu 云服务 gpu 云服务 colab_Google_03

运行中的信息显示 
我们还需要查看内存信息或者CPU信息,可以使用下面的命令: 
内存:!cat /proc/meminfo 
处理器:!cat /proc/cpuinfo

!ls /proc
#CPU信息
!cat /proc/cpuinfo
#内存
!cat /proc/meminfo
#版本
!cat /proc/version
#设备
!cat /proc/devices
#空间
!df

 

挂载google本地云盘

Mounting Google Drive locally

from google.colab import drive
drive.mount('/content/gdrive')

gpu 云服务 gpu 云服务 colab_gpu 云服务_04

 

切换工作路径

在colab环境中,我们挂载Google drive的位置是 /content/drive/ 。

colab中的notebook和py文件默认都是以 /content/ 作为工作目录,需要执行一下命令手动切换工作目录,例如:

import os

path = "/content/drive/colab-notebook/lesson1-week2/assignment2"
os.chdir(path)
os.listdir(path)

 

测试:

上传图片:

from google.colab import files

uploaded = files.upload()

for fn in uploaded.keys():
  print('User uploaded file "{name}" with length {length} bytes'.format(
      name=fn, length=len(uploaded[fn])))

新建文件、下载文件:

from google.colab import files

with open('example.txt', 'w') as f:
  f.write('some content')

files.download('example.txt')

 

gpu 云服务 gpu 云服务 colab_gpu 云服务_05

 

1.使用gfile读图片,decode输出是Tensor,eval后是ndarray

import matplotlib.pyplot as plt
import tensorflow as tf
import numpy as np
from google.colab import files

print(tf.__version__)

#with open('/content/gdrive/My Drive/a(2).jpg', 'r') as f:
#  f.write('Hello Google Drive!')

image_raw = tf.gfile.FastGFile('gdrive/My Drive/a (2).jpg','rb').read()   #bytes
#image_raw = tf.gfile.FastGFile('颜值.png','rb').read()  
img = tf.image.decode_jpeg(image_raw)  #Tensor
#img2 = tf.image.convert_image_dtype(img, dtype = tf.uint8)

with tf.Session() as sess:
    print(type(image_raw)) # bytes
    print(type(img)) # Tensor
    #print(type(img2))

    print(type(img.eval())) # ndarray !!!
    print(img.eval().shape)
    print(img.eval().dtype)

#    print(type(img2.eval()))
#    print(img2.eval().shape)
#    print(img2.eval().dtype)
    plt.figure(1)
    plt.imshow(img.eval())
    plt.show()

gpu 云服务 gpu 云服务 colab_Google Colab_06

2.使用WholeFileReader输入queue,decode输出是Tensor,eval后是ndarray

import tensorflow as tf
import os
import matplotlib.pyplot as plt

def file_name(file_dir):   #来自
    for root, dirs, files in os.walk(file_dir):  #模块os中的walk()函数遍历文件夹下所有的文件
        print(root) #当前目录路径  
        print(dirs) #当前路径下所有子目录  
        print(files) #当前路径下所有非目录子文件  

def file_name2(file_dir):   #特定类型的文件
    L=[]   
    for root, dirs, files in os.walk(file_dir):  
        for file in files:  
            if os.path.splitext(file)[1] == '.jpg':   
                L.append(os.path.join(root, file))  
    return L 

path = file_name2('test')


#以下参考 (十图详解TensorFlow数据读取机制)
#以及

#path2 = tf.train.match_filenames_once(path)
file_queue = tf.train.string_input_producer(path, shuffle=True, num_epochs=2) #创建输入队列  
image_reader = tf.WholeFileReader()  
key, image = image_reader.read(file_queue)  
image = tf.image.decode_jpeg(image)  

with tf.Session() as sess:  
#    coord = tf.train.Coordinator() #协同启动的线程  
#    threads = tf.train.start_queue_runners(sess=sess, coord=coord) #启动线程运行队列  
#    coord.request_stop() #停止所有的线程  
#    coord.join(threads)  

    tf.local_variables_initializer().run()
    threads = tf.train.start_queue_runners(sess=sess)

    #print (type(image))  
    #print (type(image.eval()))  
    #print(image.eval().shape)
    for _ in path+path:
        plt.figure
        plt.imshow(image.eval())
        plt.show()

gpu 云服务 gpu 云服务 colab_免费GPU服务器_07

 

3.使用read_file,decode输出是Tensor,eval后是ndarray

import matplotlib.pyplot as plt
import tensorflow as tf
import numpy as np

print(tf.__version__)

image_value = tf.read_file('test/a.jpg')
img = tf.image.decode_jpeg(image_value, channels=3)

with tf.Session() as sess:
    print(type(image_value)) # bytes
    print(type(img)) # Tensor
    #print(type(img2))

    print(type(img.eval())) # ndarray !!!
    print(img.eval().shape)
    print(img.eval().dtype)

#    print(type(img2.eval()))
#    print(img2.eval().shape)
#    print(img2.eval().dtype)
    plt.figure(1)
    plt.imshow(img.eval())
    plt.show()

gpu 云服务 gpu 云服务 colab_gpu 云服务_08

 

训练数据放到谷歌云盘上,

注意 数据路径,与在本地路径,有所差异:

!cd  gdrive
!ls gdrive/'My Drive'/Cats_vs_Dogs-master/data
!pwd

gpu 云服务 gpu 云服务 colab_TensorFLow_09

 

 

GitHub

您可以通过依次转到“文件”>“在 GitHub 中保存一份副本…”,保存一个 Colab 笔记本副本

只需在 colab.research.google.com/github/ 后面加上路径,即可在 GitHub 上加载任何 .ipynb。例如,colab.research.google.com/github/tensorflow/models/blob/master/samples/core/get_started/_index.ipynb 将在 GitHub 上加载此 .ipynb

gpu 云服务 gpu 云服务 colab_TensorFLow_10

gpu 云服务 gpu 云服务 colab_gpu 云服务_11

gpu 云服务 gpu 云服务 colab_Google_12

下载GitHub到Colab:

!git clone https://github.com/wxs/keras-mnist-tutorial.git 'TerenceDrive/Colab Notebooks/keras-mnist-tutorial'

 

 

本地运行时支持

Colab 支持连接本地计算机上的 Jupyter 运行;这样一来,您就可以在本地硬件上执行代码并访问本地文件系统。

参考链接:

https://research.google.com/colaboratory/local-runtimes.html

1、打开本地Jupyter

2、安装并启用jupyter_http_over_ws 扩展程序;(一次性)

pip install jupyter_http_over_ws
jupyter serverextension enable --py jupyter_http_over_ws

gpu 云服务 gpu 云服务 colab_TensorFLow_13

3、打开Anaconda Prompt,输入命令:

jupyter notebook --NotebookApp.allow_origin='https://colab.research.google.com'  --port=8899 --NotebookApp.port_retries=0

gpu 云服务 gpu 云服务 colab_gpu 云服务_14

gpu 云服务 gpu 云服务 colab_gpu 云服务_15

 

4、在 Colaboratory 中,点击“连接”按钮,然后选择“连接到本地运行时…”。在随即显示的对话框中输入上一步中的端口,然后点击“连接”按钮。

gpu 云服务 gpu 云服务 colab_免费GPU服务器_16

gpu 云服务 gpu 云服务 colab_TensorFLow_17

gpu 云服务 gpu 云服务 colab_gpu 云服务_18

本地浏览器窗口:

gpu 云服务 gpu 云服务 colab_Google_19

gpu 云服务 gpu 云服务 colab_gpu 云服务_20

 

可以尝试在Google Colab上的GPU训练ai challenger 场景分类:

TensorFlow全流程样板代码:以ai challenger 场景分类和slim预训练模型为例