薅资本主义羊毛,免费用Google的GPU|教程

夏乙 编译自 Medium

量子位 出品 | 公众号 QbitAI

薅资本主义羊毛,免费用Google的GPU|教程

英伟达Tesla K80 GPU,2599美元一块,还很难买到;搭载K80的AWS EC2 P2实例,用起来也很肉疼。

高大上的GPU,不花钱也能用上。Google的一项免费云端机器学习服务,最近也用上了Tesla K80。

这么好的羊毛,当然要薅起来啊!

这项资本主义社会的伟大创造,就是Google Colab,你可以用它来提高Python技能,也可以用Keras、TensorFlow、PyTorch、OpenCV等等流行的深度学习库来练练手,开发深度学习应用。

不错嘛,怎么用呢?

准备工作

在Google Drive上创建文件夹

薅资本主义羊毛,免费用Google的GPU|教程

Colab用的数据都存储在Google Drive云端硬盘上,所以,我们需要先指定要在Google Drive上用的文件夹。

比如说,可以在Google Drive上创建一个“app”文件夹,或者其他什么名字,也可以选择Colab笔记本默认的文件夹。

薅资本主义羊毛,免费用Google的GPU|教程

新建Colab笔记本

在刚刚创建的app文件夹里点击右键,选择“More”,然后从菜单里选择“Colaboratory”,这样就新建出了一个Colab笔记本。

薅资本主义羊毛,免费用Google的GPU|教程

点击笔记本的名字,可以重命名。

薅资本主义羊毛,免费用Google的GPU|教程

设置免费GPU

这一步,要改变笔记本所用的默认硬件。在笔记本里点Edit>Notebook settings(编辑>笔记本设置),或者Runtime>Change runtime type(运行时>改变运行时类型),然后在Hardware accelerator(硬件加速器)一栏选择GPU。

薅资本主义羊毛,免费用Google的GPU|教程

然后,Google Colab就可以用了。

用Colab运行基本Python代码

薅资本主义羊毛,免费用Google的GPU|教程

我们来运行一些Python Numpy教程里的基本数据类型代码。

薅资本主义羊毛,免费用Google的GPU|教程

这些代码来自斯坦福大学卷积神经网络与视觉识别课程(CS231n)的Python Numpy教程,

地址:http://cs231n.github.io/python-numpy-tutorial/

运行结果如你所料。

用Colab运行.py文件

先运行下面这些代码,来安装必要的库、执行授权。

!apt-get install -y -qq software-properties-common python-software-properties module-init-tools
!add-apt-repository -y ppa:alessandro-strada/ppa 2>&1 > /dev/null
!apt-get update -qq 2>&1 > /dev/null
!apt-get -y install -qq google-drive-ocamlfuse fuse
from google.colab import auth
auth.authenticate_user()
from oauth2client.client import GoogleCredentials
creds = GoogleCredentials.get_application_default()
import getpass
!google-drive-ocamlfuse -headless -id={creds.client_id} -secret={creds.client_secret} < /dev/null 2>&1 | grep URL
vcode = getpass.getpass()
!echo {vcode} | google-drive-ocamlfuse -headless -id={creds.client_id} -secret={creds.client_secret}

运行的时候应该会看到下图所示的结果:

薅资本主义羊毛,免费用Google的GPU|教程

看见那个链接之后,点击它,复制验证码并粘贴到文本框里。

授权完成后,就可以挂载Google Drive了:

!mkdir -p drive
!google-drive-ocamlfuse drive

安装Keras:

!pip install -q keras

将mnist_cnn.py文件上传到位于Google云端硬盘上的应用文件夹:

薅资本主义羊毛,免费用Google的GPU|教程

运行下面的代码,用MNIST数据集训练一个简单的卷积神经网络:

!python3 drive/app/mnist_cnn.py

薅资本主义羊毛,免费用Google的GPU|教程

从结果中可以看到,每个epoch只需要11秒。

下载泰坦尼克数据集(.csv File),显示前5行

想按照链接下载.csv文件到app文件夹,只需运行:

!wget https://raw.githubusercontent.com/vincentarelbundock/Rdatasets/master/csv/datasets/Titanic.csv -P drive/app

也可以直接将.csv文件上传到app文件夹:

薅资本主义羊毛,免费用Google的GPU|教程

然后读取app文件夹中的.csv文件,显示前5行:

import pandas as pd
titanic = pd.read_csv(“drive/app/Titanic.csv”)
titanic.head(5)

薅资本主义羊毛,免费用Google的GPU|教程

Tips

1. 如何安装库?

安装Keras:

!pip install -q keras
import keras

安装PyTorch:

!pip install -q http://download.pytorch.org/whl/cu75/torch-0.2.0.post3-cp27-cp27mu-manylinux1_x86_64.whl torchvision
import torch

安装OpenCV:

!apt-get -qq install -y libsm6 libxext6 && pip install -q -U opencv-python
import cv2

安装XGBoost:

!pip install -q xgboost==0.4a30
import xgboost

安装GraphViz:

!apt-get -qq install -y graphviz && pip install -q pydot
import pydot

安装7zip Reader:

!apt-get -qq install -y libarchive-dev && pip install -q -U libarchive
import libarchive

安装其他库:

!pip install或者!apt-get install命令。

2. GPU在干活么?

要查看你在Colab里是不是真的在用GPU,可以运行以下代码来交叉检查:

import tensorflow as tf
tf.test.gpu_device_name()

薅资本主义羊毛,免费用Google的GPU|教程

如果显示上图左侧的结果,就是在用CPU,显示右侧结果就是在用GPU。

3. 我在用哪个GPU?

from tensorflow.python.client import device_lib
device_lib.list_local_devices()

其实现在,Colab只提供Tesla K80,所以你会看到下图这样的结果:

薅资本主义羊毛,免费用Google的GPU|教程

4. RAM有多大?

!cat /proc/meminfo

薅资本主义羊毛,免费用Google的GPU|教程

5. CPU呢?

!cat /proc/cpuinfo

薅资本主义羊毛,免费用Google的GPU|教程

总结一下吧

好好学习,认真薅毛。

量子位温馨提示:自备梯子。

原文说会持续更新,推荐收藏以备不时之需:https://medium.com/deep-learning-turkey/google-colab-free-gpu-tutorial-e113627b9f5d

版权所有,未经授权不得以任何形式转载及使用,违者必究。