Paddle版本:2.0.0rc
Python版本:python3
运行方式:python3命令行界面,非分布式方式
1. 安装飞桨¶
如果您已经安装好飞桨那么可以跳过此步骤。我们针对用户提供了一个方便易用的安装引导页面,您可以通过选择自己的系统和软件版本来获取对应的安装命令,具体可以点击快速安装查看。
具体步骤
在CentOS的linux机器上,安装python3,安装paddle
yum install python3
pip3 install --upgrade pip
python3 -m pip install paddlepaddle==2.0.0rc0 -i https://mirror.baidu.com/pypi/simple
2. 导入飞桨¶
安装好飞桨后我们就可以在Python程序中进行飞桨的导入。
在命令行中执行python3,开启命令行界面
import paddle
print(paddle.__version__)
2.0.0-rc0
3. 实践一个手写数字识别任务¶
对于深度学习任务如果简单来看,其实分为几个核心步骤:
- 数据集的准备和加载;
- 模型的构建;
- 模型训练;
- 模型评估。
那么接下来我们就一步一步带您通过飞桨的少量API快速实现。
3.1 数据加载¶
加载我们框架为您准备好的一个手写数字识别数据集。这里我们使用两个数据集,一个用来做模型的训练,一个用来做模型的评估。
train_dataset = paddle.vision.datasets.MNIST(mode='train')
val_dataset = paddle.vision.datasets.MNIST(mode='test')
3.2 模型搭建¶
通过Sequential将一层一层的网络结构组建起来。需要先对数据进行Flatten操作,将[1,28, 28]形状的图片数据改变形状为[1,784]。
mnist = paddle.nn.Sequential(
paddle.nn.Flatten(),
paddle.nn.Linear(784, 512),
paddle.nn.ReLU(),
paddle.nn.Dropout(0.2),
paddle.nn.Linear(512, 10)
)
3.3 模型训练¶
配置好我们模型训练需要的损失计算方法和优化方法后就可以使用fit接口来开启我们的模型训练过程。
# 预计模型结构生成模型实例,便于进行后续的配置、训练和验证
model = paddle.Model(mnist)
# 模型训练相关配置,准备损失计算方法,优化器和精度计算方法
model.prepare(paddle.optimizer.Adam(parameters=mnist.parameters()),
paddle.nn.CrossEntropyLoss(),
paddle.metric.Accuracy())
# 开始模型训练
model.fit(train_dataset,
epochs=5,
batch_size=32,
verbose=1)
Epoch 1/5
step 1875/1875 [==============================] - loss: 0.2250 - acc: 0.9025 - 9ms/step
Epoch 2/5
step 1875/1875 [==============================] - loss: 0.0969 - acc: 0.9462 - 13ms/step
Epoch 3/5
step 1875/1875 [==============================] - loss: 0.1035 - acc: 0.9550 - 12ms/step
Epoch 4/5
step 1875/1875 [==============================] - loss: 0.0316 - acc: 0.9603 - 12ms/step
Epoch 5/5
step 1875/1875 [==============================] - loss: 0.1771 - acc: 0.9637 - 12ms/step
3.4 模型评估¶
使用我们刚才训练得到的模型参数进行模型的评估操作,看看我们的模型精度如何。
model.evaluate(val_dataset, verbose=0)
{'loss': [3.576278e-07], 'acc': 0.9666}
那么初步训练得到的模型效果在97%附近,我们可以进一步通过调整其中的训练参数来提升我们的模型精度。
至此我们可以知道如何通过飞桨的几个简单API来快速完成一个深度学习任务,大家可以针对自己的需求来更换其中的代码,如果需要使用自己的数据集,那么可以更换数据集加载部分程序,如果需要替换模型,那么可以更改模型代码实现等等。后文会具体描述深度学习每个环节。
完整的代码,可以在PyCharm中运行(如果本机安装了Paddle环境)
# -*- coding: UTF-8 -*-
"""
"# -*- coding: UTF-8 -*-",第一行用来解决" Non-ASCII character"
written in
more than just one line
"""
import paddle
print(paddle.__version__)
train_dataset = paddle.vision.datasets.MNIST(mode='train')
val_dataset = paddle.vision.datasets.MNIST(mode='test')
mnist = paddle.nn.Sequential(
paddle.nn.Flatten(),
paddle.nn.Linear(784, 512),
paddle.nn.ReLU(),
paddle.nn.Dropout(0.2),
paddle.nn.Linear(512, 10)
)
# 预计模型结构生成模型实例,便于进行后续的配置、训练和验证
model = paddle.Model(mnist)
# 模型训练相关配置,准备损失计算方法,优化器和精度计算方法
model.prepare(paddle.optimizer.Adam(parameters=mnist.parameters()),
paddle.nn.CrossEntropyLoss(),
paddle.metric.Accuracy())
# 开始模型训练
model.fit(train_dataset,
epochs=1,
batch_size=32,
verbose=1)
print model.evaluate(val_dataset, verbose=0)
print("Finish")