深度学习实战 fashion-mnist数据集预处理技术分析_算法与编程之美的技术博客_51CTO博客

深度学习实战 fashion-mnist数据集预处理技术分析

关注算法与编程之美

深度学习实战 fashion-mnist数据集预处理技术分析

原创

算法与编程之美 2022-03-02 11:03:19 ©著作权

文章标签 数据编程之美数据集 文章分类 代码人生

©著作权归作者所有：来自51CTO博客作者算法与编程之美的原创作品，请联系作者获取转载授权，否则将追究法律责任

微信公众号："算法与编程之美"，欢迎关注，及时了解更多此系列文章。

keras的fashion-mnist数据集的源码为：

def load_data(): """Loads the Fashion-MNIST dataset. # Returns Tuple of Numpy arrays: `(x_train, y_train), (x_test, y_test)`. """ dirname = os.path.join('datasets', 'fashion-mnist') base = 'http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/' files = ['train-labels-idx1-ubyte.gz', 'train-images-idx3-ubyte.gz', 't10k-labels-idx1-ubyte.gz', 't10k-images-idx3-ubyte.gz'] paths = [] for fname in files: paths.append(get_file(fname, origin=base + fname, cache_subdir=dirname)) with gzip.open(paths[0], 'rb') as lbpath: y_train = np.frombuffer(lbpath.read(), np.uint8, offset=8) with gzip.open(paths[1], 'rb') as imgpath: x_train = np.frombuffer(imgpath.read(), np.uint8, offset=16).reshape(len(y_train), 28, 28) with gzip.open(paths[2], 'rb') as lbpath: y_test = np.frombuffer(lbpath.read(), np.uint8, offset=8) with gzip.open(paths[3], 'rb') as imgpath: x_test = np.frombuffer(imgpath.read(), np.uint8, offset=16).reshape(len(y_test), 28, 28) return (x_train, y_train), (x_test, y_test)

fashion-mnist数据集以四个gzip格式的方式存储在远程服务器上，利用keras的get_file()下载到本地的keras缓存目录。

然后利用gzip的open()打开文件，利用numpy的frombuffer方法直接加载numpy的数组。如果是图像数据的话，需要进行reshape操作。

此处，为什么加载图片数据的时候需要offset=16，标签数据的时候需要offset=8？

fashion-mnist图像数据集的预处理方式和mnist有很大的不同，四个gz文件分别存放了x_train, y_train, x_test, y_test四个部分，然后分别读取四个文件利用np.frombuffer()方式加载。这种处理方式相对mnist来说复杂一些。为什么会这样处理？

欢迎持续关注。

where2go 团队

微信号：算法与编程之美

深度学习实战 fashion-mnist数据集预处理技术分析_数据集

长按识别二维码关注我们!

“写留言”发表评论，期待您的参与！期待您的转发！

赞
收藏
评论
分享
举报

上一篇：入门|图像增强技术

下一篇：聊一聊跨学科思维

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 25年5月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册