win maskrcnn训练自己的数据集 faster rcnn训练自己的数据_mob6454cc6bf0b7的技术博客_51CTO博客

win maskrcnn训练自己的数据集 faster rcnn训练自己的数据

关注梦里忧郁

win maskrcnn训练自己的数据集 faster rcnn训练自己的数据

转载

梦里忧郁 2024-05-13 16:25:06

文章标签 caffe faster rcnn python xml文件数据集 文章分类 机器学习人工智能

第一部分：制作自己的数据集

实验中我用的数据集是471张行人图片（由于部分原因，数据集不能公开，望大家见谅），标出其中的行人位置作为数据标签，所以我只检测了一类，原来的voc是检测20类的，这里我们为了做实验的方便，所以选择一类训练，加上背景为两类。

1、所需文件

Annotations和ImageSets和JPEGImages文件夹名称，删除其中所有的文件（保留文件夹），并删除SegmenttationClass和SegmentationObject文件夹（用不到）。其中Annotations保存标签txt转换的xml文件，ImageSets保存train.txt、trainval.txt、test.txt、val.txt四个文件分别储存在layout、main和Segmentation文件夹中，最后JPEGImages保存所训练的数据。完整格式图片如下图所示：

win maskrcnn训练自己的数据集 faster rcnn训练自己的数据_caffe faster rcnn

2、Annotations中xml文件的制作

（1）标签txt可以使用matlab或python程序制作，这里不再赘述，文件格式：

win maskrcnn训练自己的数据集 faster rcnn训练自己的数据_caffe faster rcnn_02

win maskrcnn训练自己的数据集 faster rcnn训练自己的数据_caffe faster rcnn_03

链接：http://pan.baidu.com/s/1o85scXG 密码：mo3r），生成格式如下：

win maskrcnn训练自己的数据集 faster rcnn训练自己的数据_数据集_04

win maskrcnn训练自己的数据集 faster rcnn训练自己的数据_xml文件_05

链接：http://pan.baidu.com/s/1midBOjY 密码：jelr），具体制作代码这里不再提供，大家可以用matlab或Python编写。

第二部分、修改调用文件

1、 prototxt配置文件

stage1_rpn_train.pt、stage1_fast_rcnn_train.pt、stage2_rpn_train.pt、stage2_fast_rcnn_train.pt和fast_rcnn_test.pt，修改格式如下：

num_class:2（识别1类+背景1类），cls_score中num_output：2，bbox_pred中num_output：8。（只有这3个）

num_class:2（识别1类+背景1类）

cls_score中num_output：2，bbox_pred中num_output：8（只有这2个）

2、修改lib/datasets/pascal_voc.py

self._classes = ('__background__', # always index 0
'people')（只有这一类）

3、修改lib/datasets/imdb.py

数据整理，在一行代码为 boxes[:, 2] = widths[i] - oldx1 - 1 下加入代码：

for b in range(len(boxes)):

if boxes[b][2]< boxes[b][0]:

boxes[b][0] = 0

删除原来的pascal_voc.pyc和imdb.pyc文件，重新生成这两个文件，因为这两个文件是python编译后的文件，系统会直接调用。

终端进入lib/datasets文件目录输入：

python(此处应出现python的版本)

>>>importpy_compile

>>>py_compile.compile(r'imdb.py')

>>>py_compile.compile(r'pascal_voc.py')

第三部分、训练自己的数据

终端进入py-faster-rcnn下输入：

./experiments/scripts/faster_rcnn_alt_opt.sh0 ZF pascal_voc

第四部分：demo自己刚刚生成的ZF_models

ZF_faster_rcnn_final.caffemodel拷贝到data/faster_rcnn_models（删除以前生成类似的model）中。

2、修改/tools/demo.py为：

(1) CLASSES =('__background__',

'people')（只有这两类）

(2) NETS ={'vgg16': ('VGG16',

'VGG16_faster_rcnn_final.caffemodel'),

'zf': ('ZF',

'ZF_faster_rcnn_final.caffemodel')}

(3)在训练集图片中找一张出来放入py-faster-rcnn/data/demo文件夹中，命名为000001.jpg。

'000001.jpg']（只需这一类图片的一张，其他删除或注销）

for im_name in im_names:

print '~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~'

print 'Demo for data/demo/{}'.format(im_name)

demo(net, im_name)

3、运行demo，即在py-faster-rcnn文件夹下终端输入：

./tools/demo.py --net zf

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：如何拉取openresty官方基础镜像 opensuse 镜像

下一篇：linux中配置nfs需要开放那些端口 linux中nfs客户端的配置

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 25年5月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费资料
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册