最近笔者的工作中看到了一些关于图片标注的图片,目前这些图片识别准确率已经非常高,但是任然有一些错漏之处,总的来说可以归为以下几大类:
1.标注范围不够精准,有时候将一些无用的空白处也囊括在标注范围内
2.人脸识别出错。某些地方其实并不存在人,但是却被标注到了一个人脸。
3.人脸后脑勺被识别出人脸。
4.被遮挡的人和车部分未被识别出来。
5.遮挡物本身被识别为车辆,实际上那里没有车辆。
要解决这些问题并非易事,笔者并非从事人工智能这个行业,暂且将目前的人工智能底层算法看待为统计学,在此基础上提出一些浅陋的思路。
一、一流的原始标注数据才能训练出一流的识别算法,原始数据必须精准,丝毫不差,宁要质量不要数量。
二、笔者曾经看到过dota2的人工智能OpenAI发布的一篇文章提到的一个思路,就是将大的训练任务拆解成各种小任务单独训练,最后通过规则再组合,这种办法看似增加了很多复杂度,但实际上是将复杂度从n^2变为了2n。
在这个整体思路下,具体的问题也就有了解决的可能。
1.提高原始训练数据的质量即可
2.人脸的出现的地方其实都是有迹可循的。人脸出现的地方无非就是出现在行人、摩托车、汽车标识之中。对于未出现在此处的人脸,要提高准确率阈值,比如出现在以上三类的阈值为80%、而未出现的阈值则为95%。(目前笔者接触的标识数据中车牌识别100%出现在标识为车辆的标注数据里)
3.人脸这里需要单独训练。
4.这个问题是个比较棘手的问题。
一个简单思路是,原始数据标注中只有大于50%露出面积才标注出来,同时需要运用自己的空间想象能力将被遮挡部分也标注进去。
另外一个解决方法则比较复杂,一是需要将所有的原始标注数据抠图,忽略掉其中的无关信息,且比对算法能满足这种需求。二是单独训练互相遮挡的标注数据,过了一遍基础算法后,再过一遍遮挡车辆或人的独立算法。
5.方法同上,抠图后无关信息被忽略掉后,遮挡物本身也就不再会被识别。