2024年3月22日发(作者:)
2022年5月15日
第45卷第10期
现代电子技术
ModernElectronicsTechnique
May2022
Vol.45No.10
引用格式:沈钧诣,郭慧,周邵萍.改进的YOLACT算法在垃圾实时分类检测的技术研究[J].现代电子技术,2022,45(10):115⁃118.
DOI:10.16652/.1004⁃373x.2022.10.022
115
改进的YOLACT算法在垃圾实时分类
检测的技术研究
沈钧诣
1
,郭
(1.华东理工大学机械与动力工程学院,上海
摘
2
慧
1,
,周邵萍
1
200237;2.山东省临沂市河东区工业和信息化局,山东临沂276000)
要:针对垃圾目标分类检测中物体重叠检测效果差的问题,文中设计一种改进YOLACT图像分割模型,并应用于
垃圾实时检测中。根据COCO数据集制作适用于垃圾分类的数据集,通过YOLACT图像分割模型进行训练和评估监测,改
进YOLACT的主干网络模块;使用Swish激活函数调整Resnet进入层模块和下采样模块以提升图像特征,同时改进YOLACT
结构的检测模块;再使用Pointrend方法对检测出的分割结果与特征图像进行多层感知机(MLP)迭代融合,渲染深化边缘点
特征,以融合得到的新掩码层取代原输出的掩码层。最后,进行改进YOLACT算法、SOLO算法、Mask⁃RCNN算法比较和消
融实验。结果表明,改进YOLACT算法可提升精度、速度及垃圾图像分割的边缘效果,能够解决一部分垃圾重叠检测问题,
在垃圾实时检测方面有较好的应用价值。
关键词:垃圾识别;分类检测;改进YOLACT;图像分割;多层感知机;数据融合;结果分析
中图分类号:TN911.73⁃34;X705文献标识码:A文章编号:1004⁃373X(2022)10⁃0115⁃04
TechnicalresearchonimprovedYOLACTalgorithmingarbage
SHENJunyi
1
,GUOHui
1,2
,ZHOUShaoping
1
classificationreal⁃timedetection
(ofMechanicalandPowerEngineering,EastChinaUniversityofScienceandTechnology,Shanghai200237,China;
IndustryandInformationTechnologyBureau,Linyi276000,China)
Abstract:Inallusiontotheproblemofpoorobjectoverlapdetectioningarbagetargetclassificationanddetection,an
improvedYOLACTimagesegmentationmodelisdesigned,whichisappliedtothegarbagereal⁃ingtothe
training,evaluationandmonitoringit,shactivationfunctionis
COCOdatasets,adatasetsuitableforgarbagesegmentationismade,andtheYOLACTimagesegmentationmodelisusedfor
usedtoadjusttheResnetentrylayermoduleanddown⁃samplingmoduletoimproveimagecharacteristics,whilethedetection
ntrendmethodisusedtoperformtheiterativefusionofMLP(multi⁃layer
perceptron)betweenthedetectedsegmentationresultsandthefeatureimage,renderdeepentheedgepointfeatures,and
Mask⁃RCNNalgorithmandultsshowthatthe
oodapplicationvalueingarbagereal⁃timedetection.
datafusion;resultsanalysis
repACTalgorithm,SOLOalgorithm,
improvedYOLACTalgorithmcanimprovetheaccuracy,detectionspeedandtheedgeeffectofgarbageimagesegmentation,and
Keywords:garbagerecognition;classificationdetection;improvedYOLACT;imagesegmentation;multilayerperceptron;
0引言
之一,也是造成环境污染、资源再利用的困难根源之
一,随着我国经济的高速发展,城市规模逐渐扩大,城
镇人口增多,城市生活垃圾的产量迅速增长
[1]
。目前,国
外在垃圾分类领域已经使用计算机视觉技术作为提升
垃圾分类效果的手段,例如加拿大的“奥斯卡”垃圾桶、
日本的“ZenRoboticsRecycler”垃圾分拣系统、FANUC
垃圾分类是当下制约着我国环保事业发展的瓶颈
收稿日期:2021⁃10⁃19修回日期:2021⁃11⁃29
基金项目:国家自然科学基金项目(51575185)
116
现代电子技术
实例如图1所示。
2022年第45卷
视觉分拣机器人
[2]
。我国垃圾分类也迫切需要引入计算
机视觉技术,让智能垃圾分类更加便利,逐渐普及。
目前,目标检测算法因为模型小,速度快,在垃圾分
类中已得到初步应用,但是它对重叠物体容易存在漏判
误判现象。马雯等基于改进FasterR⁃CNN方法研究了
垃圾检测与分类,检测对象都是单个物体,不涉及重叠
物体
[3]
;宁凯等在研究基于视觉感知的智能扫地机器人
的垃圾检测与分类中,使用YOLOv2为主网络,识别研
究不同环境下的物体
[4]
;白阳等基于SSD研究了可回收
垃圾检测,提高了小物体的识别效率
[5]
。在垃圾分类领
域,像素级的图像分割未得到很好的使用,究其原因主
要是由于实时检测的速度不够,分割的图像边缘模糊。
对象重叠情况下的检测一直是垃圾分类中的难点。
为了解决重叠物体实时检测和错判、漏判问题,本
文提出一种改进的YOLACT图像分割模型,使用
Pointrend进行多层感知机(MLP)迭代处理,通过深化边
缘点,在不降低原有速度和精度的基础上,使分割边缘
更加明显,同时满足实时检测速度要求,提升得到的图
像特征效果,为垃圾机器人的智能抓取奠定基础。
图1垃圾分类标注实例
1.2
原始数据集输入卷积神经网络之前,对数据集进行
数据增强
预处理可获得更多的图像数据和图像特征,扩大训练数
据能够得到更好的泛化能力。处理方法有旋转、移位、
裁剪、CutMix
[7]
以及Cutout
[8]
,增强效果如图2所示。
图2垃圾图像增强效果
2
2.1
垃圾实时分割算法
将图像分割算法用于垃圾实时分割检测,以
YOLACT图像分割模型
1
1.1
垃圾分割实验数据集
目前尚无垃圾分割数据集的公开发布,本文结合
垃圾分割数据集的制作
MSCOCO数据集
[6]
自制垃圾分类数据集,使用软件
数据集以9∶1的形式划分为训练集和验证集,供神经网
YOLACT
[9]
作为基础模型,使用Resnet50和FPN作为主
干网络和特征处理层,设计Protonet模块对FPN得到的
第一层特征层卷积后与预测头的掩码系数融合处理,最
后得到掩码层作为输出的结果层,输出检测到的垃圾分
割图像。YOLACT的结构如图3所示。
Labelme对所有图片进行标注得到原始数据集,将原始
络训练使用,原始数据集共有1020张,其中部分图像
图3YOLACT结构
第10期
沈钧诣,等:改进的YOLACT算法在垃圾实时分类检测的技术研究
117
2.2改进的YOLACT
[10]
本身通
垃圾实时分割算法
过Mask⁃RCNN
[11]
得到的候选框
层ROIAlign
Pointrend
进行迭代边缘渲染,但是Mask⁃RCNN作为
二阶段网络不能满足速度需求,所以本文提出以
YOLACT
进行调整,
模型结构作为框架,
将Resnet模块进入层的
将主干网络的
7×7卷积层部分替换
Resnet模块
成Resnet⁃C变体,将Resnet模块的下采样部分替换成
Resnet⁃D
后的输出层,
变体提升图像特征质量,
Resnet变体如图4所示。
以Pointrend重处理最
图4Resnet变体
2.2.1
一般的图像分割模型用于垃圾识别检测会产生边
垃圾实时分割检测模块
缘模糊,由此得到的分割图像不利于机械臂抓取,为此,
使用Pointrend模块进行改进,流程如图5所示。从特征
层得到的P4特征层在经历上采样和卷积后,与原
YOLACT
理,MLP的参数取
结构中得到的垃圾分割图像进行
k=3,β=0.75,通过P4的特征层来优化
MLP迭代处
垃圾分割图像。
图5Pointrend结构改进流程
2.2.2
在改进
激活函数
YOLACT的网络结构中,考虑到Swish激活
函数
[12]
具备无上界有下界、平滑、非单调的特性,因而应
用Swish激活函数替代原有的ReLU激活函数,使得负
数情况下不为0,对比ReLU和ReLU的变体,得到激活
函数在深层模型上的效果会更优,公式为:
F(x)=x⋅sigmoid(βx)
(1)
Swish激活函数的参数设置为10,其图像见图6。
图6Swish函数图像
3实验结果和分析
针对本文提出的改进YOLACT垃圾实时分类检测
模型,经过自制的垃圾分割数据集训练后,进行对比实
验来检测其性能,实验平台采用单张RTX2080TI的显
卡,进行batch_size为8的训练。一般来说,多类别图像
实例分割的评价指标主要有两类:一类是平均精度均值
MeanAveragePrecision,mAP),作为图像分割的精度
评价指标,是个体平均准确率的均值
[13]
;一类是帧率
FramePerSecond,FPS),作为图像分割的速度评价指
标。本文主要解决由于边缘模糊导致的实例分割错判、
漏判问题,故采用mAP和FPS作为垃圾实时分割的性能
评价指标,同时采用实例分割的边缘效果作为效果评价
指标。
函数前后实验的结果,
1)对比YOLACT在改进
如表1所示。由表
Resnet模块和
1可见,
Swish
使用
激活
Resnet
10.37
变体和Swish激活函数之后,平均识别率提高
32.92
%,由29.00%提升至39.37%,FPS从29.48提升到
深层网络下对于垃圾分割的精度和速度有很大的提升。
。由此可见,改进Resnet模块和使用Swish函数在
分割的不同结果,
2)实验对比YOLACT
由表1可见,
添加
使用
Pointrend
Pointrend
模块前后图像
模块之后,
对比YOLACT的mAP提升0.99%,FPS几乎保持不变,
表明Pointrend模块对图像分割有提升效果。
3)实验对比YOLACT以及改进YOLACT模型,由
(
(
118
现代电子技术
2022年第45卷
表1可知,改进的YOLACT模型比传统的YOLACT有较
大提升,mAP提升10.19%,FPS提升3.26,且在图像边缘
分割的结果上,改进后模型保证了单个物体的检测精
度,对重叠物体的边缘检测也有提升,表明改进的
YOLACT有着更优的检测性能,在垃圾实时检测中有较
判、漏判问题。
表1不同模型下的mAP和FPS
YOLACT
Model
29.00
39.37
32.49
32.73
29.99
39.19
mAP
29.48
32.92
39.17
29.40
32.74
8.12
FPS
验结果表明,改进的YOLACT模型在垃圾实时检测方面
有更优越的性能。下一步将在网络的改进基础上,针对
模型迁移到开发板的轻量化问题进行深度研究,以期进
一步提高垃圾实时检测在实际应用中的速度。
注:本文通讯作者为郭慧。
参考文献
高的识别精度和较快的速度,能够解决重叠对象的错
[1]魏潇潇,王小铭,李蕾,等.1979—2016年中国城市生活垃圾产
3843.
04.
生和处理时空特征[J].中国环境科学,2018,38(10):3833⁃
YOLACT+Resnet变体+Swish
Mask⁃RCNN
SOLO
[2]耿焕学.生活垃圾分类机:辽宁,CN202097139U[P].2012⁃01⁃
[3]马雯,于炯,王潇,等.基于改进FasterR⁃CNN的垃圾检测与分
类方法[J].计算机工程,2021,47(8):294⁃300.
[4]宁凯,张东波,印峰,等.基于视觉感知的智能扫地机器人的垃
圾检测与分类[J].中国图象图形学报,2019,24(8):1358⁃1368.
科技大学学报,2020,38(6):152⁃158.
[5]白阳,刘斌,李彦彤.基于SSD的可回收垃圾检测研究[J].陕西
[6]CHENX,FANGH,LINTY,oftcococaptions:
datacollectionandevaluationserver[J].Computerscience,
2015(12):201⁃210.
YOLACT变体+Pointrend
YOLACT+Pointrend
改进YOLACT在垃圾识别方面的分割效果,如图7所
[14]
4)实验对比了其他的图像分割算法和本文提出的
示。使用同一个数据集进行训练,YOLACT变体比
SOLO
在mAP方面提高6.46%,比Mask⁃RCNN在mAP
提高6.7%,FPS提高24.62,改进YOLACT模型分割出的
图像边缘效果更为优秀。综合考量mAP、FPS和图像分
割效果,改进YOLACT在垃圾实时检测方面性能优良。
[7]YUNS,HAND,OHSJ,:regularization
strategytotrainstrongclassifierswithlocalizablefeatures[C]//
,SouthKorea:IEEE,2019:6023⁃6032.
ProceedingsoftheIEEEInternationalConferenceonComputer
[8]DEVRIEST,edregularizationof
14].https:///abs/1708.04552v1.
instancesegmentation[J].IEEE
convolutionalneuralnetworkswithcutout[EB/OL].[2022⁃01⁃
[9]BOLYAD,ZHOUC,XIAOFY,:real⁃time
analysisandmachineintelligence,2022,44(2):1108⁃1121.
transactionsonpattern
图7不同模型下的图像分割效果
[10]KIRILLOVA,WUY,HEK,end:image
segmentationasrendering[C]//ProceedingsoftheIEEE/CVF
Seattle,WA,USA:IEEE,2020:9799⁃9808.
ConferenceonComputerVisionandPatternRecognition.
[11]HEKM,GKIOXARIG,DOLLÁRP,⁃CNN
Venice:IEEE,2017:386⁃397.
4结语
针对垃圾实时检测存在重叠物体检测困难、边缘检
测模糊的问题,本文基于深度卷积神经网络模型进行改
进,提出用图像分割方法处理垃圾实时检测问题,解决
了垃圾重叠边缘模糊的难题。探索了改进Resnet网络
结构和激活函数对垃圾实时检测性能的影响,通过优化
结构完成了垃圾实时检测;改进了YOLACT结构,深化
边缘点迭代处理改进的模型相比传统的YOLACT模型
mAP提高10.19%,相较于SOLO提高6.46%;FPS基本相
近,远优于Mask⁃RCNN,边缘分割效果得到了提高。实
[C]//IEEEInternationalConferenceonComputerVision.
[12]RAMACHANDRANP,ZOPHB,ingfor
abs/1710.05941.
activationfunctions[EB/OL].[2021⁃12⁃22].https:///
[13]黄继鹏,史颖欢,高阳.面向小目标的多尺度Faster⁃RCNN检
测算法[J].计算机研究与发展,2019,56(2):319⁃327.
[14]WANGXL,KONGT,SHENCH,:segmenting
objectsbylocations[C]//EuropeanConferenceonComputer
:Springer,2020:649⁃665.
作者简介:沈钧诣(1997—),男,上海人,硕士研究生,主要研究方向为机器视觉及嵌入式应用。
郭慧(1964—),女,江西赣州人,博士,教授,主要研究方向为计算机图形学、逆向工程等。
周邵萍(1966—),女,安徽芜湖人,博士,教授,主要研究方向为流体机械及工程、状态监测与故障诊断等。


发布评论