2024年3月18日发(作者:)
第
42
卷第
3
期
2021
年
3
月
中国农机化学报
Journal
of
Chinese
Agricultural
Mechanization
Vol.42
No.
3
Mar.
2021
DOI
:
1
0.137
3
3/
j.j
cam.
issn.2
09
5-55
53.20
21.0
3.011
改进
RetinaNet
的刺梨果实图像识别
闫建伟
1
,
2
,
张乐伟
】
,
赵源
】
,
张富贵
1
(1.
贵州大学机械工程学院
,
贵阳市
,
550025
;
2.
国家林业和草原局刺梨工程技术研究中心
,
贵阳市
,
550025
)
摘要
:
为实现加工车间刺梨果实的快速识别
,
提出一种基于改进的
RetinaNet
刺梨果实图像的识别方法
。
基于
RetinaNet
的模型
,
对
RetinaNet
框架中
Focal
loss
的
bias
进行改进,使其能根据不同的情况控制
bias
的取值
,再运用维度聚类算法
找出
Anchor
的较好尺寸并匹配到相对应的特征层
,
对卷积神经网络结构进行优化
。
通过改进
RetinaNet
目标检测算法
对
7
426
幅刺梨果实图像进行检测识别
,
并与原始
RetinaNet
目标检测算法对比
。
试验结果表明
:
改进的
RetinaNet
网络
模型识别方法对
6
类刺梨果实的识别率分别为
99.47%
,91.42%
、
96.92%
,90.92%
,96.89%
和
93.53%
,
平均识别率为
94.86%
;
相对于原始
RetinaNet
目标检测算法
,
改进算法的识别准确率提高
4.21%
,
单个刺梨果实检测时间由
60.99
ms
缩减到
57.91
ms,
检测时间缩短
5.05%
。
本文改进算法对加工车间刺梨果实的识别具有较高的正确率和实用性
。
关键词
:
卷积神经网络
;
刺梨果实
;
RetinaNet
;
标检测
;
图像识别
中图分类号:
TP391.4
文献标识码
:
A
文章编号
:
2O95-5553
(2021
)
03-0078-06
闫建伟
,
张乐伟
,
赵源
,
张富贵
.
改进
RetinaNet
的刺梨果实图像识别
[J
]
.
中国农机化学报
,
2021
,
42(3
)
:
78
:
83
Yan
Jianwei
,
Zhang
Lewei
,
Zhao
Yuan
,
Zhang
Fugui.
Image
recognition
of
Rosa
roxburghii
fruit
by
improved
RetinaNet
[
J
]
.
Journal
of
Chinese
Agricultural
Mechanization
,
2021
,
42(3
)
:
78
—
83
0
引言
近年来
,
随着深度学习理论研究的不断深入
,
基于
Anchor
目标检测框架已成为国内外卷积神经网络领
DSSD
(
Deconvolutional
Sin
g
le
Shot
Detector
)
[
13
]
、
FSSD
(
Feature
fusion
Single
Shot
multibox
Detector
)
[
14
]
以及
RetinaNet
15
〕
等
。
二阶段目标检测
算法比一阶段目标检测算法具有更高的准确率和定位
精度
,
而一阶目标检测算法
RetinaNet
在
COCO
测试
域研究的热点
。
当前
,
对基于
Anchor
的目标检测框架
的研究主要分为两类
:
一类是基于区域候选框的二阶
段目标检测框架
(
two
stage
)
算法
,
该方法先在图像上
生成若干可能包含目标的候选区域
,
然后通过卷积神
集上的结果高于二阶目标检测模型
[
15
]
。
在
RetinaNet
目标检测算法方面
,
宋欢欢等
+
6
]
将其网络层数增加到
经网络
(Convolutional
Neural
Network
,
CNN
)
分别对
这些候选区域提取特征
,
最后通过卷积神经网络进行
目标位置的回归与类别的识别
,
典型的算法有
R
:
CNN
(
Re
g
ion
Convolutional
Neural
Network
)
[
1
]
,
152
层
,
并且加入了
MobileNet
的设计思想
,
对其加速
和压缩
,
有效地提高了准确率
。
刘革等
[
17
]
为了提高模
型的前向推断速度
,
用
MobileNet
V3
替换
ResNet
—
50
[
18
]
用于基础特征提取网络
。
张物华等
[
19
]
在基础特
征提取网络中加入特征通道注意力机制模块
,
突出特
SPPNet
(Spatial
Pyramid
Pooling
Networks
)
+
]
、
Fast
RCNN
34
〕
、
Faster
RCNN
56
]
、
FPN
(Feature
Pyramid
征图中的特征通道
,
以提高精度
。
王璐璐等
+
0
]
在
C3
、
C4
层加入通道注意力模块
,
同时
,
为缓解网络的过拟
Networks
)
[
7
]
、
R
—
FCN
(
Region-based
Fully
合问题
,
在通道注意力模块的全连接层加入随机失活
机制
,
从而增强网络的鲁棒性
。
谢学立等
[
21
]
在
Convolutional
Network)
等
;
另一类为一-阶段目标检
测框架
(
one
stage
)
算法
,
该方法直接从图片获得预测
结果
,
将整个目标检测任务整合成一个端到端的任务
,
RetinaNet
结构中分别添加
bottom-up
短连接通路以
及全局上下文上采样模块
,
用来增强检测层特征的结
而且只处理一次图像即可得到目标的类别与位置信
构性和语义性
。
以上改进虽然准确率有一定提高
,但
检测效率却显著降低了
。
息
,
典型的算法有
SSD
(
Single
Shot
multibox
Detector
)
、
YOLO
(
You
Only
Look
Once
)
10
"
〕
、
针对生产车间刺梨果实识别
,
人工分拣分级效率
:
2020
6 16
:
2020
10
27
*基金项目
:
贵州省普通高等学校工程研究中心建设项目(黔教
U
KY
字
:
2017
]
015
)
;
贵州省科技计划项目(黔科合重大专项字
:
2019
]
3014
-
3
,黔科
合成果
:
2019
]
4292
号
,
黔科合平台人才
:
2019
]
5616
号
)
第一作者
:闫建伟
,
男
,
1980
年生
,
河南鹿邑人
,
博士
,
副教授,硕导
;
研究方向为深度学习
、
智能装备等
°
:
jwyan
@
第'期
闫建伟等
:
改进
RetmaNet
的刺梨果实图像识别
79
低
,
无法满足工业化加工刺梨果实的要求
,本文拟选择
一阶目标检测算法中的
RetmaNet
目标检测算法
,
以
RetimaNet
模型为基础
,
改进
bias
公式以及运用
K-
means
+
+
聚类算
,
并增
据和合理调
,
以
期实现对
加工车间的果实进行高精度
、
快速识别
。
1
数据
采集
与
处
理
1.1
数据
采集
本文刺梨果实图像于
2019
年
9
月
28
日在贵州省
龙里县
镇茶香
产业示范园区采集
,
品种为
贵龙
5
号
,
集
807
幅
。
对刺梨果实用尼康
(Nikon)D750
单反相机进行拍照
,
原
式为.
JPG,
分辨率为
6
016
像素
X4
016
像素
。刺梨果实图
集
示例如图
1
所示
。
图
1
刺梨果实图像样本示例
Fig.
1
Sample
image
of
Rosa
roxburghii
fruit
1.2
数据集样本及标签制作
从拍摄到的
807
幅
果实照片中
,
将刺梨
果实分为
6
类
。
通过
ACDSee2
0
软件将
807
幅大小为
6
016
像素
X4
016
像素的原图裁剪为多幅大小为
902
像素
X602
像素的完全包
果实的
,
对裁剪
的
行
翻转以及
45°
、90°
和
270°,
最终
得到
7
426
幅刺梨样本
。
再使用
Labellmg
软件对
7
426
幅
行
签
。
1.3
刺梨果实分类
果实
分级简图
,
如图
2
所示
。
1.2
2.1
3.1
3.2
果
图
像
分
图
Fig.
2
Classification
diagram
of
Rosa
roxburghii
fruit
image
针对采摘后的刺梨果实进行分级
,
按颜色
、
果实好
坏等情况
,
将刺梨果实图像分为
6
类
:
1.1
、
1.2
、
2.1
、
2.2
、
3.1
、
3.2
;
其中
,
1.、
2.
、
3.
等按照颜色不同进行分级
+
•
:
颜色为青色
、
2.
:
颜色
黄
、
3.
:
非以上两种情
况
]
。
.
1
、
.
2等按照果实好坏进行分级
[.
1
:
非坏果
、
.2
:
坏
果]
。
分类后各类刺梨照片数量较均衡
,
有利于后期
理
'
2
网络模型
RetinaNet的改进
RetimaNet
模型由特征提取网络
、
特征金字塔网络
、
子网络等三个模
,
其
结构如图
3
所示
。
图
3
中
A
表示特征提取
,
使用深度残
ResNet
来
对
特征的
提取;
E
表示特征
塔
网络,
A
中产生的特征
行重新组合,完成对
特征的
精细化提取
,
以
更
好地表达
;
C
表示
〕
,
用于对待
的
分类和定位
。
A
B
C
图3
RetinaNet
的网络结构
Fig.
3
Network
structure
of
RetinaNet
2.
1
偏差
bias
的改进
由于
RetinaNet
的核心是
Focal
Loss
,
在
Focal
Loss
中
,
用于分类卷积的
bras
,
可以在训练的初始阶
段提高
positive
的分类概率以及决
经云产生的正
负激
励的难易程度
。针对其无
取值
,
在原有式
(1)
的
行了改进
,
改
的计算公式如式
(2)
所示
'
bias
=
log[(1
—
(1
)
bias
=
a
log
[(1
一
.
)/
.
]"
+
,
(2)
可以控制
b
z
a
$
的取值,
根据实际情况
,
最终
得出
#
=
1.0
、
"
=
1.1
、
,
=
0.0
、
#
=
0.01
,
使得预测图像目
标的准确性上升
。
2.2
K-means+
+
聚类算法
Anchor
机制可有效解决目标检测任务中存在的
尺度及宽高比例变化范围过大等问题
。
由于原始
RetinaNet
使用的是非
的数据集
,
所以原始
RetinaNet
所选定的
Anchor
尺度和宽高比例在本文
的
不适用
。
用
K-means
+
+
聚类算法
「
坷
,
使其更加适
合
,
定位框更加精准
。
通过对
据集的
实标注
行聚
,
真实标注
宽
到模
型
大小
的聚
结果如
4
所示
'
80
中国农机化学报
2021
年
195,230
X
230
]
作为对应的
5
个特征层的
Anchor
尺
寸
,
以
[
0.5,1.0,1.5
]
作为
Anchor
的长宽比
。
3
网络模型训练步骤
改进后的卷积神经网络模型
,
对刺梨果实进行识
别的
如图
5
所示
。
待
的
果实图片
,
首先在特征提取网络图
5(a
)
中由深度残差网络
ResNet50
来完成对图像特征
的
提取
;
其
特征金字塔
图
4
真实
boxes
长宽聚类值
Fig.
4
Cluster
values
of
length
and
width
of
real
boxes
5(b)
F
图
5
(
c
)
、
图
5
(
d
)
中
,
5(a
)
中产生的特征
行重新组合
,
以
更好地
表达
;
由图
4
可知
,
有三个聚类簇
,
刺梨的宽高聚集在
运用
K
—
means
+
+
聚类算法优化
Anchor
参数
,
以
[35,33
]
、[
40,39
]
以及
[
45,44
]
附近
。
因此
,
本文将
[
90
X
90,125
X
125,160
X
160,195
X
及对其中的
bas
公式进行改进
,
使其分类和定位更
加准确
。
class+box
subnets
class+box
subnets
(a)
ResNet
(b)
feature
pyramid
net
(c)
class
subnet(top)
(d)
box
subnet(bottom)
图
5
卷积神经网络模型改进后的训
Fig.
5
Improved
training
steps
of
convolution
neural
network
model
4
试验与结果分析
4.1
软件及
硬
件
电脑配置:
Windows
10,64
位操作系统
。
笔记本
电脑
,
GeForce
GTX
1050
Ti
显卡
,
8
G
显存
;
Intel(R
)
式中:
TP
—
—
正样本被正确识别为正样本
;
TN
—
—
负
N
----
的
被正确识
。
负
:
;
改进前后
RetinaNet
g
标检测算法在不同训练轮
次的准确率和损失率如图
6
、
图
7
所示
。
1.0
0.8
Core(TM)i5
—
8300
H
处理器
,
主频
2.30
GHz,
磁盘内
存
128
GS,
编程语言是
Python
编程语言
。
从
7
426
幅刺梨样本中
,
选出
90%
即
6
683
幅刺
—
train
Acc
—
train
loss
--
val
Acc
val
loss
行
,
余下
10%
即
743
幅
行最
0.6
0.4
0.2
终检测
。
采用
RetinaNet
算法
,
在
Keras
框架下
,
并且
设置该模型的
batch-size
为
1
、
epochs
为
50
、
steps
为
1
000
0
4.2
结果分析
4.2.1
准确率和损失率对比
识
率
Acc
的计
算
如式
(
3)
所示
,
即预测
正确的样本比例
。
0
10
20
30
40
50
epoch
图
6
原始
RetinaNet
目标检测算法在
同
平均
Acc
与
loss
Fig.6
AverageAccandlosscurveoforiginal
Acc
TP
+
TN
N
(
3
)
RetinaNettargetdetectionalgorithmindi
f
erentrounds
第'期
闫建伟等
:
改进
RetinaNet
的刺梨果实图像识别
81
—
---train
train
Acc
-
loss
V
0.8
…
-val
val
Acc
loss
0.6
0.4
0.2
0
10
20
30
40
50
epoch
图
7
改进后
RetinaNet
目标检测算法在
不同轮次的平均
Acc
与
loss
曲线
Fig.
7
Average
Acc
and
loss
curve
of
the
improved
RetinaNet
target
detection
algorithm
in
different
rounds
由图
6
、
图
7
可知
,
由于改进了
RetinaNet目标检
测算法的核心部分
Focal
Loss
中的
bias
公式
,
针对刺
果实的
识别
,
改进的
RetinaNet
算法
集
、
测试集的
率
90%
以上
,
相对于原始
RetinaNet
算法
,
训练集
、
测试集的
率均
提高
1.80%
;
训练集损失率
集损失率的收敛趋
相同
,
训练集
、
测试集的损失率降低了
1.27%
。
可
,
改
的
RetinaNet
算
对
果
实
的
识别具有较高的识别率
。
4.3.2
标记框对比
随机选取一张未经训练的刺梨果实照片
(
像素大
小
:
902
X
602
)
如图
8
所示
,
分别在原始
RetinaNet
目
算
改进
RetinaNet
算法进行识
,
识别效果
(
戈
度为
80%
以上的识
)
如
图
9
、
图
10
所示
。
图
8
Fig.
8
Untrained
photos
图
9
原始
RetinaNet
目标检测算法识别效果
Fig&9
Recognitione
f
ectoforiginal
RetinaNettargetdetectionalgorithm
图
10
改进后
RetinaNet
目标检测算法识别效果
Fig&10
Recognitione
f
ectofimproved
RetinaNettargetdetectionalgorithm
由
9
、
10
可
,
改
的
RetinaNet
算法相对于原始
RetinaNet
目标检测算法有较好的效
果
:
可以使
Anchor
尺寸更加
实值
,
从而降低模
型的
度
;
识
率有不同程度提高
;
在识
1
确率
80%
以上时
,
可以
更多的刺梨果实
;
原始
RetinaNet
g
标检测算法中错误的
不
现
。
4.3.3
6
种不同刺梨果实分级对比
在未经过
的
,
按照
6
种不同刺梨
果实分级方式
,
随机各选取出
1
种
,
裁剪
素大
小为
902X
602
的图片
,
如图
11
所示
,
将其分别在原始
RetinaNet
算
改
RetinaNet
算法进行识别
,
识别结果如图
12
、
图
13
所示
。
图
11
6
种刺梨果实拼接
Fig.
11
6
kinds
of
Rosa
roxburghii
fruit
splicing
图
12
原始
RetinaNet
目标检测算法识别效果
Fig&12
Recognitione
f
ectoforiginal
RetinaNettargetdetectionalgorithm
从未经训练的
588
幅刺梨果实样本中随机选取若
干照片
,
分
原始
RetinaNet
算法和改进
的
RetinaNet
算法中进行分类识别
。
,
像素对检测时间有一定的影响
,
提
的单幅照片
像素为
300X300
;
含有单个刺梨果实
。
6
类刺梨果实
对比情况如表
1
所示
。
82
中国农机化学报
2021
年
改进前后
6
类刺梨果实识别准确率及检测时间
对比如表
1
所示
,
改进后的
RetinaNet
g
标检测算
对
6
果实的
识
率均有提高
,
提高的
幅度从
0.14%
,0.68%
,1.32%
,1.83%
,2.60%
到
4.21%
不等
,
识别准确率最高提高了
4.21%
,
识别
准确率
提高了
1.80%
o
图
13
改进后
RetinaNet
目标检测算法识别效果
Fig.
13
Recognition
effect
of
improved
单个刺梨果实检测时间为由
60.99
ms
缩减到
5
7.91
ms
,
降低
了
3.08
ms
,
与原始
RetinaNet
目标检
RetinaNet
target
detection
algorithm
测算
相比缩短了
5.05%
o
表
1
改进前后
6
类刺梨果实识别准确率及检测时间对比
Tab.
1
Comparison
of
accuracy
rate
and
detection
time
of
six
kinds
of
Rosa
roxburghii
fruit
before
and
after
improvement
识别准确率
/%
模型名称
11
识
率
/
%
1221
9509
9692
单幅检测时间
/ms
22
31
32
9339
9353
9306
9486
原
RetinaNet
改
RetinaNet
9879
9947
8882
9142
8960
9092
9268
9689
6099
5791
对比
+
0.68
+260
+183+132
+421
+014
+180
—
308
5
结论
1
)
本文针对原始
RetinaNet
g
标检测算法进行了
ConferenceonComputerVision
ICCV
)
&IEEE
,
2016&
[
5
,
RenS
,
HeK
,
GirshickR
,
etal&FasterR-CNN
!
Towards
real-time
object
detection
with
region
proposal
networks
[J,.
改进
,
通过改进
RetinaNet
框架中
Focal
loss
的
bias
公
IEEE
Transactions
on
Pattern
Analysis
k
Machine
Inte
l
igence
,
2017
,
39
(
6
)!
1137-1149.
[6,
Ren
S
Q,
He
K
M,
Girshick
R,
et
al.
Faster
R
—
CNN
:
式
、
运用维度聚类算
原
的
ReHinaNeH
模型对加工
车
Anchor
的较好
算
'
改进
的
识
Towardsreal-time
object
detection
with
region
proposal
的
果实
率较高
,
能够为
networks
[J,.
IEEE
Transactions
on
Pattern
Analysis
and
Machine
Intelligence,
2015
,
37(9)
:
1
—
14.
[
7
,
RenS
,
HeK
,
GirshickR
,
R-CNN
!
Towards
果实的快速识别奠
2
)
过改
,
原
ReHinaNeH
比
,
本文改进
RetinaNet
算
算
相
更加
;
识别
real-timeobjectdetection
withregionproposalnetworks
[
J
,
&
率
更
咼
,
最咼提升了
4.21%
,
平均提咼了
1.80%
。
单幅单个
果实
IEEE
Transactions
on
Pattern
Analysis
k
Machine
Inte
l
igence,
2017
,
39
(
6
)!
1137-1149&
[8,
Dai
J
,
Li
Y,
He
K
,
et
al.
R
—
FCN:
Object
detection
via
由
60.99
ms
缩减到
57.91
ms,
降低了
3.08
ms
。
本文改进
RetinaNet
算法
平均识
率均有不同程度提高
,
检测时间均有不
同程度降低
。
3
)
本文改进
RetimNet
目标检测算法
,
为工业生
region-based
fully
convolutional
networks
[C,.
Advances
in
neural-nformat-onprocess-ngsystems
,
2016
!
379
—
387.
[9,
Liu
W,
Anguelov
D,
Erhan
D,
et
al.
SSD
:
Single
shot
multibox
detector
[C,.
European
Conference
on
Computer
产刺梨加工车间的刺梨果实快速识别提
参考文献
[1,
Girshick
R
,
Donahue
J,
Darrell
T,
et
al.
Rich
feature
hierarchies
for
accurate
object
detection
and
semantic
segmentation
[C,.
2014
IEEE
Conference
on
Computer
Vision
.
Springer
International
Publishing
,
2016.
[10,
Redmon
J
,
Divvala
S,
Girshick
R,
et
al.
You
only
look
once
:
Unified,
real-time
object
detection
[
C
,.
IEEE
Conference
on
Computer
Vision
and
Pattern
Recognition.
IEEE,
2016
:
779
—
788.
[11,
Redmon
J
,
Farhadi
A.
YOLO9000
:
Better,
faster,
stronger
[
C
,
&IEEE
Conferenceon
Computer
Visionand
Pattern
Recognition.
IEEE,
2017
:
6517
—
6525.
Vision
and
Pattern
Recognition
,2014.
[2,
He
K,
Zhang
X
,
Ren
S,
et
al.
Spatial
pyramid
pooling
in
[
12
,
Redmon
,
Joseph
,
Farhadi
,
et
al&
YOLO
v3
!
An
deep
convolutional
networks
for
visual
recognition
[J,.
IEEE
Transactions
on
Pattern
Analysis
k
Machine
Intelligence,
2015
,
37(9)
:
1904-1916.
incrementalimprovement
[
EB
/
OL
,
h
t
p
//
arxiv
org
/
pdf/180402767pdf,
2018
[
13
,
FuC
Y
,
Liu
W
,
Ranga
A
,
etal
DSSD
!
Deconvolutional
singleshotdetector
[
EB
/
OL
,
h
t
ps
!//
www
researchgate
[3,
Girshich
R.
Fast
R
-
CNN
[CIEEE
International
ConferenceonComputerVision&IEEE
,
2015
!
1440-1448&
net/publication/
312759848_DSSD_Deconvolutional
_
Single
_
[
4
,
Ross
Girshick&Fast R
-
CNN
[
C
,
&IEEE
International
Shot_Detcctor
,
2017.
第'期
闫建伟等
:
改进
RetinaNet
的刺梨果实图像识别
83
[14
]
Li
Z
,
Zhou
F.
FSSD
:
Feature
fusion
single
shot
multibox
像中肺炎病灶检测激光与光电子学进展
,
2020
,
57
detector
[J
]
http
:
/
/arXiv
preprint
arXiv
:
1712.
00960
,
2017.
(
8
)
:
187
—
194
Zhang
Wuhua
,
Li
Qiang
,
Guan
Xin.
Detection
of
pneumonia
[15
]
Lin
T
Y,
Goyal
P,
Girshick
R
,
et
al.
Focal
loss
for
dense
lesions
in
X
—
ray
images
based
on
multi-scale
convolutional
object
detection
[C].
IEEE
International
Conference
on
Computer
Vision.
IEEE
,
2017
:
2980
—
2988.
neural
networks
[J].
Laser
&
Optoelectronics
Progress
,
2020
57
(
8
)
:
187
—
194
[20
]
王璐璐
,
张为
,
孙琦龙
.
一种改进
RetinaNet
的室内人员
+
6]
宋欢欢
,惠飞
,景首才,
等.改进的
RetinaNet
模型的车辆目
标检测
+]
.
计算机工程与应用
,
2019
,
55(13
)
:
225
—
230.
Song
Huanhuan
,
Hui
Fei
,
Jing
Shoucai
,
et
al.
Improved
RetinaNet
model
for
vehicle
target
detection
[
J
]
Computer
Engineering
and
Applications
,
2019
,
55
(13
)
:
算法
西安
电子科技大学学报
#
科学版
),
2019
46
(
5
)
:
69
—
74
104
Wang
Lulu
Zhang
Wei
Sun
Qilong
Indoor
human
detection
algorithm
based
on
improved
RetinaNet
[
J
]
Journal
of
Xidian
University
(Natural
Science
)
,
2019
,
46
225
—
230
[17
]
刘革
,
郑叶龙
,
赵美蓉.基于
RetinaNet
改进的车辆信息
(
5
)
:
69
—
74
104
检测
[J
]
计
算
机应用
,
2020
,
40(3
)
:
854
—
858.
Liu
Ge,
Zheng
Yelong,
Zhao
Meirong
.
Vehicle
information
detectionbased
onimproved
RetinaNet
[
J
]
Journalof
ComputerApplications
$
2020
$
40(
3
)
:
854
—
858
[
1
]
谢学立
,
李传祥
,
杨小冈
,等.基于动态感受野的航拍图
算
[
J
]
光学学
2020
40
(
4
)
:
107
—
119
XieXueli
LiChuanxiang
YangXiaogang
etal
Dynamic
receptive
field-based
object
detection
in
aerial
imaging
[J].
ActaOpticaSinica
2020
40
(
4
)
:
107
—
119&
[18
]
He
Kaiming
,
Zhang
Xiangyu
,
Ren
Shaoqing
,
et
al.
Deepresiduallearningforimagerecognition
[C
]
2016
IEEE
Conference
on
Computer
Vision
and
Pattern
Recognition
(
CVPR
)
.
IEEE
Computer
Society
,
2016
:
[22
]
Arthur
D
,
Vassilvitskii
S.
K-means++
:
The
advantages
of
careful
seeding
[C
]
.
Proceedings
of
the
Eighteenth
Annual
ACM
—
SIAM
Symposium
on
Discrete
770
—
778
[
9
]
张物华
,
李锵
,
关欣.
基于多尺度卷积神经网络的
X
光图
Algorithms
SODA
2007
New
Orleans
Louisiana
USA
ACM
2007&
Image
recognition
of
Rosa
roxburghii
fruit
by
improved
RetinaNet
Yan
Jianwei
1
,
$
,
Zhang
Lewei
1
,
Zhao
YuaiV
,
Zhang
Fugui
1
(1.
College
of
Mechanical
Engineering
,
Guizhou
University
,
Guiyang
,
550025
,
China
(
2.
Rssa
Engineering
Technology
Research
Centrr
,
State
Forestry
and
Grassland
Administration
,
Guiyang
,
550025
,
China
)
Abstract
:
In
order
to
realize
the
quick
recognition
of
Rosa
roxburghii
Tratt
fruit
in
the
environment
of
processing
workshop
,
it
was
proposed
a
recognition
method
based
on
the
improved
RetinaNet
Rosa
fruit
image.
Based
on
the
model
of
RetinaNet
,
the
bias
of
loss
hadbeenimprovedsothatitcouldcontrolthevalueofbiasaccordingtodi
f
erentsituations
andthenit
wasusedthedimension
clusteringalgorithmtofindoutthebe
t
ersizeofanchorand
matchittothecorrespondingfeaturelayertooptimizethestructureof
convolution
neural
network.
Through
the
identification
of
7
426
Rosa
roxburghii
Tratt
fruit
images
,
the
experimental
results
showed
that
the
improved
network
model
identification
method
could
identify
6
types
of
Rosa
roxburgh
ii
Tratt
fruits
respectively
99.47%
,
91.42%
,
96.92%
,
90.92%
,
96.89%
and
93.53
%
r
espectively
,
with
an
average recognition
rate
of
94.86
%
.
The
recognition
accuracy
of
the
imp
r
oved
algo
r
ithm
was
increased
by
4.21
%.
The
detection
time
of
single
fruit
was
reduced
from
60.99
ms
to
57.91
ms
,
which
Geduced3.08
ms
andthedetectiontimewasshoGtenedby5.05%
.TheimpGovedalgoGithm
hashigheGaccuGacyandpGacticabilityfoG
Rosa/oxbu/gh
i
fGuitGecognitioninpGocessing
woGkshop.
Keywords
:
convolution
neural
network
(
Rosa
roxburghii
Tratt
;
RetinaNet
;
target
detection
;
image
recognition


发布评论