2024年5月23日发(作者:)

基于深度学习技术的智能化无人机视觉系统设计研究

RESEARCH ON THE DESIGN OF SMART UAV VISION SYSTEM BASED ON DEEP

LEARNING TECHNOLOGY

中国矿业大学 苏佳媛

传统无人机不能够对所获取的数据信息进行智能化处理

导致处理结

摘 要

果不够精准

抑制了相关工作的顺利开展

为了有效解决这类问题

本文以深

度学习技术为支持

对智能化无人机视觉系统的设计思路进行探究

通过将深

度学习技术中的协同神经网络这一思想应用到无人机的智能化中

能够让无人

机的目标识别

飞行控制

智能检测以及障碍规避得到一定程度的改良与优化

从而有效降低其实现难度

深度学习技术

智能化无人机

视觉系统设计

关键词

中图分类号

TP391 文献标识码

A

文章编码

1672-7053(2020)12-0152-02

The traditional UAV can not process the acquired data information

Abstract

intelligently, which results in the inaccurate processing results and the smooth

development of related work. In order to effectively solve these problems, this paper

takes deep learning technology as the theoretical support to explore the design

concept and design ideas of intelligent UAV vision system. By applying the idea of

collaborative neural network in deep learning technology to the intelligence of UAV,

it can make UAV target recognition, flight control, intelligent detection and obstacle

avoidance to a certain extent The degree of improvement and optimization, effectively

reducing the difficulty of its implementation.

Deep learning technology; Intelligent UAV; Vision system

Key Words

图1 智能化无人机视觉系统的组成

基本特征

同时智能化无人机视觉系统并不单单意味着对自身进

行智能化处理

在物联网之中同样能够产生至关重要的作用

相关通信提供传播媒介方面的支持

智能化无人机视觉系统主要

是以深度学习为技术基础

包含了上位机以及无人机飞行器这两

个部分

具体如图1所示

在无人机飞行器之中

主要包含了软件以及硬件

其中硬件

是由机载运动相机以及无人机飞行器这两个模块

无人机通过数

传电台来和地面站就所采集的数据信息进行交流与共享

而机载

运动相机则通过自身所具备的无线传导功能来和地面站建立联

[2]

为了有效避免紧急情况产生而引发的无人机失控现象

术人员会在智能化无人机之中添加一个遥控接收机这一装备

1相关概念概述

1.1深度学习技术

深度学习技术的全称是Deep Learning

在19世纪90年代

末逐渐成为了人工智能的热门研究领域

它是机器学习中的重要

组成部分

主要是通过神经网络来形成一个较为完善的机器学习

模式

结合底层组合特性来实现更高的属性类别表示

这样一来

所产生的数据信息就会以分布式特点的形式体现出来

[1]

在深度

学习之中最为关键的模型结构便是神经网络

由此能够看出深度

学习的本质在于堆叠一个又一个神经网络

让神经网络输入至输

出最长路径长度得以提升

进而构建一个完善的函数关系

深度

学习技术能够自动学习要建模数据的潜在分布的多层表达

其核

心技术是监督和非监督学习算法

通过这种监督和非监督学习算

法自动地学习到不同数据的多种特征

更好地表达数据

1.2智能化无人机视觉系统

智能化无人机视觉系统主要是指在该系统之中能够实现自主

飞行目的

充分摆脱相关技术人员的控制

体现出

无人

这一

作者简介

此来让地面站能够通过遥控器的使用来实现对无人机的接管

无人机云台之中会挂载一个具备较强专业性能的运动相机

无人

机飞行控制模块能够利用云台所提供的功能来对相机的实际拍摄

角度以及拍摄姿势进行合理地调整

而在无人机飞行器中

主要

是采取了RT-Thread这一实时操作系统软件

并且以此为基础将

原有的神经网络库以及机器视觉库相关数据信息进行了移植

此来完成视觉应用平台的搭建

能够给后续视觉应用开发奠定坚

实的理论基础

在智能化无人机视觉系统之中

主要是将平板设备当做上位

可以有效操作无人机以及机载运动相机

并且具备目标检测

以及图像处理这方面的功能

上位机主要是通过数传电台来和无

人机进行通信

所遵循的通信协议为MAVLink协议

上位机的地

面站软件能够对相继的拍摄进行全方位地控制

接受相机所拍摄

的图像并对其进行处理

2基于深度学习技术智能化无人机视觉系统设计思路

2.1搭建无人机硬件平台

苏佳媛/1995年生/女/江苏徐州人/硕士在读/研究方向为设计学

江苏徐州221116

152

/

INDUSTRIAL DESIGN

工业设计

本次研究主要采取了开源Pix Hawk飞控拼装制作而成的无

人机

主要包括了机载运动相机以及四旋翼无人机

其中四旋

翼无人机主要是将Pix Hawk作为核心

通过STM32F103以及

STM32F247为协助控制器以及主要控制器

其具体参数如表1

所示

表1 四旋翼无人机规格参数

设备名规格参数

飞行控制器PixHawk2.4.6

动力4个无刷电机

传感器GPS

通信433MHz数传电台

电源格式5300mAh 14.8V锂离子电池

相机主要是在挂载于四旋翼无人机云台下方

该搭建无人机

硬件云台能够适当调整翻滚角度

进而直接在地面总站台对相机

进行有效地控制

其主要参数如表2所示

表2 相机规格参数

指标名参数

处理器安霸A9SE

Wi-Fi双频2.4GHz/5GHz

802.11a/b/n

重量94g

图像最大分辨率3840X2160

2.2构建无人机实时操作系统

在智能化无人机之中

所采取的实时操作系统主要是RT-

Thread系统

Real-Time Thread

),

属于嵌入式实时多线程操作

系统的范畴

构建的无人机实时操作系统具备较为分明的架构以

及较高的模块化程度

相关技术人员能够较为轻易地对其进行剪

与市场中应用较为广泛的Linux系统相比

RT-Thred系统有

着较高的实时性

较小的体积以及功耗

不会耗费大量的成本

且占用资源相对较小

启动速度更快

为低端的MCU之中

也能够应用于

并且RT-Thread

十分契合无人机应用于各

类资源受限的环境之下

[3]

ARM9

不单单能够应用于较

ARM11以及ARM

Cortex-A 系列级别的应用处理器之中

其实际结构如2所示

图2 RT-Thread操作系统的结构

从上图中能够得知

这一系统的核心部分在于内核层

主要

包含了内存管理

邮箱

多线程调度

定时器

消息队列等功能

libcpu / BSP主要是指硬件抽象层

主要包含了CPU移植以及外

设驱动

将RT-Thread操作系统应用于无人机操作系统之中

要有着以下几个方面的优点

一是属于硬实时系统的范畴

能够

充分迎合无人机在实时性方面的需求

[4]

进行最大地减少

具备自动化功耗控制这一功能

二是能够对系统的功耗

三是其网络协

议栈较为丰富

当前能够支持商场中的4G

5G移动通信

四是

多媒体软件包数量众多

处理相关图像信息更为便捷

五是提供

了数量众多的云SDK

和物联网有着密切的联系

使得云计算技

术能够有效应用于无人机之中

2.3提供深度学习技术支持

无人机所使用的深度学习框架应该对无人机硬件具有较好

的优化

同时尽可能地减少第三方的依赖

同时又要尽可能支持

主流的网络和模型

据此

移植移动端已有的深度学习框架是比

较合适的选择

本文通过移植腾讯的 ncnn 神经网络计算框架到

RT-Thread 操作系统

为无人机提供深度学习支持

ncnn 从设计

上考虑移动端的部署和应用

并且具有良好的跨平台性

无任何

第三方库依赖

不依赖 BLAS 等计算框架

ncnn 满足具有以下

优点

使其能作为智能化无人机深度学习支持平台

(1)支持大

部分常用的 CNN 网络

如主流的 VGG

Goog Le Net

Resnet

Squeeze Net

YOLO

(2)纯 C++ 实现

通常深度学习框架会

依赖 BLAS 和 LAPACK 等计算库

而后者部分代码往往使用

Fortran 语言编写

难以移植

(3) ARM NEON 汇编优化

NEON

是 ARM Cortex-A 系列芯片中的一种 SIMD指令集

在单个 CPU

指令周期完成多组数据的运算

目前无人机设备常用ARM 芯

使用 NEON 指令集实现卷积层

全连接层

池化层等大部

分CNN 的关键层

能有效地提升计算性能

(4)通常卷积层在计

算卷积时

为利用优化过的高效的通用矩阵乘法函数

General

Matrix Multiplication

),

会将一个 H × W × C 的特征图拆分重组

为 N个 K2 × C 维向量

即一个

K2C

× N 的矩阵

其中 K 为

卷积核的长宽

同时将 D 个 K × K × C 的卷积核重组为一个 D

×

K2C

的矩阵

两个矩阵通过一个矩阵乘法得到一个输出矩

再改变为相应输出的形状

得到输出张量

即完成出一个卷

积层的计算

这种计算卷积的方法会造成大量的数据冗余

[5]

ncnn 中卷积层采用原始的滑动窗口卷积实现

然后进行优化

避免在中间计算过程构造出较大的矩阵

减少内存占用

(5)整

体库体积较小

低于 500KB

无人机系统通常存储空间有限

Pixhawk仅提供 2MB 大小的闪存用于存储程序

而 Ardupilot 提

供的 Pixhawk 飞控固件仅 1.1MB

较小的第三方神经网络库可以

尽量降低对存储空间的要求

3结语

综上所述

传统无人机视觉系统中存在着一定的弊端

无法

深入处理所获取的各类数据信息

因此本次研究引入了深度学习

技术

在无人机视觉系统中移植了ncnn作为其深度学习的主要

框架

能够有效解决这类问题

并且维持无人机的稳定飞行

效提升无人机执行相关任务的质量及效率

值得大力推广

参考文献

[1]何金

丁勇

杨勇

未知环境下基于PF-DQN的无人机路径规划[J]

兵工自动化

2020

39

09

):

15-21

[2]马玲

一体式六旋翼无人机机架设计及3D打印[J]

计算机产品与流通

2020

10

):

288

[3]杨树峰

隋虎林

闫新

基于系留式无人机的高空基站通信系统设计与应用[J]

电子世界

2020

16

):

136-137

[4]杨焰飞

曹阳

基于深度学习的无人机拍摄图像绝缘子目标检测[J]

激光杂志

2020

[5]

吴兆香

10

):

63-66

欧阳权

41

王志胜

基于人工智能的无人机区域侦察方法研究现状与发展[J]

航空

科学技术

2020

31

10

):

57-68

INDUSTRIAL DESIGN

工业设计 /

153