2024年6月9日发(作者:)

Communication

&

Information

Technology

|

热点技术

I

2021

/

01

|

GPU

云服务器在人工智能领域的应用

张剑峰赵凌齐

'

罗林春

赵川斌'

1

中国电信股份有眼公司四川分公司

四川成都

610041

2中国电信股份有眼公司宜宾分公司

四川宜宾

644002

摘要

:围绕对

GPU

技术及

AI

技术与应用展开深入研究

探索了

GPU

CPU

的架构原理

应用趋势

分析

AI

技术核心要素及

AI

芯片应用趋势

介绍国内GPU

云服务器的市场现状格局

。论述

GPU

云服务器的应用空间

对未来运营商在

GPU

云服务器资源布

局方向提供建设性战略指引

关键词

GPU

CPU

GPU

云服务器

AI

芯片

中图分类号

TP29

文献标识码

B

文章编号

1672-0164

2021

01-0033-03

CPU

具备完善的

Control

DRAM

Cache

ALU;

1

绪论

云计算时代的到来

虚拟化技术将应用软件与系统硬

件全面解耦

同时推动发展

rr

架构一些列分布式的技术与

GPU

省略掉了

Control

和大量的

Cache,

设计更多的

ALU

算单元

硬件设计上

冯诺依曼架构的CPU

包含控制器单元

Conttol

[

运算器单元

计算逻辑单元

ALU

及高

速缓冲存储器

Cache

主存储器

DRAM

CPU

更利于先后

应用

这里以深入研究

GPU

和AI

技术为核心

推论

AI

技术

顺序的串行处理

。而

GPU

芯片硬件架构设计

没有控制器

单元

,节省出更大的空间设计成更多的小且高效的计算逻

辑单元

ALU

,

每列计算单元分配一份高速缓冲存储

这种架构使得

GPU

能够同时处理多任务而实现高性能

与应用的趋势发展

介绍国内

GPU

云服务器的市场现状格

论述

GPU云服务器的应用空间

对未来运营商在

GPU

云服务器资源布局方向提供建设性战略指引

的并行计算

2

GPU

云服务发展解析

2.1

CPU

GPU

的发展

追本溯源

当今云计算时代的所有云端的计算

资源

仍以总线结构的冯诺依曼结构计算机为基础

冯诺依曼结构的计算机即通过系统总线以二进

制制式处理输入的数据后进行结果输出

包括五大

组件

运算器

控制器

存储器、

输入设备

输出

1

GPU

CPU

硬件架构图闵

设备

CPU

CenttalProcessing

Unit

称为中央处理

作为计算机系统的运算和控制核心

主要完成

处理指令

执行操作

控制时间

处理数据

着重

是面向数据的处理

GPU

Graphics

Processing

Unit

称为图像处理

是一种专门图像运算工作的微处理器

又称显

示核心

、视觉处理器

显示芯片

主要面向

2D

3D

的图形处理与

HPC

高性能计算

缓勸存储

漿存

/

存储

缓存

/

存储

缓存

/

存储

两者的硬件架构有着本源的区别

如图

1

所示

2

CPU

的串行运算与

GPU的并行运算示*图

通信与信息技

*2021

年第1

总第

249

期)

|

33

2021

/

01

|

热点技术

I

Communication

&

Information

Technology

GPU

缺少控制单元

不能脱离

CPU

而独立工作

必须

CPU

进行控制调用才能工作

为了满足大规模并行处理

的业务需求

产生了具备

CPU

通用计算处理能力的GPU,

称为GPGPU,

主要是具备

GPU

的并行计算工作能力

时具备协助

CPU

通用计算运算的能力

随着

AI

技术应用的

发展

近些年也出现了

NPU

嵌入式神经网络处理器

采用"数据驱动并行计算

的架构葺擅长处理视频

像类的海量多媒体数据

基于

CPU

的衍生芯片可以说是百

家争鸣

以至于除了

CPU

以外的芯片统称为

XPU

pl

o

NVIDIA

公司

2007

年开创了并行处理编程语言

CUDA

1.0版

称为"通用并行计算架构

统一计算设备架

[4]

,促进

CPU

与GPU

并用的"协同处理

发展

时下

CUDA

体系结构已经具备完善的开发库

运行期环境

是推动

CPU

GPU

融合发展的积极推动者与践行者

2.2

GPU

虚拟化与

GPU

云服务器的应用

GPU

虚拟化主要包含硬件虚拟化及软件虚拟化

硬件

的虚拟化

GPU

硬件提供厂商主要是

Intel

和NVidia

AMD

虚拟化场景的应用中

AMD

SR-IOV

是完全基于硬件技

NVidia

GRID

是硬件与软件相结合的技术

Intel

的虚拟化方案包括有

API

转发

硬件直通

全虚

拟化

其中硬件直通是

PCI

中通用的解决方案

其他

GPU

厂商也能支撑。

软件虚拟化也出现了像

KVMVMWare

等软件实现虚拟化

目前流行的商用

GPU

虚拟化方案可以分为以下几类:

GPUS

通模式

,GPU

SRIOV

模式

GPU

半虚拟化

mediatedpassthrough

:

包括

Intel

GVT-g

Nvidia

GRID

vGPU

,

VMWare

GPU

全虚拟化

vSGA

GPU

云服务器是指具备

GPU

资源卡的云端服务器

,

以提供

GPU

的差异化计算能力

GPU

云服务器产品形态是

云端服务器含GPU

插卡

GPU

插卡的运行工作方式也分为

直通或共享

直通

硬件一对一透传给租户应用系统

,跨

VM

虚拟化平台层直接调用

GPU

资源

共享

硬件一对

多轮巡使用

通过

VM

虚拟化平台调用

GPU

资源

因GPU

插卡数量受限于服务器

PCI

插槽数

通常

GPU

云服务器的

GPU

资源均以VGPU

虚拟化

(一张卡虚多

VGPU

供多个租户使用

多卡虚拟一个用户使用

技术

方式进行共享式使用

目前国内各家云服务提供商

包括阿里

腾讯

、百

华为

运营商的中国电信天翼云

均已拥有自己的

GPU

资源池布局

,已面向公众用户提供差异化

GPU

云服务

器产品服务

3

AI

应用发展解析

34

3.1

AI

技术的核心要素解析

AI

Artificial

IntelHgence

为人工智能

人工智能可

以分为"人工

和"智能”

前者是让机器可以替代人的

劳作

后者是让机器可以拥有人类一样的智慧

包括意

思考

学习等

AI

技术将计算机的信息录入

信息

处理

信息输出

信息存储等仿生于人类的学习过程

而让计算机拥有人类的工作能力或思考学习能力

如何实现人工智能的愿景

其核心本质是解决人工智

能的三大要素问题

计算力

算法

大数据

计算力

计算机对录入信息进行加工处理

深度学

拥有强大的并行计算能力是

AI

技术发展应用的基石

犹如电力对电器的支撑一般

算法

计算机对录入信息如何做到高效的学习理解

拥有精确的算法是

AI技术的灵魂

大数据

计算机对学习处理的结论输出

越宽泛的周

界将会越精确

拥有海量的数据来源供算法提纯精炼

助于

AI

应用发展的基础

3.2 AI

芯片发展解析

AI

技术的发展与应用

初始阶段均以

GPU

支撑

AI

计算能力需求

AI

初创公司都是在

GPU

上做软件算法

然后集成到现成的服务器做落地应用

实力雄厚的

AI

科技

公司

会潜心专注自己的

AI

芯片设计研发

以通过芯片硬

件实现

AI

计算力的显著提升

利用

MAC

"乘加计算

速阵列对

CNN

"神经网络

中最主要的卷积运算进行加

AI

芯片的应用分类

1

云端

谷歌

TPU,

英伟达

GPU.

2

设备端

PC

手机

pad

3

物联网网关端

AI

芯片应用领域

智能手机

终端

ADAS

自动驾

驶辅助系统

CV

计算机视觉

VR

语音交互

无人机

安防监控等

AI

算法的淬炼提升

是人类智力运动的共同结果

异化将会拉平

而硬件层面的芯片产品竞争将会加剧

随着

GPU

CPU

逐步走向统一计算架构的趋势

,最终

AI

片的

XPU

也将会与

GPU

逐渐相融合

4

实践研析

实际调研了四川省成都市道桥处的一个项目实践

桥处业务需求是日常对道路桥梁表面的主要病害检测与维

其中病害包括

路面破损

路面积水

裂缝

、沉陷

桥梁水位等io

余种

原来是采用人工开车巡检

出现故障

拍照方式进行取证及处理

效率低下

四川道桥积极倡导数字化转型

与中国电信天翼云进

务商

对云计算

GPU

资源池的战略规划部署

是成为未来

行战略合作

对成都二环路探索

5G+

+AI

的智能视频巡

云计算服务资源及能力的关键点

在未来万物互联的生活

拥有网络资源服务能力的运营商

应该是抢占

AI

应用

检解决方案的实践

中国电信对成都二环路进行

5G

的基

础设施建设覆盖

将巡检车辆进行改造增加前置

/

后置的

监控摄像头

巡检车辆行驶过程中

实时的将监控图像以

发展赛道中计算力能力支撑服务的最佳主角

1080P

高清制式通过

5G

回传至业务平台进行AI的智能分析

处理

业务平台部署至天翼云的

GPU

云资源里

通过

GPU

资源为平台的

AI

分析处理提供算力

AI

实现智能的道

桥病害分析

精准及时发现病害

业务平台再对接工单业

参考文献

[1]

张建明

姚琴琴

张蔚

等.具有吗

诺依曼结

构的随机漂移粒子群优化方法

2.

5

[P],

2017-06-20.

[2]

高源.面向大数据处理的并行计算模型及性能

优化[J]

.

计算机产品与流通

,2020,000(003)

:

105-105.

[3]

N

Khammassi,JCL

Lann.

Tackling

Real-Time

Signal

Processing

Applications

on

Shared

Memory

Multicore

Architectures

Using

XPU[C]//

Erts,

February

5,2014.

[4]

Yang

C

,

Li

Y

,

Cheng

F

.

Accelerating

k-Means

on

GPU

with

CUDA

Programming

[J]

.

I0P

Conference

Series

Materials

ence

and

Engineering,

2020,790:012036.

务系统

实现业务需求的定向维修工单派发及告警通知等

业务闭环

四丿

11

省成都市道桥处的智能巡检解决方案实践是国内

首个采用

5G+云

+AI

的业务创新

智能识别替代人工巡

实现从病害发现

维修

验收全业务智能闭环,

及时

高效发现病害

可向全国道桥行业复制

对于其他行业也

有一定的指引作用

云计算时代

基础算力是一切应用发展的基石

当前

仍是以

CPU

为主的云资源池建设为主

当一系列新技术的

演进

新需求

新应用也将破壳而出

将会对云计算带来

一系列或深或浅的变革

智慧生活的未来对图像视频业务

处理的泛化需求

都向我们预示着未来前进的方向

,未来

作者简介

将会以图像视频为数据源进行深度学习与应用

AI

终将伴

随生活的每一个角落

,而为

AI

支撑基础计算力的

将会由

张剑峰

(1975-)

,

,

学士

工程师

主要研

究方向

云计算

赵凌齐

1997

,

男,

学士

,主要研究方向

云计算

CPU

GPU演进

,AI

公司百家争鸣的

XPU

最终也会遵循统

一计算架构走向统一

5

总结

国内的电信运营商,

当前已经成功的转型为云计算服

罗林春

1997

究方向

云计算

学士

工程师

主要研

赵川斌

1985

硕士

主要研究方向:

云计算

移动通信

上•揍第50页

毫米波具有频段高

带宽大

方向性好等特点

但毫

米波由于频段高

其自由空间损耗损耗大

毫米波的传输

参考文献

[1]

焦燕鸿

王韬

李富强

,马向辰,尧文彬

.5G

高铁

受限于诸多环境因素

如大气吸收

雨衰等

;最后毫米波

绕射能力差

容易被楼宇阻挡和反射

这一特性使毫米波

无线网建设关键技术与解决方案研究

[J].

电信科学

2020

06

.

[2]

何宇

.5G

在高铁场景下的覆盖分析

[J].

中国新

通信

,2020

05

.

[3]

李新

陈旭奇

.5G

关键技术演进及网络建设

[J1.电信快报

,2017

11

).

很难应用于宏覆盖网络建设中

但将其作为

5G

高铁列车

室内分布系统建设

其优势可以得到最大的发挥

同时其

存在的不足

在高铁列车室分建设中

将可能成为优势

例如毫米波绕射能力差

容易被楼宇阻挡和反射的问题

可以很好地实现将毫米波信号限定在高铁列车车厢内

免了与列车车厢外的信号互相干

作者简介

李新

1977

年一

),

高级工程师

研究方

主要从事移动通信网络规划

设计等相关工作

通信与信息技术

2021

年第

1

总第

249

|

35