首页 > 系统教程 GPU云服务器在人工智能领域的应用

GPU云服务器在人工智能领域的应用

系统教程830 更新时间：2026-04-04 05:48:51

2024年6月9日发(作者：)

Communication

&

Information

Technology

|

热点技术

I

2021

/

01

|

GPU

云服务器在人工智能领域的应用

张剑峰赵凌齐

'

，

罗林春

；

赵川斌'

（

1

中国电信股份有眼公司四川分公司

，

四川成都

610041

；

2中国电信股份有眼公司宜宾分公司

，

四川宜宾

644002

）

摘要

：围绕对

GPU

技术及

AI

技术与应用展开深入研究

，

探索了

GPU

与

CPU

的架构原理

、

应用趋势

，

分析

AI

技术核心要素及

AI

芯片应用趋势

，

介绍国内GPU

云服务器的市场现状格局

。论述

GPU

云服务器的应用空间

，

对未来运营商在

GPU

云服务器资源布

局方向提供建设性战略指引

。

关键词

；

GPU

；

CPU

；

GPU

云服务器

；

AI

；

芯片

中图分类号

：

TP29

文献标识码

：

B

文章编号

：

1672-0164

（

2021

）

01-0033-03

CPU

具备完善的

Control

、

DRAM

、

Cache

、

及

ALU;

而

1

绪论

云计算时代的到来

，

虚拟化技术将应用软件与系统硬

件全面解耦

，

同时推动发展

rr

架构一些列分布式的技术与

GPU

省略掉了

Control

和大量的

Cache,

设计更多的

ALU

计

算单元

”

硬件设计上

，

冯诺依曼架构的CPU

包含控制器单元

（

Conttol

）

[

运算器单元

（

计算逻辑单元

ALU

）

、

及高

速缓冲存储器

Cache

、

主存储器

DRAM

；

CPU

更利于先后

应用

。

这里以深入研究

GPU

和AI

技术为核心

，

推论

AI

技术

顺序的串行处理

。而

GPU

芯片硬件架构设计

，

没有控制器

单元

，节省出更大的空间设计成更多的小且高效的计算逻

辑单元

（

ALU

）

,

每列计算单元分配一份高速缓冲存储

器

，

这种架构使得

GPU

能够同时处理多任务而实现高性能

与应用的趋势发展

，

介绍国内

GPU

云服务器的市场现状格

局

。

论述

GPU云服务器的应用空间

，

对未来运营商在

GPU

云服务器资源布局方向提供建设性战略指引

。

的并行计算

。

2

GPU

云服务发展解析

2.1

CPU

与

GPU

的发展

追本溯源

，

当今云计算时代的所有云端的计算

资源

，

仍以总线结构的冯诺依曼结构计算机为基础

的

，

冯诺依曼结构的计算机即通过系统总线以二进

制制式处理输入的数据后进行结果输出

，

包括五大

组件

：

运算器

、

控制器

、

存储器、

输入设备

、

输出

图

1

GPU

与

CPU

硬件架构图闵

设备

。

CPU

（

CenttalProcessing

Unit

）

称为中央处理

器

；

作为计算机系统的运算和控制核心

，

主要完成

处理指令

、

执行操作

、

控制时间

、

处理数据

；

着重

是面向数据的处理

。

GPU

（

Graphics

Processing

Unit

）

称为图像处理

器

；

是一种专门图像运算工作的微处理器

，

又称显

示核心

、视觉处理器

、

显示芯片

；

主要面向

2D

、

3D

的图形处理与

HPC

（

高性能计算

）

。

缓勸存储

漿存

/

存储

缓存

/

存储

缓存

/

存储

两者的硬件架构有着本源的区别

，

如图

1

所示

，

图

2

CPU

的串行运算与

GPU的并行运算示*图

通信与信息技

*2021

年第1

期

（

总第

249

期）

|

33

2021

/

01

|

热点技术

I

Communication

&

Information

Technology

GPU

缺少控制单元

，

不能脱离

CPU

而独立工作

，

必须

由

CPU

进行控制调用才能工作

；

为了满足大规模并行处理

的业务需求

，

产生了具备

CPU

通用计算处理能力的GPU,

称为GPGPU,

主要是具备

GPU

的并行计算工作能力

，

同

时具备协助

CPU

通用计算运算的能力

。

随着

AI

技术应用的

发展

，

近些年也出现了

NPU

（

嵌入式神经网络处理器

）

，

采用"数据驱动并行计算

”

的架构葺擅长处理视频

、

图

像类的海量多媒体数据

。

基于

CPU

的衍生芯片可以说是百

家争鸣

，

以至于除了

CPU

以外的芯片统称为

XPU

pl

o

NVIDIA

公司

2007

年开创了并行处理编程语言

CUDA

（

1.0版

）

，

称为"通用并行计算架构

”

（

统一计算设备架

构

）

[4]

,促进

CPU

与GPU

并用的"协同处理

”

发展

；

时下

CUDA

体系结构已经具备完善的开发库

、

运行期环境

、

驱

动

，

是推动

CPU

与

GPU

融合发展的积极推动者与践行者

。

2.2

GPU

虚拟化与

GPU

云服务器的应用

GPU

虚拟化主要包含硬件虚拟化及软件虚拟化

。

硬件

的虚拟化

GPU

硬件提供厂商主要是

Intel

和NVidia

AMD

。

在

虚拟化场景的应用中

，

AMD

的

SR-IOV

是完全基于硬件技

术

，

NVidia

的

GRID

是硬件与软件相结合的技术

。

Intel

的虚拟化方案包括有

API

转发

，

硬件直通

，

全虚

拟化

。

其中硬件直通是

PCI

中通用的解决方案

，

其他

GPU

厂商也能支撑。

软件虚拟化也出现了像

KVMVMWare

等软件实现虚拟化

。

目前流行的商用

GPU

虚拟化方案可以分为以下几类:

GPUS

通模式

，GPU

SRIOV

模式

，

GPU

半虚拟化

（

mediatedpassthrough

:

包括

Intel

GVT-g

和

Nvidia

GRID

vGPU

）

,

VMWare

的

GPU

全虚拟化

（

vSGA

）

。

GPU

云服务器是指具备

GPU

资源卡的云端服务器

,

以提供

GPU

的差异化计算能力

。

GPU

云服务器产品形态是

云端服务器含GPU

插卡

，

GPU

插卡的运行工作方式也分为

直通或共享

：

直通

，

硬件一对一透传给租户应用系统

，跨

过

VM

虚拟化平台层直接调用

GPU

资源

；

共享

，

硬件一对

多轮巡使用

，

通过

VM

虚拟化平台调用

GPU

资源

。

因GPU

插卡数量受限于服务器

PCI

插槽数

，

通常

GPU

云服务器的

GPU

资源均以VGPU

虚拟化

（一张卡虚多

个

VGPU

供多个租户使用

、

多卡虚拟一个用户使用

）

技术

方式进行共享式使用

。

目前国内各家云服务提供商

（

包括阿里

、

腾讯

、百

度

、

华为

、

运营商的中国电信天翼云

）

，

均已拥有自己的

GPU

资源池布局

，已面向公众用户提供差异化

GPU

云服务

器产品服务

。

3

AI

应用发展解析

34

3.1

AI

技术的核心要素解析

AI

（

Artificial

IntelHgence

）

为人工智能

。

人工智能可

以分为"人工

”

和"智能”

。

前者是让机器可以替代人的

劳作

，

后者是让机器可以拥有人类一样的智慧

（

包括意

识

、

思考

、

学习等

）

。

AI

技术将计算机的信息录入

、

信息

处理

、

信息输出

、

信息存储等仿生于人类的学习过程

，

进

而让计算机拥有人类的工作能力或思考学习能力

。

如何实现人工智能的愿景

，

其核心本质是解决人工智

能的三大要素问题

：

计算力

、

算法

、

大数据

。

计算力

：

计算机对录入信息进行加工处理

、

深度学

习

，

拥有强大的并行计算能力是

AI

技术发展应用的基石

，

犹如电力对电器的支撑一般

。

算法

：

计算机对录入信息如何做到高效的学习理解

，

拥有精确的算法是

AI技术的灵魂

。

大数据

：

计算机对学习处理的结论输出

，

越宽泛的周

界将会越精确

，

拥有海量的数据来源供算法提纯精炼

，

是

助于

AI

应用发展的基础

。

3.2 AI

芯片发展解析

AI

技术的发展与应用

，

初始阶段均以

GPU

支撑

AI

的

计算能力需求

，

AI

初创公司都是在

GPU

上做软件算法

，

然后集成到现成的服务器做落地应用

；

实力雄厚的

AI

科技

公司

，

会潜心专注自己的

AI

芯片设计研发

，

以通过芯片硬

件实现

AI

计算力的显著提升

（

利用

MAC

"乘加计算

”

加

速阵列对

CNN

"神经网络

”

中最主要的卷积运算进行加

速

）

。

AI

芯片的应用分类

：

（

1

）

云端

：

谷歌

TPU,

英伟达

GPU.

（

2

）

设备端

：

PC

、

手机

、

pad

等

。

（

3

）

物联网网关端

。

AI

芯片应用领域

：

智能手机

（

终端

）

、

ADAS

自动驾

驶辅助系统

、

CV

计算机视觉

、

VR

、

语音交互

、

无人机

、

安防监控等

。

AI

算法的淬炼提升

，

是人类智力运动的共同结果

，

差

异化将会拉平

，

而硬件层面的芯片产品竞争将会加剧

，

伴

随着

GPU

与

CPU

逐步走向统一计算架构的趋势

，最终

AI

芯

片的

XPU

也将会与

GPU

逐渐相融合

。

4

实践研析

实际调研了四川省成都市道桥处的一个项目实践

，

道

桥处业务需求是日常对道路桥梁表面的主要病害检测与维

护

，

其中病害包括

：

路面破损

、

路面积水

、

裂缝

、沉陷

、

桥梁水位等io

余种

，

原来是采用人工开车巡检

，

出现故障

拍照方式进行取证及处理

，

效率低下

。

四川道桥积极倡导数字化转型

，

与中国电信天翼云进

务商

，

对云计算

GPU

资源池的战略规划部署

，

是成为未来

行战略合作

，

对成都二环路探索

5G+

云

+AI

的智能视频巡

云计算服务资源及能力的关键点

。

在未来万物互联的生活

里

，

拥有网络资源服务能力的运营商

，

应该是抢占

AI

应用

检解决方案的实践

；

中国电信对成都二环路进行

5G

的基

础设施建设覆盖

，

将巡检车辆进行改造增加前置

/

后置的

监控摄像头

，

巡检车辆行驶过程中

，

实时的将监控图像以

发展赛道中计算力能力支撑服务的最佳主角

。

、

1080P

高清制式通过

5G

回传至业务平台进行AI的智能分析

处理

，

业务平台部署至天翼云的

GPU

云资源里

，

通过

GPU

资源为平台的

AI

分析处理提供算力

，

AI

实现智能的道

桥病害分析

，

精准及时发现病害

，

业务平台再对接工单业

参考文献

[1]

张建明

，

姚琴琴

，

张蔚

，

等.具有吗

•

诺依曼结

构的随机漂移粒子群优化方法

：

2.

5

[P],

2017-06-20.

[2]

高源.面向大数据处理的并行计算模型及性能

优化[J]

.

计算机产品与流通

,2020,000(003)

:

105-105.

[3]

N

Khammassi,JCL

Lann.

Tackling

Real-Time

Signal

Processing

Applications

on

Shared

Memory

Multicore

Architectures

Using

XPU[C]//

Erts,

February

5,2014.

[4]

Yang

C

,

Li

Y

,

Cheng

F

.

Accelerating

k-Means

on

GPU

with

CUDA

Programming

[J]

.

I0P

Conference

Series

Materials

ence

and

Engineering,

2020,790:012036.

务系统

，

实现业务需求的定向维修工单派发及告警通知等

业务闭环

。

四丿

11

省成都市道桥处的智能巡检解决方案实践是国内

首个采用

5G+云

+AI

的业务创新

，

智能识别替代人工巡

查

，

实现从病害发现

、

维修

、

验收全业务智能闭环，

及时

高效发现病害

。

可向全国道桥行业复制

，

对于其他行业也

有一定的指引作用

。

云计算时代

，

基础算力是一切应用发展的基石

，

当前

仍是以

CPU

为主的云资源池建设为主

。

当一系列新技术的

演进

，

新需求

、

新应用也将破壳而出

，

将会对云计算带来

一系列或深或浅的变革

。

智慧生活的未来对图像视频业务

处理的泛化需求

，

都向我们预示着未来前进的方向

，未来

作者简介

将会以图像视频为数据源进行深度学习与应用

，

AI

终将伴

随生活的每一个角落

，而为

AI

支撑基础计算力的

，

将会由

张剑峰

(1975-)

,

,

男

，

学士

，

工程师

，

主要研

究方向

：

云计算

。

赵凌齐

（

1997

—

）

,

男,

学士

，主要研究方向

：

云计算

。

CPU

向

GPU演进

，AI

公司百家争鸣的

XPU

最终也会遵循统

一计算架构走向统一

。

5

总结

国内的电信运营商，

当前已经成功的转型为云计算服

罗林春

（

1997

—

）

，

究方向

：

云计算

。

男

，

学士

，

工程师

，

主要研

赵川斌

（

1985

—

）

，

男

，

硕士

，

主要研究方向:

云计算

、

移动通信

。

（

上•揍第50页

）

毫米波具有频段高

、

带宽大

、

方向性好等特点

，

但毫

米波由于频段高

，

其自由空间损耗损耗大

；

毫米波的传输

参考文献

[1]

焦燕鸿

，

王韬

，

李富强

，马向辰,尧文彬

.5G

高铁

受限于诸多环境因素

，

如大气吸收

、

雨衰等

；最后毫米波

绕射能力差

，

容易被楼宇阻挡和反射

。

这一特性使毫米波

无线网建设关键技术与解决方案研究

[J].

电信科学

，

2020

（

06

）

.

[2]

何宇

.5G

在高铁场景下的覆盖分析

[J].

中国新

通信

,2020

（

05

）

.

[3]

李新

，

陈旭奇

.5G

关键技术演进及网络建设

[J1.电信快报

,2017

（

11

）.

很难应用于宏覆盖网络建设中

，

但将其作为

5G

高铁列车

室内分布系统建设

，

其优势可以得到最大的发挥

，

同时其

存在的不足

，

在高铁列车室分建设中

，

将可能成为优势

。

例如毫米波绕射能力差

，

容易被楼宇阻挡和反射的问题

，

可以很好地实现将毫米波信号限定在高铁列车车厢内

，

避

免了与列车车厢外的信号互相干

扰

。

、

作者简介

李新

（

1977

年一

），

男

，

高级工程师

，

研究方

向

：

主要从事移动通信网络规划

、

设计等相关工作

。

通信与信息技术

2021

年第

1

期

（

总第

249

期

）

|

35

本文发布于:2024-06-09，感谢您对本站的认可！

本文链接:https://www.fzithome.com/xitong/1717884766a678613.html

版权声明:本站内容均来自互联网，仅供演示用，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系，我们将在24小时内删除。

应用进行处理计算服务器

发布评论取消回复

评论列表（有0条评论）

相关推荐