2024年6月9日发(作者:)
Communication
&
Information
Technology
|
热点技术
I
2021
/
01
|
GPU
云服务器在人工智能领域的应用
张剑峰赵凌齐
'
,
罗林春
;
赵川斌'
(
1
中国电信股份有眼公司四川分公司
,
四川成都
610041
;
2中国电信股份有眼公司宜宾分公司
,
四川宜宾
644002
)
摘要
:围绕对
GPU
技术及
AI
技术与应用展开深入研究
,
探索了
GPU
与
CPU
的架构原理
、
应用趋势
,
分析
AI
技术核心要素及
AI
芯片应用趋势
,
介绍国内GPU
云服务器的市场现状格局
。论述
GPU
云服务器的应用空间
,
对未来运营商在
GPU
云服务器资源布
局方向提供建设性战略指引
。
关键词
;
GPU
;
CPU
;
GPU
云服务器
;
AI
;
芯片
中图分类号
:
TP29
文献标识码
:
B
文章编号
:
1672-0164
(
2021
)
01-0033-03
CPU
具备完善的
Control
、
DRAM
、
Cache
、
及
ALU;
而
1
绪论
云计算时代的到来
,
虚拟化技术将应用软件与系统硬
件全面解耦
,
同时推动发展
rr
架构一些列分布式的技术与
GPU
省略掉了
Control
和大量的
Cache,
设计更多的
ALU
计
算单元
”
硬件设计上
,
冯诺依曼架构的CPU
包含控制器单元
(
Conttol
)
[
运算器单元
(
计算逻辑单元
ALU
)
、
及高
速缓冲存储器
Cache
、
主存储器
DRAM
;
CPU
更利于先后
应用
。
这里以深入研究
GPU
和AI
技术为核心
,
推论
AI
技术
顺序的串行处理
。而
GPU
芯片硬件架构设计
,
没有控制器
单元
,节省出更大的空间设计成更多的小且高效的计算逻
辑单元
(
ALU
)
,
每列计算单元分配一份高速缓冲存储
器
,
这种架构使得
GPU
能够同时处理多任务而实现高性能
与应用的趋势发展
,
介绍国内
GPU
云服务器的市场现状格
局
。
论述
GPU云服务器的应用空间
,
对未来运营商在
GPU
云服务器资源布局方向提供建设性战略指引
。
的并行计算
。
2
GPU
云服务发展解析
2.1
CPU
与
GPU
的发展
追本溯源
,
当今云计算时代的所有云端的计算
资源
,
仍以总线结构的冯诺依曼结构计算机为基础
的
,
冯诺依曼结构的计算机即通过系统总线以二进
制制式处理输入的数据后进行结果输出
,
包括五大
组件
:
运算器
、
控制器
、
存储器、
输入设备
、
输出
图
1
GPU
与
CPU
硬件架构图闵
设备
。
CPU
(
CenttalProcessing
Unit
)
称为中央处理
器
;
作为计算机系统的运算和控制核心
,
主要完成
处理指令
、
执行操作
、
控制时间
、
处理数据
;
着重
是面向数据的处理
。
GPU
(
Graphics
Processing
Unit
)
称为图像处理
器
;
是一种专门图像运算工作的微处理器
,
又称显
示核心
、视觉处理器
、
显示芯片
;
主要面向
2D
、
3D
的图形处理与
HPC
(
高性能计算
)
。
缓勸存储
漿存
/
存储
缓存
/
存储
缓存
/
存储
两者的硬件架构有着本源的区别
,
如图
1
所示
,
图
2
CPU
的串行运算与
GPU的并行运算示*图
通信与信息技
*2021
年第1
期
(
总第
249
期)
|
33
2021
/
01
|
热点技术
I
Communication
&
Information
Technology
GPU
缺少控制单元
,
不能脱离
CPU
而独立工作
,
必须
由
CPU
进行控制调用才能工作
;
为了满足大规模并行处理
的业务需求
,
产生了具备
CPU
通用计算处理能力的GPU,
称为GPGPU,
主要是具备
GPU
的并行计算工作能力
,
同
时具备协助
CPU
通用计算运算的能力
。
随着
AI
技术应用的
发展
,
近些年也出现了
NPU
(
嵌入式神经网络处理器
)
,
采用"数据驱动并行计算
”
的架构葺擅长处理视频
、
图
像类的海量多媒体数据
。
基于
CPU
的衍生芯片可以说是百
家争鸣
,
以至于除了
CPU
以外的芯片统称为
XPU
pl
o
NVIDIA
公司
2007
年开创了并行处理编程语言
CUDA
(
1.0版
)
,
称为"通用并行计算架构
”
(
统一计算设备架
构
)
[4]
,促进
CPU
与GPU
并用的"协同处理
”
发展
;
时下
CUDA
体系结构已经具备完善的开发库
、
运行期环境
、
驱
动
,
是推动
CPU
与
GPU
融合发展的积极推动者与践行者
。
2.2
GPU
虚拟化与
GPU
云服务器的应用
GPU
虚拟化主要包含硬件虚拟化及软件虚拟化
。
硬件
的虚拟化
GPU
硬件提供厂商主要是
Intel
和NVidia
AMD
。
在
虚拟化场景的应用中
,
AMD
的
SR-IOV
是完全基于硬件技
术
,
NVidia
的
GRID
是硬件与软件相结合的技术
。
Intel
的虚拟化方案包括有
API
转发
,
硬件直通
,
全虚
拟化
。
其中硬件直通是
PCI
中通用的解决方案
,
其他
GPU
厂商也能支撑。
软件虚拟化也出现了像
KVMVMWare
等软件实现虚拟化
。
目前流行的商用
GPU
虚拟化方案可以分为以下几类:
GPUS
通模式
,GPU
SRIOV
模式
,
GPU
半虚拟化
(
mediatedpassthrough
:
包括
Intel
GVT-g
和
Nvidia
GRID
vGPU
)
,
VMWare
的
GPU
全虚拟化
(
vSGA
)
。
GPU
云服务器是指具备
GPU
资源卡的云端服务器
,
以提供
GPU
的差异化计算能力
。
GPU
云服务器产品形态是
云端服务器含GPU
插卡
,
GPU
插卡的运行工作方式也分为
直通或共享
:
直通
,
硬件一对一透传给租户应用系统
,跨
过
VM
虚拟化平台层直接调用
GPU
资源
;
共享
,
硬件一对
多轮巡使用
,
通过
VM
虚拟化平台调用
GPU
资源
。
因GPU
插卡数量受限于服务器
PCI
插槽数
,
通常
GPU
云服务器的
GPU
资源均以VGPU
虚拟化
(一张卡虚多
个
VGPU
供多个租户使用
、
多卡虚拟一个用户使用
)
技术
方式进行共享式使用
。
目前国内各家云服务提供商
(
包括阿里
、
腾讯
、百
度
、
华为
、
运营商的中国电信天翼云
)
,
均已拥有自己的
GPU
资源池布局
,已面向公众用户提供差异化
GPU
云服务
器产品服务
。
3
AI
应用发展解析
34
3.1
AI
技术的核心要素解析
AI
(
Artificial
IntelHgence
)
为人工智能
。
人工智能可
以分为"人工
”
和"智能”
。
前者是让机器可以替代人的
劳作
,
后者是让机器可以拥有人类一样的智慧
(
包括意
识
、
思考
、
学习等
)
。
AI
技术将计算机的信息录入
、
信息
处理
、
信息输出
、
信息存储等仿生于人类的学习过程
,
进
而让计算机拥有人类的工作能力或思考学习能力
。
如何实现人工智能的愿景
,
其核心本质是解决人工智
能的三大要素问题
:
计算力
、
算法
、
大数据
。
计算力
:
计算机对录入信息进行加工处理
、
深度学
习
,
拥有强大的并行计算能力是
AI
技术发展应用的基石
,
犹如电力对电器的支撑一般
。
算法
:
计算机对录入信息如何做到高效的学习理解
,
拥有精确的算法是
AI技术的灵魂
。
大数据
:
计算机对学习处理的结论输出
,
越宽泛的周
界将会越精确
,
拥有海量的数据来源供算法提纯精炼
,
是
助于
AI
应用发展的基础
。
3.2 AI
芯片发展解析
AI
技术的发展与应用
,
初始阶段均以
GPU
支撑
AI
的
计算能力需求
,
AI
初创公司都是在
GPU
上做软件算法
,
然后集成到现成的服务器做落地应用
;
实力雄厚的
AI
科技
公司
,
会潜心专注自己的
AI
芯片设计研发
,
以通过芯片硬
件实现
AI
计算力的显著提升
(
利用
MAC
"乘加计算
”
加
速阵列对
CNN
"神经网络
”
中最主要的卷积运算进行加
速
)
。
AI
芯片的应用分类
:
(
1
)
云端
:
谷歌
TPU,
英伟达
GPU.
(
2
)
设备端
:
PC
、
手机
、
pad
等
。
(
3
)
物联网网关端
。
AI
芯片应用领域
:
智能手机
(
终端
)
、
ADAS
自动驾
驶辅助系统
、
CV
计算机视觉
、
VR
、
语音交互
、
无人机
、
安防监控等
。
AI
算法的淬炼提升
,
是人类智力运动的共同结果
,
差
异化将会拉平
,
而硬件层面的芯片产品竞争将会加剧
,
伴
随着
GPU
与
CPU
逐步走向统一计算架构的趋势
,最终
AI
芯
片的
XPU
也将会与
GPU
逐渐相融合
。
4
实践研析
实际调研了四川省成都市道桥处的一个项目实践
,
道
桥处业务需求是日常对道路桥梁表面的主要病害检测与维
护
,
其中病害包括
:
路面破损
、
路面积水
、
裂缝
、沉陷
、
桥梁水位等io
余种
,
原来是采用人工开车巡检
,
出现故障
拍照方式进行取证及处理
,
效率低下
。
四川道桥积极倡导数字化转型
,
与中国电信天翼云进
务商
,
对云计算
GPU
资源池的战略规划部署
,
是成为未来
行战略合作
,
对成都二环路探索
5G+
云
+AI
的智能视频巡
云计算服务资源及能力的关键点
。
在未来万物互联的生活
里
,
拥有网络资源服务能力的运营商
,
应该是抢占
AI
应用
检解决方案的实践
;
中国电信对成都二环路进行
5G
的基
础设施建设覆盖
,
将巡检车辆进行改造增加前置
/
后置的
监控摄像头
,
巡检车辆行驶过程中
,
实时的将监控图像以
发展赛道中计算力能力支撑服务的最佳主角
。
、
1080P
高清制式通过
5G
回传至业务平台进行AI的智能分析
处理
,
业务平台部署至天翼云的
GPU
云资源里
,
通过
GPU
资源为平台的
AI
分析处理提供算力
,
AI
实现智能的道
桥病害分析
,
精准及时发现病害
,
业务平台再对接工单业
参考文献
[1]
张建明
,
姚琴琴
,
张蔚
,
等.具有吗
•
诺依曼结
构的随机漂移粒子群优化方法
:
2.
5
[P],
2017-06-20.
[2]
高源.面向大数据处理的并行计算模型及性能
优化[J]
.
计算机产品与流通
,2020,000(003)
:
105-105.
[3]
N
Khammassi,JCL
Lann.
Tackling
Real-Time
Signal
Processing
Applications
on
Shared
Memory
Multicore
Architectures
Using
XPU[C]//
Erts,
February
5,2014.
[4]
Yang
C
,
Li
Y
,
Cheng
F
.
Accelerating
k-Means
on
GPU
with
CUDA
Programming
[J]
.
I0P
Conference
Series
Materials
ence
and
Engineering,
2020,790:012036.
务系统
,
实现业务需求的定向维修工单派发及告警通知等
业务闭环
。
四丿
11
省成都市道桥处的智能巡检解决方案实践是国内
首个采用
5G+云
+AI
的业务创新
,
智能识别替代人工巡
查
,
实现从病害发现
、
维修
、
验收全业务智能闭环,
及时
高效发现病害
。
可向全国道桥行业复制
,
对于其他行业也
有一定的指引作用
。
云计算时代
,
基础算力是一切应用发展的基石
,
当前
仍是以
CPU
为主的云资源池建设为主
。
当一系列新技术的
演进
,
新需求
、
新应用也将破壳而出
,
将会对云计算带来
一系列或深或浅的变革
。
智慧生活的未来对图像视频业务
处理的泛化需求
,
都向我们预示着未来前进的方向
,未来
作者简介
将会以图像视频为数据源进行深度学习与应用
,
AI
终将伴
随生活的每一个角落
,而为
AI
支撑基础计算力的
,
将会由
张剑峰
(1975-)
,
,
男
,
学士
,
工程师
,
主要研
究方向
:
云计算
。
赵凌齐
(
1997
—
)
,
男,
学士
,主要研究方向
:
云计算
。
CPU
向
GPU演进
,AI
公司百家争鸣的
XPU
最终也会遵循统
一计算架构走向统一
。
5
总结
国内的电信运营商,
当前已经成功的转型为云计算服
罗林春
(
1997
—
)
,
究方向
:
云计算
。
男
,
学士
,
工程师
,
主要研
赵川斌
(
1985
—
)
,
男
,
硕士
,
主要研究方向:
云计算
、
移动通信
。
(
上•揍第50页
)
毫米波具有频段高
、
带宽大
、
方向性好等特点
,
但毫
米波由于频段高
,
其自由空间损耗损耗大
;
毫米波的传输
参考文献
[1]
焦燕鸿
,
王韬
,
李富强
,马向辰,尧文彬
.5G
高铁
受限于诸多环境因素
,
如大气吸收
、
雨衰等
;最后毫米波
绕射能力差
,
容易被楼宇阻挡和反射
。
这一特性使毫米波
无线网建设关键技术与解决方案研究
[J].
电信科学
,
2020
(
06
)
.
[2]
何宇
.5G
在高铁场景下的覆盖分析
[J].
中国新
通信
,2020
(
05
)
.
[3]
李新
,
陈旭奇
.5G
关键技术演进及网络建设
[J1.电信快报
,2017
(
11
).
很难应用于宏覆盖网络建设中
,
但将其作为
5G
高铁列车
室内分布系统建设
,
其优势可以得到最大的发挥
,
同时其
存在的不足
,
在高铁列车室分建设中
,
将可能成为优势
。
例如毫米波绕射能力差
,
容易被楼宇阻挡和反射的问题
,
可以很好地实现将毫米波信号限定在高铁列车车厢内
,
避
免了与列车车厢外的信号互相干
扰
。
、
作者简介
李新
(
1977
年一
),
男
,
高级工程师
,
研究方
向
:
主要从事移动通信网络规划
、
设计等相关工作
。
通信与信息技术
2021
年第
1
期
(
总第
249
期
)
|
35


发布评论