2024年4月27日发(作者:)

Research|技术应用

2021年·第5期

栏目编辑:梁丽雯E-mail:****************

基于计算机视觉技术的智慧银行

高柜业务研究

■ 中国工商银行新疆分行  罗正东

 新疆财经大学金融学院  陈奕宇

受新冠疫情的冲击,无接触、少接触模式成为当今现场办理业务的一个新理念,如何在新型智慧银行

摘要:

的柜面业务中,既能很好地完成客户业务需求,又做到客户与员工间少接触甚至无接触成为目前银行最关注的课题

之一。尽管很多研究人员已经在智慧银行方面做出了大量工作,但与实际应用的期望还有一定差距。基于此,本文

主要探讨人工智能技术领域的图像识别、文字识别、唇语识别等多种计算机视觉信息处理技术未来在柜面现金业

务办理中的应用场景。

智慧银行;智能高柜现金业务;人工智能;计算机视觉技术

关键词:

一、引言

近年来,智慧银行受到越来越多的关注。以智慧

银行为实例的金融科技是一个新兴交叉领域,其结合

金融与科技,力求通过新科技手段改善金融业中一些

传统的运作方式。在智慧银行这个模块中,目前尚无

垄断性科学技术,大多数人都是依据智慧银行的理

念,尝试性地将一些前沿技术运用到对传统银行的改

良中来。因此,将人工智能技术引用到智慧银行中是

一个值得研究的课题。

智慧银行的关键在于结合“互联网+”、人工智

能与大数据等计算机技术手段,实现银行业务智能

化办理,从而提升效率、减小员工犯错机率、高效分

析客户个性、精准营销等。杨士昌探讨了利用客户网

上预约、智能人脸识别等技术进行流程优化,以此打

造新型金融服务银行。商辉介绍了中国建设银行运

用大数据、人脸识别、物联网等技术构建的智慧体系

结构。王祉瓒从环绕智能理念出发,提出新型人机交

互的信息模型,构想通过计算机自动识别技术、网状

网络等方式来优化智慧银行体验。然而,目前这些智

慧银行框架大多粒度较粗,并且粗细粒度不均,没有

作者简介: 罗正东(1989-),男,新疆乌苏人,计算机硕士,供职于中国工商银行新疆分行,研究方向:金融科技;

     陈奕宇(1989-),女,新疆博乐人,经济学硕士,讲师,供职于新疆财经大学金融学院,研究方向:金融理论。

收稿日期: 2021-02-22

34

2021年·第5期

栏目编辑:梁丽雯E-mail:****************

对实际单个模块进行详细介绍,如上述研究均提到

了使用人脸识别、自动识别技术,却未具体介绍如何

使用。

此外,有些研究工作已经开始探讨智慧银行的柜

台业务,如张静针对农行LQ支行建设智慧银行网点中

的柜台业务,建议运用BPR流程再造理论进行优化。

但是这些智慧银行的柜台业务改善方案是从管理学角

度出发的。

为了解决这些问题,本文提出一种基于计算机视

觉信息处理技术的柜台现金业务框架,该框架主要包

括3个部分:预约客户识别、现场客户识别、智能交互

业务办理。

该框架的主要贡献有3方面:一是对智慧银行下

的高柜台现金业务智能化进行了细化;二是充分利用

人工智能的图像识别技术,为智慧银行构建提供更多

可选方案;三是该框架的公开发表在一定程度上可实

现建设智慧银行的技术共享,促进各银行共同完善智

慧银行框架。

二、相关工作

本节将介绍近年来热门的智慧柜员机和视觉信息

处理技术。

(一)智慧柜员机

在智慧银行建设中,智慧柜员机是一个重要部

分。季宜锋统计展示了个人开卡、理财产品签约等低柜

业务,并基于排队理论优化了智慧柜员机代替部分柜

员工作。姜婧等人研究借助“超级柜台”智能机器实现

80%的低柜非现金业务。而对于现金业务,自动存取

款机可以实现小部分存钱、取钱等现金业务的办理,

对于稍复杂的现金业务仍需要人工柜面办理。

不同于以上智能柜台处理小部分现金业务和80%

以上的低柜非现金业务,本文应用计算机视觉技术可

以完成多种业务,极大地减轻了柜员工作量,可通过

“人机联合、单人控制多机”来更大程度地解放柜员

Research|技术应用

劳动力,亦可满足线下客户的个性化业务需求。

(二)视觉信息处理技术

本文的视觉信息处理是指利用计算机对图像进

行计算、分析和理解,通常包括图像识别、行人重识

别、OCR文字识别等技术。这些技术的输入数据是图

片、视频等视觉信息。在此次人工智能的浪潮中,计算

机视觉技术也取得了前所未有的成绩,被广泛应用在

众多研究课题中。

1. 人脸识别(Face Recognition)是基于脸部特征

信息进行身份图像识别的一种计算机视觉技术,可自

动在图像中检测和跟踪人脸,并对检测到的人脸进行

脸部识别。YanLi等人提出了一种融合多尺度、多方向

Gabor幅度和基于空间金字塔的局部相位量化傅里叶

相位编码的人脸识别方法。该方法在FRGC ver2.0数

据集上达到了95%以上的准确性。加入红外热像技术

后的人脸识别技术可以对红外热成像的图像进行识

别,并测量体温。

2. 行人重识别(Person re-identification,ReID)也

称行人再识别,是利用计算机视觉技术判断图像或者

视频序列中是否存在特定行人的技术,属于图像检索

的子任务,可用于智能视频监控、目标人物检测检索

等场景。Ruibing Hou等人提出了一种新网络结构:交

互与聚合(Interaction-and-Aggregation,IA)以增强

CNNs的特征表示能力,并且在行人重识别任务上达到

了先进性能,在Market-1501数据集上达到了94%以上

的准确性。

3. OCR文字识别(Optical Character Recognition)

是利用光学技术和计算机技术读取打印或写在纸上

的文字,并将其转换为计算机和人都能理解的文字形

式。印刷字体的OCR技术目前已经相当成熟,文字识

别性能可以达到95%以上,所以当前研究人员关注更

多的是场景文本检测(Scene Text Detection),即在复

杂环境中进行字符识别。Jiyun Lui等人提出了一种新

的场景文本检测方法,将文本检测视为一个由粗到精

35

Research|技术应用

2021年·第5期

栏目编辑:梁丽雯E-mail:****************

的文本关键点检测任务,并在实验ICDAR2015数据集

上实现了82.0%以上的准确性。

4. 唇语识别(Lip Reading)使用计算机视觉技

术,从连续图像中提取口型变化特征,经过唇语识别

模型计算后得出可能性最大的自然语言语句,可在

噪音环境或无声环境中辅助语音识别的相关应用。

Jingyun Xing等人引入了一个变形流网络(DFN)来学

习相邻帧之间的变形流,可直接捕捉到边缘区域内

的运动信息,然后将学习到的变形流与原始灰度帧结

合,形成双流网络进行唇读。最终,在英文数据集LRW

上达到了84%以上的准确性,在中文数据集LRW-1000

上达到了41%以上的准确性。

计算机视觉的研究课题还有很多,以上所介绍的

方法在后续方法框架中会用到,这些方法相对比较成

熟,可以直接或辅助性

地应用到智慧银行智能

柜台现金业务中。

能满足2万元以上客户的取现需求;有些银行网点已经

有智慧柜员机,可以完成补卡、挂失、改密等功能,但

是稍复杂的信用卡销户、存折存单挂失等业务却不能

够在机器上办理。为了解决这类问题,本文构思应用

计算机视觉技术来打造一个高效方便、智能多功能的

现金业务柜台场景。

文本提出的框架包含3个模块:线上预约模块、现

场排队模块以及业务办理模块,见图1所示。

(一)线上预约模块

在框架中,线上预约可以实现多种现金业务预

约,而不只是简单的预约排队。在此模块中,笔者所构

思框架里的计算机视觉技术可以完成以下功能。

1. 现金存取预约。在手机银行上,对于两万元以

上的现金预约,需要“验证密码+身份证+人脸识别”,

身份验证

业务预约

现金存取预约

★图像识别-证件

★填写电子预约单

★OCR文字识别-材料

★图像识别-证件

★填写电子预约单

三、方法框架

银行的柜面业务

分为高柜业务和低柜业

务。高柜主要针对个人

客户办理现金业务,主

体业务有存取款、转汇

款、办卡开户开网银、

挂失等。低柜主要针对

对公客户办理非现金业

务,一般不与现金打交

线

线上预约

有介质非存取

现业务

……

……

手机银行预约网上银行预约

无介质非存取

现业务

★图像识别-证件

★填写电子预约单

图像采集

排号系统

编号

(排队号)

A1

液晶屏叫号

行人再识别技术

检索到目标人

+

A2

A3

请A1号顾客到4号

窗口办理业务

等待区

业务办理区

人脸识别

图像识别

审验证件

OCR文字识别

检验签字

识别文字-自动填单

检验签字

识别文字-自动填单

检验签字

存/取/转-现金

存/取/转-现金

办理业务

道,主体业务有开立对

公结算账户、办理对公

转账业务等。虽然现在

已经有自动存款机可以

存取现金,但是每人每

日限额取现为2万元,不

磁性介质

存、取、转款

无磁性凭证

存、取、转款

读取介质

拍照凭证

审验本人

审验本人

审验本人

审验证件

审验印章

审验证件

开/销户、汇款

、还贷款等业务

填单-拍照

计算机视觉技术应用

图1 本文技术框架

36

2021年·第5期

栏目编辑:梁丽雯E-mail:****************

如果是代理人,则需要代理人与被代理人的双方身份

证。这样一来,客户到达银行网点,出示预约成功的手

机界面,人脸识别验证身份后,即可提取银行事先准

备好的现金。

对于支票、收费凭证的存取款业务,可以实现填

表单,或者在手机上检验支票、凭证等是否填写规范,

保证到达柜面时可以顺利通过审验。

2. 有介质非存取现业务。客户可以在手机银行上

提交相关审核材料,银行系统通过ORC文字识别材

料文字、人脸识别核实本人、图像识别校验证件信

息,系统后台生成电子档申请材料,客户到达网点时

只需再次验证本人身份,即可快速完成改密、销卡、

换卡等业务。

3. 无介质非存取现业务。客户可以在预约时网上

填好表单,比如办卡、挂失、补卡等业务。对于其他不

便网上预约具体事项的现金业务,均可为客户提供当

日网点排队进程和关联手机微信或短信的消息提示。

同时,对于VIP企业,可以安排预约上门服务,比如大

额现金预约送上门服务、大额派发工资提供柜员上门

协助等,亦可使用移动银行车,定期到CBD商务区为

周围的多家公司同时办理业务。

在这里,运用ORC文字识别检测纸质/卡/折文

件,用人脸识别核实本人,用图像识别审验证件,同

时,也可以顺便提供实时排队进程和行程路线建议等

功能。

(二)现场排队模块

无论是线上已预约的客户还是未预约的客户,来

到银行网点办理业务时都需要在网点大厅排队等候,

此时快速准确地引流分流成为一个重要任务。在本文

框架中,笔者借助计算机视觉技术,帮助大堂经理精

准分流。

首先,客户从进入银行网点门口到完成“人脸识

别+身份证验证”排号的过程,同时被机器采集几秒

的单人视频,视频编号与排队号对应,通过人脸识别

Research|技术应用

和身份证图像识别确保客户与证件可准确对应。

其次,如果有现金柜台空闲,排号客户可以依次

直接去办理。如果现金柜台正忙且排号客户前面有少

量排队号,则客户可在大厅等候,亦可以去金融超市。

不同于传统的LED叫号灯牌,智慧银行的叫号液晶屏

在业务正忙时会播放理财视频或者防诈骗视频,叫号

时切回到该号客户号和入门时该客户的人脸照片。此

外,在金融超市里陈列着纪念币和播放理财产品的视

频,纪念币可供选购,理财视频里有二维码可供扫描,

方便客户在手机上随时观看或选择自己的理财经理。

如果排队客户较多,排号客户可以用微信扫描排队进

程码,然后离开银行去附近活动,排队进程码会实时

发送排队近况,提醒客户按时返回银行柜面。

最后,如果柜面叫号屏上的客户没有及时出现,

大堂经理可以用手中的iPad通过行人再识别技术快速

检测客户在银行店内的位置,便于大堂经理找到该客

户并引导其到相应窗口办理业务。

在此模块中,笔者运用计算机视觉技术的人脸识

别和图像识别(身份证验证)进行排号,可以审验客户

和证件的对应性。同时,笔者使用行人再识别技术帮

助大堂经理快速找到相应的客户。另外,笔者改进叫

号LED灯牌、构建金融超市等措施来充实客户等候时

间,传递金融安全知识、营销银行理财产品等。

(三)业务办理模块

柜台办理业务时一般审核验证5类要素:人、证

件、凭证、材料、现金。这些要素大致需要以下设备完

成审核验证:相机、扫描仪、读卡(磁条)器、键盘、验

钞机。

借助计算机视觉技术,可以为这些方面的业务提

供技术支持:

1. 磁性介质存、取、转款:如银行卡、存折等,人

脸识别技术可以辅助识别客户身份。

2. 无磁性凭证质存、取、转款:如支票、收费凭条

等,人脸识别技术可以辅助识别客户身份;OCR文字

37

Research|技术应用

识别技术可以用来完成“拍照/扫描-ORC文字识别-

自动填系统”;使用图像识别技术来检验支票、存单

等,通过“拍照/扫描-图像识别-自动对比检验”,将

现拍照片与数据库中留存的相应样本照片进行识别、

对比、检验。经过双方审核和系统检验后,才可进行现

金及款项的操作。

3. 开/销户、汇款、还贷款等业务,建议客户先填

单据,然后使用OCR文字识别技术完成系统自动填

单,最后客户对系统电子单据进行审核,签字后完成

汇款。

人脸识别和图像识别可以用来完成审核检验的

工作,OCR文字识别技术可以完成系统自动填单的工

作。在智慧银行里,因为工作人员较少,更多地依赖于

机器,所以客户填写单据,然后使用OCR文字识别技

术来识别相应的文字,再自动填写到系统中,这样既

可以完成自动化操作,又可以留下业务证据,减少业务

办理中因为说不清/听不清而产生的误解。此处的填单

可以是客户通过计算机打印出的单子,也可以是客户

手写的工整字体。因为印刷字体识别率相对较高,所

以建议客户按格式打印出业务需求,提高计算机填单

的准确性。

另外,如果某项业务确实需要客户与柜员(隔着防

弹玻璃)通过语音来完成,那么唇语识别就可以将噪

音环境或者无声环境的嘴唇运动图像转化为文字呈现

出来,辅助人们尽可能一次性地听清对方所说的话,从

而节省有效沟通时间,提高工作效率。

四、总结与展望

本文从计算机视觉的角度出发,将人脸识别技术

应用于线上预约、现场排队、业务办理中,从而识别或

审验客户身份;将行人重识别用于现场排队中,帮助大

堂经理寻找相应客户;将OCR文字识别和图像识别用

于业务办理时系统自动填单和自动识别对比校验;将

唇语识别用来辅助员工与客户交流,尤其是隔着防弹

38

2021年·第5期

栏目编辑:梁丽雯E-mail:****************

玻璃的柜员与客户的交流。

目前,尚不能完全依靠计算机技术来构建起“无

人银行”,但是计算机视觉技术可以帮助传统银行向

智慧银行转型,并逐步向全智能的“无人银行”发展。

目前虽不可完全智能自动化,但可以实现一个柜员同

时办理多个窗口的业务,因为在系统填单、审核、打印

回单、点钞等过程中,柜员可以切换到另一个客户进行

服务。实现这种“一人多机”,不仅要依靠计算机视觉

技术来完成一些工作,而且需要银行业务操作系统能

够实现更自由、更快捷的业务组合功能。只有不断创

新计算机视觉技术,加上普及高性能的计算机业务系

统,才会促进智慧银行建设的更加智能。

FTT

参考文献:

[1]IBM 中国商业价值研究院. 未来的企业[M]. 北

京:东方出版社,2009.

[2]杨士昌. 智慧银行实践助银行网点转型[J]. 银

行家,2015(11):120-122.

[3]商辉.“智慧银行”的建行实践[J]. 银行家,

2018(10):47-48.

[4]王祉瓒. 环绕智能下智慧银行网点的人机交互

[J]. 智库时代,2019(19):2.

[5]李小庆. 面向智慧银行的科技创新[J]. 金融科

技时代,2017(4):21-25.

[6]倪以理,曲向军,韩峰,等. 后疫情时代银行业:

开启全速数字化经营[J]. 新金融,2020(5):13-18.

[7]张静. 农行LQ支行建设智慧银行网点去柜台化

流程再造研究[D]. 西安:陕西师范大学,2019.

[8]姜婧,马波,黄涛.“超级柜台”对农行网点业务

管理的影响研究[J]. 现代金融,2016(6):52-53.

[9]Yan Li,Shiguang Shan,Ruiping

Magnitude and Phase Features with Multiple Face

Models for Robust Face Recognition[J]. Frontier

of Computer Science,2018(4):1-19.