2024年4月6日发(作者:)
荣耀10语音助手小艺的交互能力测试
摘要
:
智能语音时代的到来是我们人类历史的转折,它让我们实现了“万
物能言”的童话世界,也使得“虚拟永生”不再只是纯粹的幻想。手机自带语音
助手是广大普通用户最容易接触到的语音助手产品
[1]
,文章通过进行华为荣耀10
手机的测试以及相关手机俱乐部(花粉)所收集的用户使用情况,了解手机语音
助手的实际能力和发展状况,对未来手机语音助手的发展目标提供参考。
引言
:
声音是人类交互最自然的方式之一
[2]
。但对于机器来说,对话包含
一系列复杂的子过程。声波必须被转换成语言,这个过程称为自然语言识别。理
解这些语言被称为自然语言理解。想出如何回复这一过程称为自然语言生成,最
后,语音合成是指让计算机可以表述出来。使手机能够直接理解人们的语言,直
接完成人们的想法而脱离手动操作是目前智能终端应用的一大发展趋势
[3]
。而语
音助手就是一个使用户能够方便、自然的通过无线及麦克风阵列等语音输入设备,
使用自然语言和语音助手进行交互,来实现或替代部分人们在手机上的输入、查
询和控制等功能,实现语音助手与智能应用的结合和功能的整合
[4]
。
材料
:
智能语音助手被广泛应用在医疗健康服务、图书馆服务、知识管理
等场景中,而在这些场景下,语音助手均可以视作知识服务主体。它需要根据用
户的语音输入内容识别用户多样化需求,再为满足需求获取和加工信息,最后利
用内在程序以及一些具体的功能如诗歌创作,知识问答,智能提醒等来反馈信息
并提供服务
[1]
。
据 Strategy Analytics的报告,2018年全球出售的智能手机中,47.7%配
备了语音助手,而到2023年,语音助手渗透率将达到90%。而来自前瞻产业研
究院的资料显示,在2018年中国智能语音市场的规模已经突破了160亿元
[1]
。
图1 Strategy Analytics 的报告
智能语音的基本原理:智能语音技术主要包括自然语音的识别和自然语言的
生成
[5]
。主要的工作流程,如下图2所示。
输入命令
以声波形式
摄取自然语
言
声波分帧处
理
声学特征提
取
按波形特征
转化成计算
机语言
计算机将语
音转化成文
本
语义理解技
术进行理解
决策引擎执
行用户指令
声学理论处
理噪音干扰
图2 智能语音工作流程
测试与分析
:
智能手机搭载的智能语音系统主要分为两类:嵌入式语音
系统和语音 APP 产品
[6]
。本次测评,我们选择了荣耀10手机的嵌入式语音系统
小艺,系统版本为EMUI8.1,使用的CPU为麒麟970处理器八核 + 微智核i7。
针对安静、噪音环境、近场、中场、远场距离等条件下,评测环节分为三个
维度。一是语音助手的唤醒成功率测试。二是语音助手的反应时间测试,三是语
音助手的能力测试,包括设备控制和系统功能调用,第三方应用支持,对话与智
力水平。
其中,背景环境分为45db及以下的安静环境和45到60db的噪音环境,通
过查阅资料对比分析,最终把测试环境定为早上七点半的楼道以及平时工作的实
验室中。同时把距离分为3厘米内的近场,20厘米的中场,和80厘米的远场距
离进行测试,测试时需要保证网络畅通。
一, 唤醒成功率测试
荣耀10语音助手的唤醒入口有两个,第一个是按住Home键,出现语音助手
图标后向上滑动,开启语音助手。第二个是使用语音唤醒词,默认唤醒词为:“你
好,小艺”,也可以自定义唤醒词。
当采用home键开启语音助手时,外部环境条件并不影响结果,设置了三组
实验,每组10次,分别让不同的人群进行实验,第一组由本人(女)来进行,
第二组由另一个同学(男)来进行,第三组找了寝室的宿管老师来帮忙测试。唤
醒成功率的结果如下。
10
5
0
实验一 实验二 实验三
唤醒失败次数
唤醒成功次数
图3 home键开启语音助手测试结果
由此可以看出,采用home键对唤醒率的影响更多是用户自身原因,比如年
龄,自身的反应度,灵活度以及对电子产品的熟悉程度。
当采用语音唤醒词时,分别在安静、噪音环境、近场、中场、远场距离等条


发布评论