2024年5月25日发(作者:)

苹果智能语音助手(SIRI)系统与人机分析

一、人工智能介绍

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模

拟、延伸和扩展人智能理论、方法、技术及应用系统一门新技术科学。尼尔逊教

授对人工智能下了这么一个定义:“人工智能是关于知识学科――怎样表示知识

以及怎样取得知识并使用知识科学。”而另一个美国麻省理工学院温斯顿教授认

为:“人工智能就是研究怎样使计算机去做过去只有些人才能做智能工作。”这些

说法反应了人工智能学科基本思想和基本内容。即人工智能是研究人类智能活动

规律,结构具备一定智能人工系统,研究怎样让计算机去完成以往需要人智力才

能胜任工作,也就是研究怎样应用计算机软硬件来模拟人类一些智能行为基本理

论、方法和技术。

人工智能是计算机科学一个分支,它企图了解智能实质,并生产出一个新能

以人类智能相同方式做出反应智能机器,该领域研究包含机器人、语言识别、图

像识别、自然语言处理和教授系统等。人工智能从诞生以来,理论和技术日益成

熟,应用领域也不停扩大,能够构想,未来人工智能带来科技产品,将会是人类

智慧“容器”。人工智能能够对人意识、思维信息过程模拟。人工智能不是人智

能,但能像人那样思索、也可能超出人智能。人工智能是一门极富挑战性科学,

从事这项工作人必须知道计算机知识,心理学和哲学。人工智能是包含十分广泛

科学,它由不一样领域组成,如机器学习,计算机视觉等等,总说来,人工智能

研究一个主要目标是使机器能够胜任一些通常需要人类智能才能完成复杂工作。

但不一样时代、不一样人对这种“复杂工作”了解是不一样。12月,人工智能

入选“中国媒体十大流行语”。

实际上,人工智能概念很宽,种类也很多。通常,按照水平高低,人工智能

能够分成三大类:弱人工智能、强人工智能和超人工智能。

1、弱人工智能

首先,弱人工智能(ArtificialNarrow Intelligence/ANI),只专注于完成某个

特定任务,比如语音识别、图像识别和翻译,是擅长于单个方面人工智能。它们

只是用于处理特定详细类任务问题而存在,大都是统计数据,以此从中归纳出模

型。因为弱人工智能智能处理较为单一问题,且发展程度并没有达成模拟人脑思

维程度,所以弱人工智能依然属于“工具”范围,与传统“产品”在本质上并无

区分。

包含近年来出现IBMWatson和谷歌AlphaGo,它们是优异信息处理者,但

都属于受到技术限制“弱人工智能”。比如,能战胜象棋世界冠军人工智能

AlphaGo,它只会下象棋,假如问它怎样愈加好地在硬盘上储存数据,它就无法

回答。使用弱人工智能技术制造出智能机器,看起来像是智能,不过并不真正拥

有智能,也不会有自主意识。

2、强人工智能

强人工智能(Artificial GeneralIntelligence/AGI),属于人类级别人工智能,

在各方面都能和人类比肩,人类能干脑力活它都能胜任。它能够进行思索、计划、

处理问题、抽象思维、了解复杂理念、快速学习和从经验中学习等操作,而且和

人类一样得心应手。“强人工智能”系统包含了学习、语言、认知、推理、创造

和计划,目标是使人工智能在非监督学习情况下处理前所未见细节,并同时与人

类开展交互式学习。在强人工智能阶段,因为已经能够比肩人类,同时也具备了

具备“人格”基本条件,机器能够像人类一样独立思索和决议。

创造强人工智能比创造弱人工智能难得多,我们现在还做不到。但在一些科

幻影片中能够窥见一斑。比如,《人工智能》中小男孩大卫,以及《机械姬》里

面艾娃。

3、超人工智能

超人工智能(Artificial Superintelligence/ASI)牛津哲学家、著名人工智能思

想家Nick Bostrom把超级智能定义为“在几乎全部领域都比最聪明人类大脑都

聪明很多,包含科学创新、通识和社交技能”。在超人工智能阶段,人工智能已

经跨过“奇点”,其计算和思维能力已经远超人脑。此时人工智能已经不是人类

能够了解和想象。人工智能将打破人脑受到维度限制,其所观察和思索内容,人

脑已经无法了解,人工智能将形成一个新社会。

《复仇者联盟》中奥创、《神盾特工局》中黑化后艾达,或许能够了解为超

人工智能。

现在,人类已经掌握了弱人工智能,它每一步都是在向强人工智能前进。而

超人工智能超出了人类现有认知范围,甚至引发了人类“永生”或“灭绝”哲学

思索。人工智能革命是从弱人工智能,经过强人工智能,最终抵达超人工智能旅

途。不论这个旅途有多长,不论人类意愿怎样,不可否定,这一革命已经以不可

逆之势蓬勃开始了!

二、SIRI介绍

Siri是苹果企业在其产品iPhone4S,iPad 3及以上版本手机和Mac上应用一

项智能语音控制功效。Siri能够令iPhone4S及以上手机(iPad 3以上平板)变身

为一台智能化机器人,利用Siri用户能够经过手机读短信、介绍餐厅、问询天气、

语音设置闹钟等。SIRI 是 Speech Interpretation & Recognition Interface 首字母缩

写,原义为语音识别接口。Siri能够支持自然语言输入,而且能够调用系统自带

天气预报、日程安排、搜索资料等应用,还能够不停学习新声音和语气,提供对

话式应答。

Siri成立于,被苹果以2亿美金收购,最初是以文字聊天服务为主,随即经

过与全球最大语音识别厂商Nuance合作,Siri实现了语音识别功效。Siri 技术

起源于美国国防部高级研究规划局所公布 CALO 计划:一个让军方简化处理一

些繁复庶务,并具学习、组织以及认知能力数字助理,其所衍生出来民用版软件

Siri 虚拟个人助理。使用者能够经过声控、文字输入方式,来搜寻餐厅、电影院

等生活信息,同时也能够直接收看各项相关评论,甚至是直接订位、订票;另外

其适地性(location based)服务能力也相当强悍,能够依据用户默认居家地址或

是所在位置来判断、过滤搜寻结果。其功效主要表现在以下十一个方面:

1、Siri 变身闹钟

按住“Home”键,告诉Siri,“早上7点15时候叫醒我”;想打会儿小盹,

就说“40分钟后叫醒我”。只要准确地报上时间,Siri将是最好用闹钟。

2、用 Siri 寻找咖啡厅

喝咖啡是很多上班族习惯,一杯咖啡能够快速地将人调整成工作状态。出门

在外时候,想找个咖啡厅?利用Siri就能够搞定这一切。告诉 Siri,寻找离当前

位置最近咖啡厅即可。假如你没有附加更多要求,Siri将反馈给还算不错答案,

很可能是告诉你最近星巴克在哪。

3、想去哪,Siri 告诉你

报上要去地点,Siri会调用 谷歌 地图来寻找出行路线方案。从测试过这种

使用方法用户反馈上看,Siri还没有出过什么差错,就像GPS那样好使。9月14

日,苹果iOS 10正式版问世,易到是现在iOS10中首个支持Siri语音叫车软件。

Siri能够直接开启易到,并帮用户完成订车。

4、用 Siri 播放随机音乐

假如你厌倦了固定次序音乐播放列表,能够试着用Siri播放随机音乐。首先,

你需要将喜欢音乐导入到一个名为“最爱”播放列表中。开始听音乐时候,告诉

Siri”放皇后乐队歌曲”。紧接着,Siri就会在“最爱”列表中匹配皇后乐队歌曲

并将其播放。这么就实现了随机播放音乐功效。

5、发送短信,Siri 代劳

走路时候,将iPhone放在耳边,告诉Siri“用短信告诉她,我将晚点到家”。

不用慌忙,告诉Siri你想表示内容,即可轻轻松松地发送短信。

6、天气预报,Siri 知道

这也是Siri十分擅长一项功效。关于气象信息问题,Siri都能正确了解。想

要知道明天天气怎样,问问Siri就知道了。

7、用Siri提醒日程安排

很多人都有使用谷歌日历习惯,用谷歌日历安排自己各项日程。生活中一些

需要提醒小事,完全没有必要一项项地加到谷歌日历中去,用Siri就能够搞定这

个问题。比如说,“十点钟时候,提醒我去刷牙”。

8、用 Siri 提醒地点

Siri 提醒地点功效还不是很完善。除了“家”或“上班处”,Siri 对于一些

位置称呼了解能力不佳。不过,Siri 对“这里”了解十分准确,即当前GPS坐

标位置。所以你能够这么用 Siri 提醒功效,途经一家不错小店时,能够将它位

置标识为“这里”并设置好提醒,方便日后有时间时再次光临。

9、Siri 为你答疑解惑

Siri它会从“知识问答引擎”Wolfram Alpha中寻找答案,全部回答都会以

自然语言形式展现。这也是 Siri 被认为将对 谷歌 主要威胁原因。

10、用 Siri 发送微博(支持新浪微博、腾讯微博)

不过在使用 Siri 发微博前,还得做一些必要设置。

11、用 Siri来订电影票。(美国)

三、SIRI系统分析

系统分析(Systems analysis)这个词是美国兰德企业在本世纪40年代末首先

提出。最早是应用于武器技术装备研究,日后转向国防装备体制与经济领域。伴

随科学技术发展,适用范围逐步扩大,包含制订政策、组织体制、物流及信息流

等方面分析。

1、Siri系统目标分析

Siri 是一项“智能个人助理技术”,它能够帮你预约、给你导航,执行各种

不一样任务,比如发送信息等。Siri处理了苹果新一代iPhone和iPad主要问题:

即使玻璃屏幕和多点触控能够代替鼠标、键盘进行桌面导航,但在数据输入上并

不理想。而经过语音输入单词或句子,比起用手指一次次戳屏幕来输入单词,方

便快捷得多。但其实,第一代Siri只加入了这支团体最初设计功效一小部分,Siri

团体希望将重点放在一个叫做”注意力管理“功效上,他们认为虚拟个人助手还

应该帮助人们在”外部存放器“上纪录主人”待办事项“。原始Siri中还包含了

一个精心设计”个人记忆“功效,他能够把一整套任务按照正确次序整合好,然

后像一个秘书一样督促用户完成每一步。

Siri改变不只是iPhone系统甚至苹果本身进化史。它们标志着个人计算重大

改变,如同从DOS转向鼠标,从鼠标转向触控屏。如今,计算机交互正在发生

新演变:我们正奔向语音控制。苹果有Siri,谷歌有谷歌 Now,亚马逊有Alexa。

是因为到Siri登陆Mac之时,它将完成对苹果旗下硬件产品线全方面覆盖,包

含电脑、智能手机、南京工业平板电脑销售可穿戴设备和Apple TV机顶盒。那

可是傲人“兵器库”。

简单化操作系统正是Siri发展方向。考虑到苹果最近宣告将Siri平台开放给

第三方应用,更是如此。伴随更多应用兼容Siri,它们将能够摆脱屏幕限制。不

用点击或触控文件、程序和应用了,开口说出你需求,你电脑、智能手机、平板

电脑、智能家居设备或者汽车就会马上作出响应。苹果接下来需要做就是,搞清

楚Siri各个“化身”之间该怎样相互沟通,从而在各个设备终端给用户带来无缝

连贯体验。即使这一点现在还没实现,但很显然,那是Siri及其它语音助手发展

方向。

2.、Siri系统要素分析

Siri系统要素主要包含三个方面:搜索技术、知识库技术和问答推荐技术。

搜索技术:这个技术代表是WolframAlpha,不一样于搜索互联网信息,

WolframAlpha将从公众(包含公开网页等)和取得授权资源中,发掘、建立起一个

异常庞大经过组织数据库,再利用高级自然语言算法进行处理,最终结构出一个

类似于谷歌搜索工具。

知识库技术:相比于网页搜索技术,基本以一个词条或者主题为单位,所以

得到数据价值高,知识量大,而且结构化程度好。相比于知识计算技术,这些技

术需要人参加,这有利也有弊,利就是,毕竟暂时人比机器聪明,编辑出来知识

更丰富,准确;弊就是,人力有限,即使像维基那样,发动小区力量,也不能产

生足够知识,而知识计算,理论上,只需要算法够,是能够产生“无限”知识。

问答推荐技术:其实这不能称为一个技术,应该属于知识库技术。不一样是,

这个技术针正确是一些生活信息,这些信息地域化程度很高,经典代表为Yelp。

3、 Siri系统环境分析

Siri现在运行环境,只是在苹果企业旗下产品,包含iPhone4S,iPad 3及以

上手机版本和Mac。其所依赖后台技术是真正大角色,这些技术目标就是处理用

户请求,并返回最匹配结果,这些请求类型很多,千奇百怪,要处理好并不简单。

基本结构猜测可能是分析用户输入(已经经过语音转化),依照输入类型,分别

采取适宜技术(适宜技术后台)进行处理。这些适宜后台技术包含,①以谷歌 为

代表网页搜索技术;②以Wolfram Alpha为代表知识搜索技术(或者知识计算技

术);③以Wikipedia 为代表知识库(和 Wolfram Alpha 不一样是,这些知识来

自人类手工编辑)技术(包含其余百科,如电影百科等);④以Yelp 为代表问答

以及推荐技术。

4.、Siri系统资源分析

Siri是一个功效繁复综合AI框架,Siri资源主要分为资源类和计算类两大类。

其中属于资源类包含:领域模型、词汇表数据库、短期记忆系统、长久记忆系统、

领域本体数据库、对话流模型、服务模型、服务能力模型、外部服务;计算类资

源包含:语音识别系统、语言模式识别器、语言解释器、对话流控制器、任务控

制器、服务集成模块、语音生成系统。借助机器学习领域深度学习研究发展以及

大数据语料积累,语音识别技术得到突飞猛进发展。

5、 Siri系统管理分析

Siri管理主要是经过前端技术和后台技术进行管理,借助深度学习、大数据

以及云计算使其愈加智能、所展现给用户答案愈加符适用户心理。Siri管理也依

赖于苹果企业系统,也就是其所运行环境,当苹果企业对手机、MAC等旗下产

品进行系统更新时也会对Siri进行管理、更新,使其愈加适应时代发展需要,使

得客户取得愈加好体验。

四、SIRI人机分析

Siri作为服务型智能软件,其好坏主要表现在人机交互方面,只有好人机交

互才能换来用户良好体验与反馈。

人-机交互中“机”不但代表着各式各样机器,而且还代表着人所在物理系

统,包含各种机器设备、计算机、办公设备、学习工具等等。人-机交互设计包

含两个方面而设计,如图1所表示。

图1 人机交互示意图

1、机器与人交互

机器与人交互主要是让人怎样了解机器真实情况。传统内容包含机器上各种

显示仪器设计,当代内容包含计算机显示器设计。日常生活中电视屏幕、教材纸

张和排版、高速公路上路标信号等等,都能够看做广义机器与人交互。

2、人与机器交互

人与机器交互是指人操控机器。传统内容包含机器上各种操作手柄、脚踏板

设计,当代内容包含算计机键盘、鼠标设计,甚至包含汉子输入中编码设计也能

够看做人因工程内容,因为它影响人输入汉字时效率。家庭生活中用到剪刀、钢

笔、筷子等,都能够看做人因工程内容。

像和朋友讲话一样对Siri说话,它就能帮助你完成发送信息或拔打电话这么

事。你能够让Siri给你介绍一下猎户座,也能够在自己不知道怎样选择时候让它

抛个硬币。Siri无需你手开工作即可工作,所以你能够在开车时让它告诉你最好

回家路线和预计抵达时间。它能与HomeKit配合,让你用声音就能遥控家里联

网家居用具。不但如此,Siri还十分了解周围世界,它能够经过与许多第三方在

线服务配合来为你提供更多答案。使用Siri次数越多,就越会发觉它有多帮,能