2024年2月8日发(作者:)
管理 MANAGEMENT所听即所见:语音识别转写系统文丨朱永润
责任编辑丨林云***************当前,众多展览会都采用了“展+会”的互动模式,论坛逐渐成为展览会的标配,对于参会人员来说,如何记录下演讲者干货满满的论坛发言成为一件苦恼的事。是否只能依靠人工速记的高额计时费用,或者必须面对主办方对速记资料的独家垄断。目前,人工智能给出另一个答案:语音识别转写系统。语音识别转写系统是指基于语音识别对即时语音转文字的一种人工智能技术。飞听见”这一语音转文字系统,该论坛主办方表示,“去年就在2017中国国际智能建筑展览会的同期分论坛上使用了讯飞听见系统,并且讯飞听见作为参展商在能化领域的专业词汇。在记录过程中对一些有口音的演讲嘉宾也能做到准确的记录。”“未来,除了论坛方面,我们计划在展会同期进行的网络直播采访当中加载讯飞听见系统,方便远程在线观看的观众也能更清晰的了解收访嘉宾的演讲内容。”讯飞听见是科大讯飞旗下一款语转写系统首上两会在2018年中国国际智能建筑展览会-高峰论坛现场,论坛现场使用了“讯展馆内针对听见系统进行了现场展示,引起了观众的广泛关注。在记录质量方面,由于讯飞本身也在从事智能化相关的专业工作,因此可以更准确地记录智66CCE中国会展right©博看网 . All Rights Reserved.
音转写系统,在今年两会上,讯飞听见在中文直播字幕基础上创新升级,为总理工作报告作直播字幕支持,进一步推出了中英文实时字幕,这是全球首次将总理政府工作报告以中英文字幕形式进行直播。除了两会,讯飞听见还参加过多场大型会议、展会、论坛活动,提供实时转写服务。4月8-11日在海南省博鳌举行的博鳌亚洲论坛中,讯飞听见为多场论坛提供语音转写及翻译技术支持服务,包括“21世纪海上丝绸之路岛屿经济论坛”“中国-东盟省市长对话”“21世纪海上丝绸之路”与泛南海经济合作等会议的出稿和存档。讯飞听见的技术人员表示,讯飞听见语音转写系统是科大讯飞19年语音领域深耕的集大成者。通过麦克风等拾音设备采集实时的音频流,利用部署在本地的科大讯飞13000小时以上的连续语流数据训练而成、采用深度神经网络的语音识别转写引擎,支持在离线的环境下将语音实时转换成文字,支持利用先进的机器翻译技术将转写结果进行翻译,通过系统的前端操作界面将中英双语的文本结果展示给用户,实现会议记录和上屏分享展示。系统具备安全性高、准确性高(标准普通话识别准确性可以达到95%)和实时性高(在语音输入200ms后可以提供转写结果的显示保障所听即所见)的特点。度应用。安徽省人民检察院检委会办公会议应用听见智能会议系统,实时记录会议委员的发言和意见。听见的讯问笔录系统也在安徽、浙江、江苏、北京、新疆、西藏等17家检察院,在涉黑、非法吸收公众存款、妨碍公务、盗窃、贪污等30种不同案件类型中试用。在展会论坛的使用场景下,目前多使用人工速记或者同传的方式进行会议内容的保障和整理。当前速录员的平均薪酬为:1400元/天,同传人员1万元/天;采用讯飞听见可以节省大约30%-50%的会议、演讲等场景下的记录整理时间。除提供TOB服务,讯飞听见面向个人提供收费转写服务,价格约为99元5小时。专门从事速记工作的马瑶瑶表示,“大概4、5年前就听见过语音转写系统,但是一直以来不温不火,影响是有的,已经开始有人用语音转写系统而不再用速记了”。讯飞听见针对会议、演讲等连续长语流和存在即兴发挥的场景打造的,能实现在离线的环境下对长时间连续语音的识别转写,同时提供了丰富的编辑、优化、分享功能,可以端到端的服务于会议、展会场景下文字记录和整理需求。凭借科大讯飞的长期技术沉淀,在实时会议、演讲、展会这类具备长时间、连续的具备即性发挥场景下的语音转写。借助科大讯飞强大的开发平台的的识别准确率。口音限制难攻克然而,是否语音识别转系统就能从根本上替代速记人员的工作呢?目前还有一定难度,智能建筑展主办方表示,“如果是传统的小型会议,在灵活度和对设备的要求方面还是人工速记较有优势;如果是大型论坛及会议还是需要类似讯飞听见的记录系统协助将语音转化为文字,这不仅是保存会议记录,更可以通过多重手段提升会议现场的品质。服务嘉宾、服务听众,体现更高的科技水平。”马瑶瑶也印证了这一说法,“现场会议因为会有环境变化、口音限制、思维前后不搭、说错话等情况出现,所以还是人工速记的优势更明显一些,从业务量上来说,语音识别转写系统对速记人员的影响还不是特别明显,当然,科技一直在发展,以后会取代速记也说不一定”。人工智能势不可挡的浪潮,讯飞听见的品牌经理表示,“讯飞一直所努力的,是希望通过语音转写帮助速记人员提高工作效率、减少失误,形成人机耦合的记录新模式,并不是去替代速记人员。我们的语音转写系统能够帮助人们在一些场景处理语言交流的问题,但距离会议高水平记录所讲究的信、达、雅还存在一定的差距”。当然,除了替代与被替代的相悖关系,目前速记人员和语音识别转写系统处于一个共存的状态,很多高规格的展会现场,会采用“人工+机器”的双向保障模式,以免在这些重要的场合机器出问题没办法救场。语音智能作为人工智能领域最成熟的技术之一,产业化正在不断加速。不管未来如何变化,需要抱有威尔·施瓦尔贝的态度,“你无法阻止波涛汹涌,但你可以学会踏浪而行。”2018年第11期总第419期2018/06/15各种场景大显神通目前,语音转写系统主要在政府的日常办公会议、企业日常办公会议、大型发布会、演讲、学术交流、教学、教学培训等存在语音交流和文字记录整理的场景。另外,基于讯飞听见打造的听见智能会议系统、讯问笔录系统、检务语音输入法、双语教学平台,在检察机关日常办公会议、审讯、双语培训等场景下探索深大数据平台做支撑,讯飞听见使用的语音数据覆盖各个行业,可以保障通用的基本用语的识别准确性。针对不同行业的论坛活动,可以提供针对性的效果优化,将行业的相关术语资料库训练成专用的模型资源以提升行业的专业用语准确度。同时针对单次或者少量的专业词汇,系统在操作界面提供了关键词优化的功能,可以通过导入文稿或者人工录入的方式添加相关词汇,提升该类词汇Copyright©博看网 . All Rights Reserved.67
发布评论