1.png

林彦伊(左)陈润泽(右)


林彦伊

隶属于咪咕数媒灵犀云团队,主要负责面向人工智能领域提供语音能力、智能化解决方案及产品。历任无线侧网络规划优化/信令优化工程师、信令平台产品经理、人工智能产品经理等职位。积极拓展行业智能化应用,深入现场与各级客户详细沟通需求直至确认项目落地方案。顺利完成了约60余个人工智能项目的交付。


陈润泽

隶属于浙江移动信息技术部,主要负责系统架构规划工作。历任智能网、呼叫中心、短信产品、客服业务等产品,历任工程师、项目经理和产品经理等职位。期间主要完成(1)浙江公司桌面云计算平台建设项目(2)浙江公司客服系统建设。(3)2007作为集团专家支援CMPAK完成中国移动第一个海外IPCC项目建设。等。


随着技术的不断进步,人工智能迅速发展,将深刻改变人类社会生活。人工智能是经济发展的新引擎,带来社会建设的新机遇。基于此国家将人工智能的应用纳入国家战略,国务院于2017年7月印发了《国务院关于印发新一代人工智能发展规划的通知》,人工智能时代正式来临。人工智能技术为行业带来了效率、成本的提升,提高了行业的自动化智能化水平。灵犀云平台建设了语音能力、OCR能力、智能解决方案,并根据业务需求打造了相应的智能化产品,为行业发展提供一站式的智能化解决方案。


 人工智能技术应用落地


一、人工智能技术应用的难点


人工智能是一个很“虚”的概念,对于广大非从事人工智能专业的人员来说,人工智能技术应用的难点在于人工智能技术选择、业务场景选择、人工智能技术与业务结合、验证效果提升等四个方面。


人工智能技术选择


为了便于理解,可将人工智能技术简单的划分为基础能力、解决方案、机器学习三方面。根据实际业务需求,选择适当的人工智能。



业务场景选择


为了提升效率和效果,业务场景一般选取数据量大、人工操作比较复杂、重复工作环节较多等业务场景。


人工智能技术与业务结合


根据选取的业务场景提升目标,使用合适的人工智能技术。对将采用人工智能技术的具体业务目前的实现机制、业务流程、FAQ等相关数据充分了解。分析该具体业务流程中的哪个环节引入人工智能技术,代替现有的技术方案。人工智能方案引入后,需要进行反复调整及训练,以达到更好的业务结合效果。


验证及效果提升


在实际业务场景下比较原有技术方案和人工智能技术方案,验证两个方案的技术优劣、成本效益、业务感知等,分析可提升优化业务流程、技术实现机制等方案。


二、找准应用切入点


人工智能技术在移动通信大网中有着广泛的应用切入点,应用人工智能技术可进一步提升大网中相关业务的智能化水平。


移动通信大网主要提供短彩信、数据、语音、增值服务等信息服务业务,通信运营商在提供信息服务时,需要对信息服务业务提供更好的功能迭代及对服务质量更有效的监控手段。


以语音通话服务为例说明人工智能技术在语音通话过程中的服务功能迭代及服务质量监控手段智能化的切入点:


用户语音通话未接通时


可使用双工交互,语音识别、语义理解等能力开发电话助理产品,提供秘书台代接电话服务;可使用语音识别、语义分析、声纹识别等能力开发语音质检分析平台对用户留言进行有效监控等智能化方案。


用户语音通话接通后


可使用了语音转写、语义理解等能力开发电话伴侣产品,将通话中将语音转成文字呈现,为用户提供自动语音速记服务;可使用深度学习算法,开发语音质量监控模型、提供服务质量智能化监控平台;可使用深度学习算法开发网络资源预估及自动优化自学习模型,开发智能化监控平台;可使用双工交互、语音识别、语义理解等能力开发客服语音导航功能,为用户提供一声触达服务能力;可使用语音识别、语义分析、声纹识别等能力建立智能质检分析平台,开发智能化自动监控平台;可使用使用声纹识别能力,开发电话信道小额支付声纹认证功能,为用户提供智能化小额支付解决方案等智能化方案。


三、人工智能技术应用落地流程


下面以两个案例,详细说明人工智能技术应用落地流程。


Volte语音质量分析应用案例


1. 背景


语音质量是移动通信运营商在电话信道服务的一个最重要考核指标,该指标以MOS值表示,它也代表了用户语音质量感知。MOS值是通过路测在DT中模拟实际用户,用移动终端(一般指专用的测试手机)不停地拨打语音电话,通过测试软件信令采集和统计分析获得。目前三大通信运营商均以人工路测的方式获取MOS值,全国每年在测试的投入为亿元以上左右。


2. 现有技术方案梳理


MOS算法分为主观LQS(采用ITUP.800/P.830协议)和客观LQO(采用ITUPESQ/POLCA/P.563协议)两种。目前MOS人工测试评估工作,国内主要使用的是华星、鼎立等厂家的MOS盒子,采用的客观MOS评价方法。


以P.563协议的MOS算法来说明:P.563协议通过三类特征和六项判决来计算语音质量。


处理机制:



该协议算法在应用范围和数据时效性方面具备优势,但是存在语种地域性差异、效率不足以全网应用、不支持宽带语音、不支持跨越网络制式等四个缺点。


3. 人工智能技术应用


通过现有MOS测试现有实现方案分析,MOS测试业务存在大量重复工作、需要分析大量数据等特征,选取深度学习平台建模的方式来开展智能化改造工作,本项智能化改造工作预期为提取相应网络接口数据、建立深度学习模型,代替MOS人工拨打测试工作。


3.1. 准备工作


根据MOS测试流程、语音通话信令流程及深度学习建模等流程,开展建模前的准备工作。准备工作主要的注意点如下:


  • 使用深度学习算法建模,需要准备大量的原始语音样本和退化语音样本,该样本均需要在网络中的相应接口提取。用户语音通信时,使用网络接口数量繁多,根据用户语音通话信令流程分析一次通话将获取多个原始语音样本和退化语音样本对。每一个样本对质检的语音质量评估结果,代表了原始样本至退化样本之间的用户通话质量。根据建模需要选取要评估语音质量的接口数据。


  • 原始语音样本对需要覆盖尽量多的用户通话场景,比如道路、家居、学校、商场、机场、地铁、高铁、写字楼、景区等;原始语音样本对需要覆盖尽量多的话术,比如汉字汉语拼音所有的声母和韵母、保留相应的方言比例等。


  • 退化样本无法直接获取,用户语音通话中,通信网可直接获取的数据为RTP信令流,因此需要采取技术,将该信令流转换成16K16BIT指定WAV格式的通话录音文件,转换后的语音文件作为退化样本使用。为了区分用户通话上下行语音质量,实际项目中,退化样本最好为双声道语音样本。


  • 在获取相应接口的退化语音文件时,需要获取对应的接口RTCP信令流,作为用户的XDR,用于将退化后的语音样本与用户一一对应。


  • 标注相应的退化样本,只保留选取可用的部分。初始模型建立至少需要累计10000小时有效样本数据。


举例:


从Gm接口的XDR和Mb接口的退化语音样本。



3.2. 深度学习建模


使用原始语音样本及对应接口的退化语音样本送入深度学习平台进行建模,对模型进行大量数据反复训练,获取最终的模型。


建模基本流程如下:



Step 1  通过X和Y得到POLQA算法下的MOS值


Step 2  提取Y的参数根据POLQA结果训练模型


Step 3  将Y代入训练模型得到Y的机器MOS结果


模型准确度影响分析:


由于该模型受到方言的影响,后续在应用中,需要根据不同方言的地区进行新增模型训练及微调。


3.3. 应用及迭代


新建的深度学习用户语音质量评估模型为基础模型,将该模型应用与分析平台,与分析时间粒度、分析维度以及其他分析功能相结合,开展网络语音质量评估工作。


外呼系统智能质检分析


1. 背景


智能质检是指基于语音识别技术,配合模型设计,实现对全量录音进行问题抓取和自动考评。根据我省实际生产需要,主要包括四个方面:


  • 具备优质语音转写能力,转写识别准确率不低于85%。


  • 支持多维度灵活模型设计能力,对语音、语调、语速等进行机器识别,有效定位服务问题。


  • 支持自动化质检及问题分析能力。


  • 与现有外呼平台进行深度融合,扩展至营销分析、不知情定制、业务稽核等其他领域。


2. 现有技术方案梳理


目前的外呼系统质检分析为抽检,人工听取1%左右的录音文件,对客服的服务水平、违规情况进行打分。现有手段采样率过低,无法形成有效的监督。


3. 智能质检方案应用


智能质检分析产品,通过获取通话录音、将通话录音转写成文字、基于文字和省公司话语话术建立相应的质检分析模型,对电话服务质量进行评价和分析。主要分析方向之一为对现有服务的合规性进行评估和用户的新需求进行挖掘。


  • 质检对象:客服人员(10086客服、外呼客服)


  • 质检目的:对客服人员的服务质量和服务合规性进行评价。


  • 难点:此类项目难点在于语音文件的获取、项目三方/四方联合施工的协调、省公司合格设备的提供等方面。项目上线后,需要根据不同业务场景的需求,调整和优化质检分析模型。


  • 系统接入介绍:



  • 业务流程介绍:



3.1. 准备工作


根据话语话术、语音通话信令流程及深度学习建模等流程,开展建模前的准备工作。准备工作主要的注意点如下:


  • 选取外呼平台的直接相关的网络接口,获取RTP、RTCP信令数据。使用标准的协议将RTP信令转换为制定格式(8K、16K)的WAV语音文件。将RTCP信令进行分析,制作用于XDR数据。将XDR数据与语音文件进行关联。


  • 根据语音文件的长短,选择并部署合适的ASR语音转写引擎,开发调试转写引擎的接口与存储WAV文件的SFTP/NFS接口,实现语音文件的自动转写。


  • 将转写结果以Json或者Txt文本方式存储,用于后语的语义分析建模。


  • 语音转写引擎需要加载制定的行业信息库,需要根据不同项目的话语话术对转写引擎进行迭代优化。可根据具体的话语话术进行专门标注工作,以提升文字转写成功率。


3.2. 人工智能语义建模分析


收集详细的质检功能需求,针对功能需求建立相应的语义分析模型。建模工作可采取传统的关键词、命令词等方式开展,也可以引入知识图谱、深度学习平台等智能化工具方式开展。


3.3. 应用及呈现


智能质检分析以平台方式应用,可根据项目需求实现数据上屏、统计分析、自动监控等应用级功能。


服务质量呈现示例


人工智能技术并不神秘,它将协助人们提升工作的自动化和智能化水平。在日常工作中,当你厌倦了每日的重复劳动、复杂的打开方式等,恭喜你,那将是一个很好的人工智能技术应用切入点。

*专家文章为作者独立观点,不代表移动Labs立场. 转载此文章须经作者同意,并请附上出处(移动Labs)及本页链接。

0