中新网北京6月12日电 (记者 陈溯)为保护濒危语言、优化方言语音识别能力,12日,科大讯飞启动了“AI方言发音人招募”公益行动。
随着经济、文化活动的全球化以及区域经济的迅速发展,使主流语言或通用语言更加强势,同时也使得弱势语言的交际功能不断衰弱,甚至濒临消亡。目前世界上的语言大约有6000—10000多种,据语言学家预测,大部分语言将于本世纪末消失。因此,濒危语言保护已经成为了一项极重要而迫切的工作。
在当天召开的2018讯飞输入法媒体见面会上,科大讯飞多语种高级研究员祖漪清讲述了方言势微的现状,她表示,现在是人工智能崛起的时代,利用人工智能技术进行濒危语言、方言系统的研究,实现对一个语言的完整“复制”迫在眉睫。
据了解,“AI方言发音人”招募行动试图通过找到“方言发音人”,采集标准方言语料,持续优化增添方言识别能力,并开放给用户使用,从而用AI为人类在语言能力上赋能,点亮全人类的语言互动和命运共同。
在谈到当前输入法AI技术的发展现状时,讯飞输入法联合创始人翟吉博表示,当前讯飞输入法的通用语音识别率98%,同时,对于含糊不清的口音、噪声环境、多人对话场所等会给语音识别造成影响的场景,也已经有了解决方案,其中,方言识别的进展最为迅速,“依托对AI技术及语言深度研究的积累,采用Multi-lingual多语言建模,通过多方言数据共享方式训练;辅以GlobalPhone全球音素集,从声学层面的相似性统一各方言的音素定义,对方言‘语图谱’模型做进一步精进,从而有针对性地提升方言语种的识别能力。”
翟吉博介绍,目前讯飞输入法支持22种方言,其中粤语、四川话、东北话等识别率均已超过90%。2017年,讯飞输入法对外发起“方言保护计划”,建立“中国方言库”,用智能语音留存、发展承载传统文化积淀的方言,积累了海量方言数据,方言识别率日趋精准。据了解,本月底,讯飞输入法还将新增苏州话识别。
除了方言识别,中英混合语音输入、标点判断准确率、“他”和“她”的区分识别等功能也将进一步优化人们的语音输入体验。此外,机器翻译等新技术也将逐步融合在输入法中,面对面的交互方式将引入语音翻译应用中。例如,在对话双方各讲母语时,另一方就会同步看到翻译结果,让每个人的身边都有一位“翻译官”。(完)