乡音是一个地方的名片,说一句家乡话就能展显我汉文化的博大精深。然而,现在不少流动人口家庭,为了更好的生活不断使自己融入当地。他们的下一代,接受通用的普通话教育,偶尔学几句父母辈的话,并没有真正意义地掌握方言。由此看来,方言的未来不容乐观。在吴语区,一些网友指出最发达的上海话也变得越来越“塑料”。出于促进人类语言大互动和保护方言的双重使命,讯飞输入法开始尝试用人工智能助力乡音表达。
由于历史和地理的原因,中国汉语方言分布大概有7大方言语系,其中6大方言多集中在中国东南部。根据调研,国际语言文化组织已确认吴语为严重濒危语言,并把吴语放入国际濒危语言列表。现实情况是,作为吴语中最发达的上海话已经存在了严重的传承断层。说到底,方言背后是一种文化。如果那么多方言都消失的话,我们的语言显得太单薄了。保存上海话,除了在乡野草莽间通过口耳传播之外,科大讯飞首家通过人机耦合的智能语音方式进行“语言复制”,从而有望记录下所承载的文化,亦有其不可替代的作用。
不久前,讯飞输入法主办的“方保文化沙龙”除了展示苏州方言语音识别技术之外,还带来了上海话合成的成果。科大讯飞多语种研究院高级研究员祖漪清介绍,科大讯飞A.I.技术不但可以分析方言的孤立音节和孤立词汇,还可对连续话语进行建模,实现对一个语言的完整“复制”。即完全忠实记录语言,包括实现目标方言的语音合成系统、语音识别系统以及向主流语言的翻译系统。
在研究中发现,作为机器学习的数据量严重不足,真正能标准朗读的发音人少之又少,使得上海话语音的采集工作极为艰难,所以必须依靠全社会的支持。2015年,讯飞输入法上线了上海话语音识别,与上海话用户建立有效连接。2017年讯飞输入法面向大众发起“方言保护计划”,邀请全民参与共建“中国方言库”。至此,科大讯飞利用统一的文本分析框架,深耕语言和语音的研究,加速方言合成。通过海量的上海话语音数据,完成吴语上海话系统完整的语言复制,包括语音结构、语言结构、语言翻译,有条件的实现了上海话的永久留存。
虽然上海话的传承远不如粤语、四川话等等,但A.I.已经挽回上海话流失的局面。如今,机器已经能够操着一口流利的上海话,发音清晰、自然、亲切,具有高表现力。在方保沙龙现场,业界专家、方保组织及爱好者一起聆听了上海话的合成效果,让人感受到未来方言语音合成的无限可能性。
截至目前,只实现吴语完整复制的阶段性胜利,更难的是复制逐渐式微的苏州话。苏州话与普通话相比,其发音相差甚远。同时,苏州话还有很多特征词、俚语和特殊的语言现象。即使在苏州话内部,也有新派、老派之分,城区、郊区不同地域的苏州话也是有所差异,构建苏州话的语音识别系统是较难、较复杂的。这表明苏州话正逐渐消失,这使得研究人员在收集苏州话的相关资源、采集和制作训练数据上面临了更大的困难。
日前,讯飞输入法发起“A.I.苏州方言保护计划”,呼吁热爱苏州话、懂苏州话的人参与其中。研究人员将针对性地在苏州地区方言采集语料,加速苏州话语音识别率的提升,实现苏州话的语音合成,最终达到苏州话的完整复制,从而传承苏州方言文化。在人工智能发展浪潮中,科大讯飞的技术研究既注重全球视野,也不忘民族特色,让人机沟通从“可用”变得更加“好用”,力争在语音与语言核心处理技术上不断突破,为大规模产业化做好准备。