肿瘤康复网,内容丰富有趣,生活中的好帮手!
肿瘤康复网 > 方言发音词典的构建方法 装置 设备及可读存储介质与流程

方言发音词典的构建方法 装置 设备及可读存储介质与流程

时间:2021-07-28 03:20:24

相关推荐

本发明涉及语音识别领域,尤其涉及一种方言发音词典的构建方法、装置、设备及可读介质。

背景技术:

发音词典是语音识别模型中重要的组成部分,通过方言词典可以将接收到的语音信息转化成可处理的音素信息。

在构建发音词典的过程中,普通话发音相对比较统一,识别准确率较高,方言发音间则存在较大差异,不同种类的方言间的发音差异大,即使同一方言种类中不同人的方言发音也存在不小差异,因此发音词典对于方言的识别准确率较低。

技术实现要素:

本申请的主要目的在于提供一种方言发音词典的构建方法、装置、设备及可读存储介质,旨在解决方言发音词典的识别结果准确率较低的问题。

为实现上述目的,本申请提供的一种方言发音词典的构建方法,所述方言发音词典的构建方法包括以下步骤:

将词汇的多种方言发音数据输入到语音识别装置中;

接收所述语音识别装置基于所述多种方言发音数据输出的候选音素序列组;

从所述候选音素序列组中选择正确音素序列;

根据所述词汇与所述正确音素序列,构建方言发音词典。

可选地,所述将词汇的多种方言发音数据输入到语音识别装置中的步骤之前包括:

将所述词汇对应的普通话发音的标准音素序列添加到所述语音识别装置中。

可选地,所述将词汇的多种方言发音数据输入到语音识别装置中的步骤包括:

将所述词汇的多种方言发音数据输入到所述语音识别装置中;

将所述词汇的每种方言种类中来源相同的方言发音数据多次重复输入到所述语音识别装置中;

将所述词汇的每种方言种类中来源不同的方言发音数据输入到所述语音识别装置中。

可选地,所述接收所述语音识别装置基于所述多种方言发音数据输出的候选音素序列组的步骤之后包括:

将所述候选音素序列与对应所属的方言种类进行关联标记;

确定同一种类方言发音数据的所述候选音素序列组中各候选音素序列的概率分布。

可选地,所述从所述候选音素序列组中选择正确音素序列的步骤包括:

确定所述概率分布中的最大值;

将所述最大值对应的所述候选音素序列组中的候选音素序列作为正确音素序列。

可选地,所述从所述候选音素序列中选择正确音素序列的步骤之后包括:

比较所述正确音素序列与所述标准音素序列;

若所述正确音素序列与所述标准音素序列不同,则将所述之前音素序列与所述标准音素序列间建立映射。

可选地,所述方言发音词典的构建方法包括:

若所述方言种类中存在普通话无法对应的方言词汇,则直接将所述方言词汇与对应的方言音素序列建立映射。

本申请还提供一种方言发音词典的构建装置,所述方言发音词典的构建装置包括:

输入模块,用于将词汇的多种方言发音数据输入到语音识别装置中;

接收模块,用于接收所述语音识别装置基于所述方言发音数据输出的候选音素序列组;

选择模块,用于从所述候选音素序列组中选择正确音素序列;

构建模块,用于根据所述词汇与所述正确音素序列,构建方言发音词典。

本申请还提供一种方言发音词典的构建设备,所述方言发音词典的构建设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的方言发音词典的构建程序,所述方言发音词典的构建程序被所述处理器执行时实现如上述的方言发音词典的构建方法的步骤。

本申请还提供一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的方言发音词典的构建方法的步骤。

本申请通过将词汇的多种方言发音数据输入到语音识别装置中;接收所述语音识别装置基于所述多种方言发音数据输出的候选音素序列组;从所述候选音素序列组中选择正确音素序列;根据所述词汇与所述正确音素序列,构建方言发音词典。对于要加入到方言发音词典中的词汇,获取其多种方言发音数据输入到语音识别装置中,得到候选音素序列组,从中选择正确音素序列与词汇建立对应的映射关系,从而得到方言发音词典,输入多种方言发音数据,得到的候选音素序列组中结果更加多样,同时从候选音素序列组中选择正确音素序列保证结果更加正确,提高最终构建的方言发音词典的识别结果的准确性。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例方案涉及的硬件运行环境的装置结构示意图;

图2为本申请方言发音词典的构建方法第一实施例的流程示意图;

图3为本申请方言发音词典的构建方法第二实施例中对图2步骤s10以及之前步骤的细化流程图;

图4为本申请方言发音词典的构建方法第三实施例中对图2步骤s20之后步骤的细化流程图;

图5为本申请方言发音词典的构建方法第四实施例中对图2步骤s30以及之后步骤的细化流程图;

图6为本申请方言发音词典的构建设备一实施例的系统结构示意图。

本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。

如图1所示,图1是本申请实施例方案涉及的硬件运行环境的终端结构示意图。

本申请实施例终端为方言发音词典的构建设备。

如图1所示,该终端可以包括:处理器1001,例如cpu,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地,终端还可以包括摄像头、rf(radiofrequency,射频)电路,传感器、音频电路、wifi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,接近传感器可在终端设备移动到耳边时,关闭显示屏和/或背光。当然,终端设备还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。

本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及方言发音词典的构建程序。

在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的方言发音词典的构建程序,并执行以下操作:

将方言词汇的方言发音数据输入到语音识别装置中;

接收所述语音识别装置基于所述方言发音数据输出的候选音素序列;

从所述候选音素序列中选择正确音素序列;

根据所述方言词汇与所述正确音素序列,构建方言发音词典。

基于上述终端硬件结构,提出本申请各个实施例。

本申请提供一种方言发音词典的构建方法。

参照图2,在方言发音词典的构建方法第一实施例中,该方法包括:

步骤s10,将词汇的多种方言发音数据输入到语音识别装置中;

发音词典包含系统所能处理的单词的集合,并标明了其发音。通过发音字典得到声学模型的建模单元和语言模型建模单元间的映射关系,从而把声学模型和语言模型连接起来,组成一个搜索的状态空间用于解码器进行解码工作。发音词典包含了从单词到音素之间的映射,作用是用来连接声学模型和语言模型。因此发音词典中包含单个单词与对应的音素的映射关系。对于方言中常用的词汇,将每个词汇对应的多种方言发音数据输入到语音识别装置中。方言发音数据可以包含多种不同种类的方言的发音数据,同时也可以包括同一种类方言中的多个不同说话人的发音数据,输入多种方言发音数据,增加输入的方言发音数据的多样性,可以得到更加多样化的候选音素序列组。同时输入多种不同方言发音数据得到的方言发音词典也会更加完整。

步骤s20,接收所述语音识别装置基于所述多种方言发音数据输出的候选音素序列组;

常规的将词汇转化成对应的音素的方法是g2p(grapheme-to-phonemeconversion,单词到音素转换),对于输入的方言发音数据,语音识别装置先识别出方言发音数据中的拼音数据,在根据识别出的拼音信息找到对应的音素序列,根据输入的方言发音数据,语音识别装置会输出多个可能的音素序列组成候选音素序列组,候选音素序列组中的各音素序列对应的概率值不同。在将识别出的拼音数据转换到音素数据时,不同的转换规则或者映射关系也可能对得到的音素序列产生影响,因此在语音识别装置中需要确定统一的转换规则或者映射关系。

步骤s30,从所述候选音素序列组中选择正确音素序列;

候选音素序列组中包含有多个不同的音素序列,正确音素序列指的是在方言中最接近标准方言发音的音素序列。而在本申请中,则以候选音素序列组中各音素序列的概率作为评判标准,选择候选音素序列组中出现概率最大的预设序列作为正确音素序列。同时这里候选音素序列中各音素序列的概率计算方法并不唯一。同时根据语音识别装置中的声学模型的不同,得到的概率也可能不同。现在语音识别装置中常用的声学模型一般是隐马尔科夫—深度神经网络的混合模型,也有只使用深度神经网络模型训练得到声学模型的。

步骤s40,根据所述词汇与所述正确音素序列,构建方言发音词典;

在从候选音素序列组中选择出正确音素序列,将每一个词汇与对应的正确音素序列组成一个词条,构建方言发音词典。在构建得到的方言发音词典中,对于一个词汇,可能存在多个对应的多个正确音素序列,这是因为不同方言种类中可能存在相同的词汇,并且不同方言种类中相同词汇的发音可能不同,因此在方言发音词典中还包括方言词汇与对应的方言种类的映射关系。最终利用方言发音词典时需先确定对应的方言种类,再去找到对应的正确音素序列。

在本实施例中,通过将词汇的多种方言发音数据输入到语音识别装置中;接收所述语音识别装置基于所述多种方言发音数据输出的候选音素序列组;从所述候选音素序列组中选择正确音素序列;根据所述词汇与所述正确音素序列,构建方言发音词典。对于要加入到方言发音词典中的词汇,获取其多种方言发音数据输入到语音识别装置中,得到候选音素序列组,从中选择正确音素序列与词汇建立对应的映射关系,从而得到方言发音词典,输入多种方言发音数据,得到的候选音素序列组中结果更加多样,同时从候选音素序列组中选择正确音素序列保证结果更加正确,提高最终构建的方言发音词典的识别结果的准确性。

进一步地,参照图2和图3,在本申请方言发音词典的构建方法第一实施例的基础上,提供方言发音词典的构建方法第二实施例,在第二实施例中,

步骤s10之前包括:

步骤s11,将所述词汇对应的普通话发音的标准音素序列添加到所述语音识别装置中;

方言发音词典的相对而言是比较困难的,但是现有的中文发音词典是基于普通话发音构建的,同时已经可以覆盖绝大多数常用词汇的音素序列,这里将词汇对应的普通话发音的标准音素序列添加到语音识别装置中,也就是把现有的中文发音词典添加到语音识别装置中。标准音素序列对于语音识别装置更加通用且覆盖的词汇范围更广。

步骤s10包括:

步骤s12,将所述词汇的多种方言发音数据输入到所述语音识别装置中;

方言的种类多种多样,对于一个词汇,不同方言中的发音可能会存在不小的差异,因此需要将不同种类的方言发音数据输入到语音识别装置中,以此获得不同方言种类中的候选音素序列组,同时不同方言种类的方言发音数据能用于完善构建的方言发音词典的方言种类,扩大方言发音词典的使用范围,不用对于不同种类的方言数据再重新构建方言发音词典。

步骤s13,将所述词汇的每种方言种类中来源相同的方言发音数据多次重复输入到所述语音识别装置中;

对于每一条方言发音数据,都需要重复多次输入到语音识别装置中,对于相同的方言发音数据,因为语音识别装置中的声学模型是由神经网络对于输入的数据输出相应的结果,因为神经网络本身存在一定的概率不确定性,所以对于相同的方言发音数据,输出的音素序列也可能不同。因此重复输入相同的方言发音数据,也是增加候选音素序列的多样性。

步骤s14,将所述词汇的每种方言种类中来源不同的方言发音数据输入到所述语音识别装置中;

来源不同的方言发音数据可以是从不同人采集到的方言发音数据,处理不同种类的方言间本身就存在差异,对于说同一种方言的群体,不同说话者自身也会存在差异,比如对于同一个词汇,不同人的发音音调也可能存在差异,输入多个不同个体的方言发音数据,可以避免只输入同一个体的方言发音数据导致的获取的音素序列的错误。

在本实施例中,对于输入的方言发音数据,需要包括不同种类的方言发音数据,不同个体的方言发音数据,同时每个输入的方言发音数据都要重复输入多次,因此保证后续获得的候选音素序列组的准确性。

进一步地,参照图2和图4,在本申请方言发音词典的构建方法第二实施例的基础上,提供方言发音词典的构建方法第三实施例,在第三实施例中,

步骤s20之后包括:

步骤s21,将所述候选音素序列与对应所属的方言种类进行关联标记;

输入的方言发音数据中包含不同种类的方言的发音数据,不同种类的方言发音数据对应的候选音素序列需要进行区分,因此将候选音素序列与对应的方言种类标记在一起,方言种类指的是粤语、上海话、四川话等。也就是说,对于同一个词汇得到的候选音素序列,要将其分类到对应的方言种类中。

步骤s22,确定同一种类方言发音数据的所述候选音素序列组中各候选音素序列的概率分布;

在将候选音素序列进行分类后,对于同一方言种类的候选音素序列,组成该方言种类下的候选音素序列组,对于候选音素序列组的概率分布可以利用贝叶斯公式来计算,根据贝叶斯公式,利用语音识别装置中的声学模型和语音模型,对于不同个体来源的方言发音数据,还可以引入得到的候选音素序列来计算候选音素序列组的概率分布。

在本实施例中,对于每一个得到的候选音素序列,分类到对应的方言种类中组成候选音素序列组,同时利用贝叶斯公式计算候选音素序列组中的概率分布。

进一步地,参照图2和图5,在本申请方言发音词典的构建方法第三实施例的基础上,提供方言发音词典的构建方法第四实施例,在第四实施例中,

步骤s30包括:

步骤s31,确定所述概率分布中的最大值;

对于概率分布中的最大值的确定,有两种可能的求法。第一种求法为,对于每种不同来源的方言发音数据,对于每个方言发音数据的重复输入,每次的输入都会获得一个候选音素序列,每一个候选音素序列不管与其他的候选音素序列是否相同,都作为一个独立的候选音素序列,然后再将相同的候选音素序列归为一类,统计相同类的候选音素序列的个数,将每一类中候选音素序列的个数与所有候选音素序列的个数的比值作为候选音素序列组中的概率分布,其中的概率分布的最大值代表的就是对于同一词汇经过语音识别装置处理后得到的出现次数最多的音素序列,该音素序列也应该就是该词汇在该方言种类中最匹配的音素序列。第二种求法为,根据贝叶斯公式,将得到的不同的候选音素序列代入到贝叶斯公式中,得到贝叶斯公式的值,从而获得贝叶斯公式的最大值,也即概率分布中的最大值。贝叶斯公式求得的值就是候选音素序列与输入的词汇信息的匹配程度。

步骤s32,将所述最大值对应的所述候选音素序列组中的候选音素序列作为正确音素序列;

最大值对应的候选音素序列就是语音识别装置处理后得到的正确音素序列,正确音素序列表示在接收到相同的词汇时根据方言发音词典最可能得到的音素序列。但是会选择正确音素序列,但是依然会保留其他的候选音素序列。保留其他的候选音素序列,如果需要通过音素序列找到对应的词汇时则是可以利用的。保留其他的候选音素序列也是可以提高识别结果的准确性。在正常的日常交流中,词汇前后的词汇发音也会影响词汇本身的发音特征,因此保留与正确音素序列存在一定差异的其他候选音素序列,当在连续的语音数据中利用方言发音词典进行词汇匹配时,获得的结果更加准确。

步骤s33,比较所述正确音素序列与所述标准音素序列;

一般情况下,对于同一词汇,不同方言中的发音不同,方言与普通话的发音区别更是较大,如果方言与普通话的发音相同,则可以将标准音素序列作为正确音素序列。

步骤s34,若所述正确音素序列与所述标准音素序列不同,则将所述正确音素序列与所述标准音素序列间建立映射;

通过输入的方言发音数据获得的正确音素序列与标准音素序列存在不同,将正确音素序列与标准音素序列建立映射,即通过正确音素序列可以找到标准音素序列。步骤s33到步骤s34中将正确音素序列与标准音素序列建立映射,是为了将词汇的方言发音与普通话联系起来,因为相对于方言,普通话发音词典更加完整,同时识别结果也会更加准确。同时如果需要将语音信息转换成文字信息时,也便于同时转换成方言文字和普通话文字。当然,步骤s33到步骤s34是可选择的,可以不需要建立正确音素序列与标准音素序列间的映射关系。

在本实施例中,选择候选音素序列组中概率分布最大值对应的候选音素序列作为正确音素序列,将词汇与正确音素序列建立映射,也可以将正确音素序列与标准音素序列建立映射关系,方便方言发音的音素序列与普通话发音的音素序列间的转换,同时提高方言发音词典的识别结果的准确性。

进一步地,在本申请方言发音词典的构建方法第四实施例的基础上,提供方言发音词典的构建方法第五实施例,在第五实施例中,

所述方言发音词典的构建方法包括:

步骤a,若所述方言种类中存在普通话无法对应的词汇,则直接将所述词汇与对应的方言音素序列建立映射;

有些词汇可能是方言中的专属词汇,即无法在普通话中找到相同含义的词汇,对于这种词汇,需要在方言发音词典中单独添加相应的方言音素序列,并与对应的词汇建立相应的映射。但是对于普通话中不存在而在方言中会使用的词汇,不需要全部都添加到方言发音词典中,可以选择添加常用的词汇如语气词或者其他类似口头禅的词汇到方言发音词典中。所述方言音素序列的确定则是按照使用本方言中大多数人的方言习惯决定,同时可以额外添加一些常见的其他发音音素序列作为补充。

在本实施例中,对于方言中的特殊词汇,额外添加对应的音素序列与词汇间的映射关系,扩大方言发音词典的词汇包含范围,与可以提高方言发音词典的识别准确性。

此外,参照图6,本申请实施例还提出一种方言发音词典的构建装置,所述方言发音词典的构建装置包括:

输入模块,用于将词汇的多种方言发音数据输入到语音识别装置中;

接收模块,用于接收所述语音识别装置基于所述多种方言发音数据输出的候选音素序列组;

选择模块,用于从所述候选音素序列组中选择正确音素序列;

构建模块,用于根据所述词汇与所述正确音素序列,构建方言发音词典。

本申请设备和可读存储介质(即计算机可读存储介质)的具体实施方式的拓展内容与上述方言发音词典的构建方法各实施例基本相同,在此不做赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,这些均属于本发明的保护之内。

技术特征:

1.一种方言发音词典的构建方法,其特征在于,所述方言发音词典的构建方法包括以下步骤:

将词汇的多种方言发音数据输入到语音识别装置中;

接收所述语音识别装置基于所述多种方言发音数据输出的候选音素序列组;

从所述候选音素序列组中选择正确音素序列;

根据所述词汇与所述正确音素序列,构建方言发音词典。

2.如权利要求1所述的方言发音词典的构建方法,其特征在于,所述将词汇的多种方言发音数据输入到语音识别装置中的步骤之前包括:

将所述词汇对应的普通话发音的标准音素序列添加到所述语音识别装置中。

3.如权利要求2所述的方言发音词典的构建方法,其特征在于,所述将词汇的多种方言发音数据输入到语音识别装置中的步骤包括:

将所述词汇的多种方言发音数据输入到所述语音识别装置中;

将所述词汇的每种方言种类中来源相同的方言发音数据多次重复输入到所述语音识别装置中;

将所述词汇的每种方言种类中来源不同的方言发音数据输入到所述语音识别装置中。

4.如权利要求3所述的方言发音词典的构建方法,其特征在于,所述接收所述语音识别装置基于所述多种方言发音数据输出的候选音素序列组的步骤之后包括:

将所述候选音素序列与对应所属的方言种类进行关联标记;

确定同一种类方言发音数据的所述候选音素序列组中各候选音素序列的概率分布。

5.如权利要求4所述的方言发音词典的构建方法,其特征在于,所述从所述候选音素序列组中选择正确音素序列的步骤包括:

确定所述概率分布中的最大值;

将所述最大值对应的所述候选音素序列组中的候选音素序列作为正确音素序列。

6.如权利要求5所述的方言发音词典的构建方法,其特征在于,所述从所述候选音素序列组中选择正确音素序列的步骤之后包括:

比较所述正确音素序列与所述标准音素序列;

若所述正确音素序列与所述标准音素序列不同,则将所述正确音素序列与所述标准音素序列间建立映射。

7.如权利要求6所述的方言发音词典的构建方法,其特征在于,所述方言发音词典的构建方法包括:

若所述方言种类中存在普通话无法对应的词汇,则直接将所述词汇与对应的方言音素序列建立映射。

8.一种方言发音词典的构建装置,其特征在于,所述方言发音词典的构建装置包括:

输入模块,用于将词汇的多种方言发音数据输入到语音识别装置中;

接收模块,用于接收所述语音识别装置基于所述多种方言发音数据输出的候选音素序列组;

选择模块,用于从所述候选音素序列组中选择正确音素序列;

构建模块,用于根据所述词汇与所述正确音素序列,构建方言发音词典。

9.一种方言发音词典的构建设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的方言发音词典的构建程序,所述方言发音词典的构建程序被所述处理器执行时实现如权利要求1至7中任一项所述的方言发音词典的构建方法的步骤。

10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方言发音词典的构建方法的步骤。

技术总结

本申请公开了一种方言发音词典的构建方法、装置、设备和可读存储介质,该方言发音词典的构建方法包括将词汇的多种方言发音数据输入到语音识别装置中;接收语音识别装置基于多种方言发音数据输出的候选音素序列组;从候选音素序列组中选择正确音素序列;根据词汇与正确音素序列,构建方言发音词典。对于方言发音词典中可以添加的词汇,获取多种方言发音数据输入到语音识别装置中,得到候选音素序列组,从中选择正确音素序列与词汇建立映射关系,得到方言发音词典,输入多种方言发音数据,得到的候选音素序列组中结果更加多样,从候选音素序列组中选择正确音素序列保证结果更加正确,提高最终构建的方言发音词典的识别结果的准确性。

技术研发人员:陈昊亮;许敏强;杨世清

受保护的技术使用者:广州国音智能科技有限公司

技术研发日:.11.11

技术公布日:.02.21

如果觉得《方言发音词典的构建方法 装置 设备及可读存储介质与流程》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。