g2pM 这是我们论文 ( Interspeech 2020 )的官方资料库。 安装 pip install g2pM CPP数据集 在数据文件夹中,有[train / dev / test] .sent文件和[train / dev / test] .lb文件。 在* .sent文件中,每行对应一个句子,并且在复音字符的左侧和右侧添加特殊符号(U + 2581)。 对应字符的发音与* .lb文件位于同一行。 对于每个句子,可以有多个和弦字符,但是我们随机选择仅一个和弦字符进行注释。 要求 python> = 3.6 麻木 用法 如果要删除表示音调的所有数字,请设置tone = False。 默认设置为tone = True。 如果要拆分所有非中文字符(例如,数字),请设置char_split = True。 默认设置为char_split = False。 >>> from g2p
2022-09-19 13:06:16 6.05MB Python
1
汉语连续语音识别的语速自适应算法.pdf
1
使计算机、带有人机交互的电器、仪表等能像人一样开口“说话”是科技工作者多年的研究目标。语言是人与人交流信息的一种手段,文语转换TTS(Text To Speech)是自动将输入文字转换成语音输出,并尽量使输出的语音效率流畅、自然的一类技术。   TTS系统主要需解决两个问题:   ①文本分析,即语言学分析。该任务是将以文本广度输入的字符串转换成语言学的表述;   ②语音合成。即根据语言学的内在表述信息合成语音。   TTS系统中的语音合成方法分为时域和频域两大类:频域方法主要有LPC参数合成及其振峰合成两种,其实质是在工程上实现语音生成模型,进而在终端特性上模拟发音器官。在目前阶段,频
1
针对汉语的发音习惯以及语音可视化技术中对口型动画自然、连续的要求,提出了一种基于肌肉模型与协同发音模型的与语音保持同步的口型动画的方法。首先,根据汉语发音时的口型视位特征将声、韵母音素归类,并用数据映射的方式合成与之对应的口型关键帧。通过分析输入的文本信息,合成与语音保持同步的三维人脸口型动画。为了解决汉语发音习惯的问题,设计了一种基于微分几何学描述的协同发音建模的方法,该方法通过分析相邻音子间视素的影响权重,可以产生符合汉语发音习惯的口型动画。最后,通过实验对比和分析,该方法产生的口型动画更为逼真,且符合汉语发音的习惯。
1
11电大古代汉语专题形成性考核册答案a.doc
2022-07-12 12:04:18 77KB 考试
IOS应用源码之获取汉字汉语拼音首字母.zip
2022-07-09 19:07:12 14KB IOS
StarUML 汉语版 简洁明了 支持c#代码逆向生成uml类图 StarUML 英文版 功能增强 支持c#、java 等代码逆向生成uml类图
2022-07-06 15:08:23 40.89MB StarUML 汉语/英文版 uml逆向生成
1
要求: 1 采用基于语言模型的最大概率法进行汉语切分。 2 切分算法中的语言模型可以采用n-gram语言模型,要求n >1,并至少采用一种平滑方法; 代码: 废话不说,代码是最好的语言 import re import math MAX_SPLITLEN = 4#最大切分长度 corpus_lib = ''#corpus:语料 def init_corpus_lib(path): # 初始化语料库 global corpus_lib with open(path, 'r', encoding='utf-8', errors='ignore') as file: corpus_lib
2022-06-22 09:27:05 73KB python 方法 概率计算
1
基于概念层次网络(HNC)理论,对多动词出现的一种情况——动词连见,进行了分类研究,给出了相应的处理规则。同时,还提出了一种基于BNF范式和产生式规则的形式化规则描述语言,完成了对规则的形式化描述和软件实现。在此基础上,对真实语料中出现动词连见的语句进行了计算机自动处理,给出了处理结果。
1
英语汉语对应翻译的英语歇后语资源 已经整理出为json文件可以直接使用,结构为数组中的字典键值对,方便使用 方便扩展
2022-06-16 21:04:20 10KB json 英语 歇后语 俚语