该文针对大陆、香港和台湾地区(简称大中华区)存在同一种语义但采用不同词语进行表达的语言现象进行分析。首先,我们抓取了维基百科以及简繁体新闻网站上的3 200 000万组大中华区平行句对,手工标注了一致性程度达到95%以上的10 000组大中华区平行词对齐语料库。同时,我们提出了一个基于word2vec的两阶段大中华区词对齐模型,该模型采用word2vec获取大中华区词语的向量表示形式,并融合了有效的余弦相似度计算方法以及后处理技术。实验结果表明我们提出的大中华区词对齐模型在以上两种不同文体的词对齐语料库上的F1值显著优于现有的GIZA++和基于HMM的基准模型。此外,我们在维基百科上利用该词对齐模型进一步生成了90 029组准确率达82.66%的大中华区词语三元组。
1
花了不少时间生成的LBF训练模型,主要在生成随机森林时花的时间。 !!!!注意 注意!!!! 与此对应的,还有一个回归模型regressor.model 要一起下载!!!
2022-03-20 17:29:15 5.72MB 3000fps LBF 模型 人脸对齐
1
汽车行业深度研究:轻卡行业的变革,量价齐升,格局重塑-20210121-天风证券-28页.pdf
2022-03-18 11:04:18 1.54MB
1
此篇文章主要针对 Q-Code,介绍了在实际应用中的一些基本功能,以及相关的范例,让初学者能够大概了解到 Q-Code 的基本功能和应用。
2022-03-18 03:11:16 1.42MB 九齐  NY4 范例 Q-code
1
notepad++插件,可以将网络上下载下来的不规范的代码通过快捷键Alt+F自动对齐格式,方便代码阅读
2022-03-17 16:20:24 241KB notepad++ 代码对齐 代码格式修正
1
Allegro小工具简单实用,支持元器件、丝印、管教、过孔等的自动对齐,多种对齐方式可选。
2022-03-16 15:27:32 17KB Allegro
1
利用一周的时间终于解决了,BootStrapTable 表格列头和内容不对其的问题。又需要的小伙伴来下载吧,替换原来的bootstrap-table.js即可
2022-03-15 23:03:50 20KB Boostrap table 不对齐
1
allegro自动对齐工具,PCB设计布局、元件摆放等对其工具。Allegro小工具简单实用,支持元器件、丝印、管教、过孔等的自动对齐,多种对齐方式可选。
2022-03-15 14:05:54 16KB allegro自动对齐
1
Glow-TTS:通过单调对齐搜索生成文本到语音的生成流 金在贤,金成元,江Jung和尹旭 在我们最近的,我们提出了Glow-TTS:通过单调对齐搜索从文本到语音的生成流。 最近,已经提出了文本到语音(TTS)模型,例如FastSpeech和ParaNet,用于从文本中并行生成梅尔频谱图。 尽管具有优势,但是如果没有自回归TTS模型作为其外部调整器的指导,则无法训练并行TTS模型。 在这项工作中,我们提出了Glow-TTS,这是一种基于流的并行TTS生成模型,不需要任何外部对准器。 通过将流和动态编程的特性相结合,所提出的模型自行搜索文本和语音的潜在表示之间最可能的单调对齐方式。 我们证明,强制执行硬单调对齐方式可以使鲁棒的TTS泛化为长话,而使用生成流则可以实现快速,多样化和可控制的语音合成。 Glow-TTS在合成时具有可比较的语音质量,比自回归模型Tacotron 2快了一个数量级
2022-03-11 18:01:56 1.62MB text-to-speech deep-learning pytorch tts
1
TIMEALIGN 在时间上对齐 2 个数据矩阵。 假设 t1 和 t2 向量与必须时间对齐的数据矩阵相关联。 没有均匀时间间隔的假设,但假设时间是单调增加的。 矩阵 u1 和 u2 必须是基于列的,即 length(t1) == size(u1,1) 和 length(t2) == size(u2,1) [t,a1,a2] = timealign(t1,t2,u1,u2) 返回t 时间,t1 和 t2 的并集a1 u1 在 t == t1 的点(否则为 NaN) a2 u2 在 t == t2 的点(否则为 NaN) [...] = timealign(t1,t2,u1,u2,res) 使用固定分辨率 res 对齐例子: t1 = [1 2 3]'; u1 = [6 7 8]'; t2 = [2 4 5]'; u2 = [3 4; -1 2; 9 12]; [t,a1,a2] = tim
2022-03-11 14:47:42 2KB matlab
1