TED平行语料库是多语言平行语料库,包括多语言并行语料库和单语语料库。从TED会议www.ted.com 提取109种世界语言。 多语言的平行语料库包括 12 种语言超过1.2亿 个对齐句子并进行了句子对齐。 所有的预处理都是自动完成。
2023-04-13 20:23:17 365.48MB 自然语言理解 NLP 机器翻译
1
TED平行语料库是多语言平行语料库,包括多语言并行语料库和单语语料库。从TED会议www.ted.com 提取109种世界语言。 多语言的平行语料库包括 12 种语言超过1.2亿 个对齐句子并进行了句子对齐。 所有的预处理都是自动完成。
2022-05-17 12:18:29 365.48MB 自然语言理解 NLP 机器翻译
1
机器翻译词对齐的 Python 实现。 以 'python .py > ' 运行选项:-n num_lines 从输入文件中获取更少的行 -d 获取非默认文件,例如:sample ibm1.py:实施 IBM 模型 1 ibm2.py:实施 IBM 模型 2 hmm.py:实施 HMM 模型进行字对齐 fastAlign.py:实施快速对齐方法,但使用固定的 lambda 参数 alignIntersect.py:使用基于交集的对齐方式Dice 的系数 modelAgreement.py:为 IBM Model2 实现基于交集的对齐 带有 .a 扩展名的相应名称的文件是从这些模型中获得的前 1000 个句子的对齐,这些模型在英语和法语的完整 hansards 数据上进行训练。 它们可以与分数对齐一起运行以进行 AER 评估。 t_
2021-09-30 15:13:54 6.68MB Fortran
1
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
2021-06-29 16:11:17 45.53MB 平行语料库
1
cwmt/neu2017中英神经机器翻译平行语料库,在fairseq和opennmt上均成功训练并预测得到不错的结果。
2021-06-29 10:26:31 143.26MB cwmt 中英翻译 平行语料库
1
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
2021-05-12 12:03:17 45.53MB 平行语料库
1
数据集—基于TF NMT利用带有Attention的 ED模型训练、测试(中英文平行语料库)实现将英文翻译为中文的LSTM翻译(中英文平行语料库)训练数据集—train
2021-04-20 09:20:56 451B 中英文语料库 训练数据集
1
基于伪平行语料库的双语主动学习关系分类
2021-02-26 14:06:24 327KB 研究论文
1
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
2019-12-21 22:19:27 45.53MB 平行语料库
1
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
2019-12-21 22:13:20 45.53MB 平行语料库
1