TED平行语料库是多语言平行语料库,包括多语言并行语料库和单语语料库。从TED会议www.ted.com 提取109种世界语言。 多语言的平行语料库包括 12 种语言超过1.2亿 个对齐句子并进行了句子对齐。 所有的预处理都是自动完成。
2023-04-13 20:23:17 365.48MB 自然语言理解 NLP 机器翻译
1
TED平行语料库是多语言平行语料库,包括多语言并行语料库和单语语料库。从TED会议www.ted.com 提取109种世界语言。 多语言的平行语料库包括 12 种语言超过1.2亿 个对齐句子并进行了句子对齐。 所有的预处理都是自动完成。
2022-05-17 12:18:29 365.48MB 自然语言理解 NLP 机器翻译
1
北京大学常宝宝老师-计算机语言学 讲义 词语切分 数据平滑 语言模型 词类自动标注 句法分析
2021-02-10 16:53:46 4.36MB NLP;机器翻译
1