双语语料库及其对齐技术(1)
语料库
语料库(Corpora)是按照一定的原则组织在一起的真实的自
然语言数据(包括书面语和口语)的集合,主要用于研究自
然语言的规律,特别是统计语言学模型的训练以及相关系
统的评价和评测
语料库语言学
语料库语言学是以语料库为基本知识源来研究自然语言规
律的学科,主要研究内容包括语料库加工的理论、方法和
工具以及基于语料库的知识获取。
单语语料库(Monolingual Corpus)和多语语
料库(Multilingual Corpora)
2022-10-18 20:41:18
429KB
机器翻译原理
1