上传者: 42191480
|
上传时间: 2022-10-18 20:41:18
|
文件大小: 429KB
|
文件类型: PPT
双语语料库及其对齐技术(1)
语料库
语料库(Corpora)是按照一定的原则组织在一起的真实的自
然语言数据(包括书面语和口语)的集合,主要用于研究自
然语言的规律,特别是统计语言学模型的训练以及相关系
统的评价和评测
语料库语言学
语料库语言学是以语料库为基本知识源来研究自然语言规
律的学科,主要研究内容包括语料库加工的理论、方法和
工具以及基于语料库的知识获取。
单语语料库(Monolingual Corpus)和多语语
料库(Multilingual Corpora)