(Corpus of Contemporary American English=)COCA Frequency 60000 美国当代语料库, 这是英语国家使用频率最高的词汇集合。 从众多语料库(corpus)中提取。用大数据的方法从各种文体中自动生成一个词频表。这是当今最准确的词频表:美国当代语料库 coca 中的前60000个单词。 简单的说,coca就是把1990年之后美国最有代表性的报纸,杂志,小说,学术,口语(口语可能是用的电视剧或者脱口秀之类的节目转录的)汇集起来,每部分各占1/5,生成4.5亿单词量语料库,适用于欧路,mdict等第三方词典。
1