word_list_tools
Python 和 Pandas 工具可对不同类型的单词列表进行各种分析
注意:这个仓库在 2014 年 9 月 13 日彻底重组,我试图通过并确保所有路径都是有效的,但有可能被我忽略了。
使用的词库:
COHA,来自杨百翰大学的美国历史英语语料库。 1-grams 需要许可证才能使用,所以这里不包括它们; .gitignore 有一个规则可以忽略 coha_1*.*。 此处包含元数据/摘要数据。
布朗语料库,python 的 NLTK 的一部分
Europarl: A Parallel Corpus for Statistical Machine Translation, Philipp Koehn, MT Summit 2005 ( ) [文件不包括,因为它们非常庞大]
使用的简单单词列表:
填字游戏单词的 Moby 列表(113,809 个
2023-03-16 23:15:45
15.15MB
Python
1