从一片文档中提取出所有的单词(word),然后计算每个单词出现的频率(次数),按照一定的次序将排序好的单词以“word(频率)”的形式打印出来。 可以按照频率高低,或者单词顺序打印所有出现的单词。
2021-03-22 14:28:15 2KB word统计 java 分词 词频
1
整理经济学人词频表(词频分割过程)-附件资源
2021-03-21 22:18:51 23B
1
带词性和tf-idf词频统计小巧中文分词词库.rar
2021-03-16 17:00:20 772KB 带词性
1
对朗文常用词汇3000进行了进一步的排序: 1.分别单列出“口语”中最常使用的前1000,2000,3000的单词,每部分进一步按书面语的词频排序。 2.对于在口语词汇中未出现的,书面语中的前1000,2000,3000的剩余单词,也随后列出。 往往越基本的词汇词义越多,使用也更灵活,当然也最重要,让我们把最多的时间花在最重要的单词上。 百度 yuxiangdui 注: S = Spoken English W = Written English 1,2,3分别表示词频前1000,2000,3000,S4表示不在口语前3000中,W4表示不在书面语前3000中 排序方式: S1W1 S1W2 S1W3 S1W4 S2W1 S2W2 S2W3 S2W4 S3W1 S3W2 S3W3 S3W4 W1S4 W2S4 W3S4
2021-03-09 21:36:35 282KB 朗文 常用词汇 3000 分类
1
你可以这样使用这套资料: 这份 60000 词频表最大的妙用就是可以自己选择按 “SPOKEN" 口语词频排序。优先背下来口语常用词,适合以提高英语口语水平和实际交流能力为目的的学习者。
2021-03-06 20:03:21 4.1MB 英语 词频
1
python实现mapreduce词频统计 执行方式:打开cmd命令,cd到代码所在文件夹,输入python wordcout_map.py > words.txt | sort | python wordcout_reduce.py执行
2021-03-03 22:49:43 792B mapreduce
1
中文纠错工具简单词频统计
2021-02-26 09:09:59 1.81MB NLP
1
美国当代英语语料库(Corpus of Contemporary American English,简称COCA),用计算机统计英语单词词频并排序,已包含5.6亿字的文本,是目前最大的免费英语语料库。1990年至2017年,COCA以每年2000万字的速度更新扩充,以保证语料库内容的时效性。其语料均衡分布在口语、小说、杂志、报纸以及学术文章五类文体中,被认为是用来观察美国英语当前发展变化的最合适的英语语料库,也是广大英语爱好者的学习宝库。
2021-02-23 23:55:20 1.48MB COCA 英语 20000
1
WPS2012版本一下适用,词频分析插件
2021-02-23 18:06:00 2.6MB 词频
1
文件夹包括: COCA20000.pdf(PDF格式词频表); 美国当代英语语料库20000词频表.xlsx(EXCEL格式,支持导入到单词软件)
2021-02-19 15:40:44 14.78MB COCA COCA20000 词频表 语料库
1