快接近两万多字,四万多词组,建议收藏快速轻松开发出属于自己的输入法,数据库建议使用objectBox
1
美国当代英语语料库20000词频表完整版 含词性。优先背下来口语常用词,适合以提高英语口语水平和实际交流能力为目的的学习者。
2022-04-21 06:13:30 424KB COCA 英语单词 词频表 语料库
1
主要是读取文本,然后进行分词、词干提取、去停用词、计算词频,有界面,很实用亲测可用, 谢谢支持。
2022-04-08 01:11:51 70KB 词频计算
1
一个很常见的C语言大作业:1、从文件中读取一段英文,然后输出到控制台。2、统计英文段落中各单词的数目。3、输出数量最多的10个单词。
hadoop hadoop课程主页 这里是我的一些hadoop程序 最基本的wordcount,倒排索引,还有一个是对倒排索引的排序。数据用的是hadoop课程上给的武侠小说的数据。
2022-04-03 08:34:04 20.36MB Java
1
需求: 1.设计一个词频统计软件,统计给定英文文章的单词频率。 2.文章中包含的标点不计入统计。 3.将统计结果以从大到小的排序方式输出。 设计: 1.因为是跨专业0.0···并不会c++和java,只能用仅学过的C语言进行编写,还是挺费劲的。 2.定义一个包含单词和频率两个成员的结构体来统计词频(进行了动态分配内存,可以处理较大文本)。 3.使用fopen函数读取指定的文档。 4.使用fgetc函数获取字符,再根据取得的字符是否是字母进行不同的处理。 5.采用快速排序法对统计结果进行排序。 5.将整个统计结果循环输出。 部分代码: 结构体定义: struct fre_word { i
2022-03-24 23:26:39 115KB c c语言
1
对文件进行词频统计,最终按照单词出现次数排序输出前100个,并且将统计好的单词写入另一个文件
2022-03-24 22:43:43 8.36MB 词频统计
1
本程序主要应用了hash结构,为提高效率,并未选择拉连法解决冲突, 发生冲突时利用 双备用hash 函数查找,如果失败再利用线性探查法查找 存储位置的方法 同时,程序设计了用户选项,选择可能出现单词数量,为的是提高程 序效率及减少开销
2022-03-24 22:34:47 9KB 词频统计
1
FileWriter writer1 new FileWriter "汉字字频统计结果分布 txt" ; writer1 write "汉字总数 "+totalNum+" r n" ; 汉字总个数 writer1 write "汉字种数 "+totalKind+" r n" ; 汉字种类数 writer1 write " r n" ; writer1 write " r n" ; writer1 write "带 的为高频字 r n" ; writer1 write "序号 t汉字 个数 t 字频 字频和 r n" ; 字频 词频统计并可统计汉字信息熵 含语料 100篇 完整">FileWriter writer1 new FileWriter "汉字字频统计结果分布 txt" ; writer1 write "汉字总数 "+totalNum+" r n" ; 汉字总个数 writer1 write "汉字种数 "+totalKind+" r n" ; 汉字种类数 writer1 write " r n [更多]
2022-03-23 07:49:06 90KB 字频 词频统计 含语料
1
本工具用来统计一个包含一系列汉语词汇的词列表,每个词在一个文件夹中各个文本文件中出现的频数,方便相关专业人员,如对外汉语、语文教材研究专业人员等处理大量词汇。支持多种格式词的检测,减少人工工作量和工作难度。经过大量的统计,软件检测的文章字数比微软Office2010检测同一文章的字数多,各个词条数目基本相同。由于构词法的差异,本软件不可作为字母文字词频分析工具,理论上支持日文、韩文等东亚语系词频统计。内有详细帮助。 本软件需要微软 .net Framework 2.0及以上版本支持。.net Framework是微软提供的新技术下开发的软件平台,操作系统已部分集成,若软件可以使用则推荐下载安装,若无法启动,请立即下载安装。 .net Framework4.0 独立安装包微软官方下载地址: http://www.microsoft.com/zh-cn/download/confirmation.aspx?id=17718 如有需要帮助请站内信联系用软件中的联系方式联系
2022-03-20 13:37:20 1.18MB 汉语 词频 统计
1