ROST CM 6是武汉大学沈阳教授研发编码的国内目前唯一的以辅助人文社会科学研究的大型免费社会计算平台。该软件可以实现微博分析、聊天分析、全网分析、网站分析、浏览分析、分词、词频统计、英文词频统计、流量分析、聚类分析等一系列文本分析。
2022-02-18 20:55:13 8.57MB 统计
1
统计文章中不重复的单词数
2022-02-18 15:58:52 11KB 单词 统计
1
分词&词云图&词频统计之paper资源
2022-01-28 14:03:50 2.54MB python jupyter wordcloud
1
用c#编写的一个英语词频统计小程序,很适合用于c#的学习参考程序。
2022-01-08 18:24:55 42KB c# 词频统计 英语
1
原创C语言实现词频统计,使用通用数据类型的双向链表进行缓存,自动拆分单词,,可通过命令行一次性读取多个文本,分别输出统计结果,简单实用。
2022-01-06 22:02:50 506KB 数据结构 c语言
1
主要是读取文本,然后进行分词、词干提取、去停用词、计算词频,有界面,很实用亲测可用, 谢谢支持。
2022-01-06 21:58:11 70KB 词频计算
1
这几天写了一个基于C语言对文本词频进行统计的程序,开发及调试环境:mac集成开发环境Xcode;测试文本,马丁.路德金的《I have a dream》原文演讲稿。 主要运行步骤: 1. 打开文本把文本内容读入流中并且开辟相应空间放入内存 2 .对文本内容进行处理,去除大写字母(转化为小写),去除特殊字符 3. 基于单链表对词频进行统计 4. 把统计结果进行归并排序 5.打印输出全部词频或者频率最高的10个单词和其出现次数 6.释放所有结点消耗的内存 废话不多说,上代码! // // main.c // word_frequency_statistic // // Created by t
2022-01-06 21:39:46 110KB
1
ctf工具-离线词频统计,暴力破解自由替换密文,自带分词语料库frequency_dictionary_en_82_765.txt,完美替代在线https://quipqiup.com/
2021-12-13 11:09:55 5.58MB ctf 解密 词频统计 词频分析
1
1:中文分词 2:词频统计 3:罗列出要自动提取的关键字 ---------------------------------------- 具有60 万字/秒的高速处理能力。
1
用Java实现的词频统计,代码。为了统计词汇出现频率,最简单直接的做法是另外建一个Map:key是单词,value是次数。将文章从头读到尾,读到一个单词就到Map里查一下,如果查到了则次数加一,没查到则往Map里一扔。这样做虽然代码写起来简单,但性能却非常差。首先查询Map的代价是O(logn),假设文章的字母数为m,则整个统计程序的时间复杂度为O(mlogn)不说,如果要拿高频词可能还需要对统计结果进行排序。即便对结构上进行优化性能仍然不高。
2021-11-25 09:47:21 6KB Java 词频统计
1