用c++实现的全文词频计算算法,可用于相似度计算
2024-01-25 08:01:59 96KB 词频计算
1
本文以WoS数据库和CNKI数据库为样本,使用HistCite分析了Kano模型的研究现状,然后分析了Kano模型的引用网络,比较了Kano模型研究的主题和重点。 最后,根据引文网络和研究主题,提出了Kano模型的未来发展方向。
1
查询Ta最爱说的词语
2023-12-30 14:59:26 3KB
1
Python编写的用于遍历词频统计的工具
2023-10-28 06:03:07 1KB Python 遍历词频统计
1
中文分词 词频统计 罗列出要自动提取的关键词
2023-04-04 13:08:15 2.59MB 中文分词 自动提取关键词 词频统计
1
一、利用Java程序实现词频统计 二、利用Scala程序实现词频统计 三、利用Python程序实现词频统计 四、利用Akka和Scala实现词频统计 五、利用MapReduce实现词频统计 六、利用Hive实现词频统计 七、利用Storm实现词频统计 八、利用Spark实现词频统计
2023-03-22 16:42:18 688KB 词频统计
1
主要是读取文本,然后进行分词、词干提取、去停用词、计算词频,有界面,很实用
2023-03-10 13:37:17 70KB 词频计算
1
Python 豆瓣书评 bs4多页爬虫 jieba中文分词 tf-idf向量化 kmeans聚类+统计词频 +停用词 douban图书评价 浏览器多页爬虫 jupyter notebook numpy pandas sklearn 数据分析 数据挖掘
2023-03-09 10:46:03 1.57MB 爬虫 NLP kmeans 数据挖掘
1
rostnat新闻分析工具-武汉大学互联网科学研究中心。 一、功能说明:  采集多个信息源网络数据,并格式化保存。  分词和词性分析  词频统计  词语过滤  人名、地名、团体机构名提取  构建语义网络  数据可视化分析  特定数据来源总体概况  存放于MDB库中,并可自由导出 发布、维护新浪微博:@ROST软件 出品单位:武汉大学互联网科技研究中心 二、运行环境  window XP/2003/window 7  互联网  .Net Framework3.5 SP1以上  access数据库
2023-02-24 09:46:09 4.43MB 词频分析
1
网上流传的COCA词频表都缺词, 这个版本是经过众多版本互相校对得出的修正版. 包含csv和excel两个文件
2023-02-17 18:29:33 3.57MB 英语单词 COCA COCA60000 词频表
1