只为小站
首页
域名查询
文件下载
登录
Java词频统计SortWord.zip
使用词表,遍历替换文章单词,再进行词频统计 使用两重循环,分别遍历时态替换表 lemmas.txt 和介词表 disablewords.txt 替换文章重复时态和介词,之后使用 treeMap 统计对应词的数量
2022-03-06 15:39:55
249KB
Java
词频
1
Java词频统计算法(使用单词树)
用Java实现的词频统计,代码。为了统计词汇出现频率,最简单直接的做法是另外建一个Map:key是单词,value是次数。将文章从头读到尾,读到一个单词就到Map里查一下,如果查到了则次数加一,没查到则往Map里一扔。这样做虽然代码写起来简单,但性能却非常差。首先查询Map的代价是O(logn),假设文章的字母数为m,则整个统计程序的时间复杂度为O(mlogn)不说,如果要拿高频词可能还需要对统计结果进行排序。即便对结构上进行优化性能仍然不高。
2021-11-25 09:47:21
6KB
Java
词频统计
1
java词频统计
1. 读取文档并分词。要求给定一篇.txt英文文档,计算机读入并统计该篇文章由哪些词组成,按字母顺序输出出现过的词已经每个词的出现频率。
2021-05-11 12:28:43
65KB
java词频统计
1
Java统计英文文章词频
该程序用于统计一篇英文单词词频,并输出到文件
2019-12-21 18:50:26
2KB
java,词频统计
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
SSM外文文献和翻译(毕设论文精品).doc
2020年数学建模国赛C题论文
基于javaweb的网上购物系统(毕业论文+答辩PPT+开题报告+源代码)
elsevier 爱思唯尔 系列期刊的word模板,template,单栏,双栏
EasyMedia-ui.zip
Keil5安装包
多目标优化算法(四)NSGA3的代码(MATLAB)
知网情感词典(HOWNET)
Android小项目——新闻APP(源码)
风电场风速及功率数据.zip
基于OpenCV的车牌号码识别的Python代码(可直接运行)
2022学术英语写作(东南大学) 章节测试+期末test答案
基于YOLOV5的车牌定位和识别源码.zip
基于S函数的BP神经网络PID控制器及Simulink仿真和对应代码模型.zip
MAC OS.X.10.8.iso 镜像文件
最新下载
诛仙架设vps教程linux版
最新南兴开料.zip
PoorSakura4_汉化补丁
中科院刘定生老师的数字图像处理课件
Hi3559AV100_PINOUT_CN.xlsx
基于谱相关的增强包络谱(EES)
B85-PLUS R2.0 BIOS v0504 WITH NVME
联想网御防火墙配置实例
CMOS低噪声放大器设计实例详解:5.5GHz LNA电路搭建与性能仿真,Cadence Virtuoso环境下的工艺流程与指标达成策略
elsevier 爱思唯尔 系列期刊的word模板,template,单栏,双栏.zip
其他资源
winsail模型
希尔伯特黄变换c++源代码
最新epaneth 2.00.12(汉化版)+中文手册
注水算法集合
biodap生物多样性指数计算软件
软件测试 - NextDate函数 - 测试用例详解
MissionPlanner-1.3中文版.zip
composer1.7.3
HP DL380G7 DL160 G6服务器安装server2008r2 系统RAID阵列卡驱动
模拟真人手写字体
Android Wifi开发Demo示例
安川GSD文件
淘淘商城项目源代码
伪原创词库8万条
insta-post-reminder:应用程序可随时使用的脚本和Javascript e Electron-源码
中央广播电视大学《建筑施工技术》期末总复习资料(含答案).pdf
无gulp:用于Gulp的LESS插件-最新版本为npm 3.5.0-源码
VC6.0(英文版)
设计多层线路板设计基础知识.pdf
长春都市圈国土空间规划 2020年10月 征求意见稿.pdf
C#winform 实现PDF阅读功能_0520.rar
YS-NEC编解码模块(IRTM)配套资料V1.0(20140603).zip )
Oracle、eclipse、html登录注册框架(以实现主要功能)
Hands On Machine Learning with Python: Concepts and Applications for Beginners
TCP.IP卷一第2版英文版