只为小站
首页
域名查询
文件下载
登录
Java词频统计SortWord.zip
使用词表,遍历替换文章单词,再进行词频统计 使用两重循环,分别遍历时态替换表 lemmas.txt 和介词表 disablewords.txt 替换文章重复时态和介词,之后使用 treeMap 统计对应词的数量
2022-03-06 15:39:55
249KB
Java
词频
1
Java词频统计算法(使用单词树)
用Java实现的词频统计,代码。为了统计词汇出现频率,最简单直接的做法是另外建一个Map:key是单词,value是次数。将文章从头读到尾,读到一个单词就到Map里查一下,如果查到了则次数加一,没查到则往Map里一扔。这样做虽然代码写起来简单,但性能却非常差。首先查询Map的代价是O(logn),假设文章的字母数为m,则整个统计程序的时间复杂度为O(mlogn)不说,如果要拿高频词可能还需要对统计结果进行排序。即便对结构上进行优化性能仍然不高。
2021-11-25 09:47:21
6KB
Java
词频统计
1
java词频统计
1. 读取文档并分词。要求给定一篇.txt英文文档,计算机读入并统计该篇文章由哪些词组成,按字母顺序输出出现过的词已经每个词的出现频率。
2021-05-11 12:28:43
65KB
java词频统计
1
Java统计英文文章词频
该程序用于统计一篇英文单词词频,并输出到文件
2019-12-21 18:50:26
2KB
java,词频统计
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
Plex v7.12电视端app
RentingSystem.rar
非线性本构关系在ABAQUS中的实现.pdf
多智能体的编队控制程序的补充(之前上传少了一个文件)
2020年数学建模B题穿越沙漠全部代码全国赛二等奖.zip
极域电子教室管理系统软件V2.0 2022稳定版 支持Win11
云视通扫描工具.zip
Android小项目——新闻APP(源码)
多目标优化算法(二)MOEAD(附带NSGA2)的文档和代码(MATLAB)
通过svm cnn knn对高光谱数据集PaviaU进行分类(matlab)
Monet智能交通场景应用
20200318附加-2019年电赛综合测评方案详细计算过程(pdf版本,有朋友反映word版本乱码,特意转为pdf)
多目标优化算法(四)NSGA3的代码(MATLAB)
模型预测控制MPC(模型预测电流控制,MPCC)的simulink仿真,2016b版本
2010年-2020中国地面气候资料数据集(V3.0)
最新下载
AFUwin64 v5.05.04
DK4.1调音软件
C#+PaddleOCRSharp 实现深度学习识别字符
创见U盘/内存卡数据恢复软件v2.0.zip
锐丰LAX DK4.1P前级处理器、效果器 调试软件
VMware-viclient-all-5.5.0-4032365.exe
大漠插件3.1233免费版本
spider_ximalaya.rar
打开qrp文件软件,好用
德国劳尔(LAUER)PCS系列面板编程手册
其他资源
JESD209-4B(LPDDR4).pdf
基于STM32的烟雾传感器(MQ-2)数据监测
安卓开发 设置应用语言 中英文切换。
PLC 组态王 双容水箱 液位控制
CDMA simulink仿真模块
Android openssl 全平台.a文件
线性代数知识点总结
BP神经网络拟合函数的Matlab程序-网络基础文档类资源
模拟万用表模电课程设计
java电子邮件收发系统 java源代码(2.2版)
武汉理工大学计算机基础综合实验
基于单片机的智能交通灯PROTEUS仿真图
matlab开发-progressbar
双涡旋光束的产生与传输
IFIX5.8与S7400(300)使用NettoPLCsim建立虚拟通讯_NO Logo
数字城市服务自适应访问控制模型
东北大学《计算机网络》平时测验真题(含答案).pdf
053考试总结60.pdf
导线网平差
asp.net+sqlserver小区物业管理系统
javaWeb 毕业设计 图书管理系统 详细代码 视频
HSPICE Reference Manual Commands and Control Options, version I-2013.12
Vxworks学习总结
IEEE- 美国电气电子工程师标准
基于javaweb的网上书店系统