只为小站
首页
域名查询
文件下载
登录
Java词频统计SortWord.zip
使用词表,遍历替换文章单词,再进行词频统计 使用两重循环,分别遍历时态替换表 lemmas.txt 和介词表 disablewords.txt 替换文章重复时态和介词,之后使用 treeMap 统计对应词的数量
2022-03-06 15:39:55
249KB
Java
词频
1
Java词频统计算法(使用单词树)
用Java实现的词频统计,代码。为了统计词汇出现频率,最简单直接的做法是另外建一个Map:key是单词,value是次数。将文章从头读到尾,读到一个单词就到Map里查一下,如果查到了则次数加一,没查到则往Map里一扔。这样做虽然代码写起来简单,但性能却非常差。首先查询Map的代价是O(logn),假设文章的字母数为m,则整个统计程序的时间复杂度为O(mlogn)不说,如果要拿高频词可能还需要对统计结果进行排序。即便对结构上进行优化性能仍然不高。
2021-11-25 09:47:21
6KB
Java
词频统计
1
java词频统计
1. 读取文档并分词。要求给定一篇.txt英文文档,计算机读入并统计该篇文章由哪些词组成,按字母顺序输出出现过的词已经每个词的出现频率。
2021-05-11 12:28:43
65KB
java词频统计
1
Java统计英文文章词频
该程序用于统计一篇英文单词词频,并输出到文件
2019-12-21 18:50:26
2KB
java,词频统计
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
MATLAB车牌识别系统
PSO-LSSVM的MATLAB代码.rar
云视通扫描工具.zip
得到品控手册7.0.pdf
基于S函数的BP神经网络PID控制器及Simulink仿真和对应代码模型.zip
matlab机器人工具箱实现机械臂直线轨迹&圆弧轨迹规划
DBSCAN算法Matlab实现
毕业设计:基于Python的网络爬虫及数据处理(智联招聘)
安卓开发期末大作业----单词本(源码,任务书,大报告,apk文件)(基于andord studio)
CUDA并行程序设计 GPU编程指南-中文扫描539页完整版pdf+高质量英文完整591页原版非扫描pdf
拾荒者扫描器.zip
知网情感词典(HOWNET)
python大作业--爬虫(完美应付大作业).zip
麻雀搜索算法(SSA)优化bp网络
狂神说全部笔记内容.zip
最新下载
华为HCIP所有实验《华为技术认证HCNP路由交换实验指南》实验拓扑带基础配置.zip
图形化硬件编程加法器和乘法器.zip
AD域控批量管理操作工具
AD域服务器经典图文教程
Spire.Pdf.zip
AD域配置详解
学生宿舍信息管理系统-软件项目管理文档.zip
Unity3DExtractorOSE.zip
python爱心代码高级
opencv-4.8.1-msvc2019-CUDA-cudnn-Qt5.15.2
其他资源
dll suite绿色破解版
Jlink_ob注册神器_2019
操作系统精髓与设计原理第六版课后答案(英文版)
PWPF原理及仿真(含simulink模型和m文件)
基于MapReduce的分布式计算系统
东软实训周记
seismic unix指导全书(14章)
数值分析试题及答案(试题全)
信息论基础课件及试卷(周荫清)
电子相册管理系统源代码
个人主页程序简洁漂亮HTML代码
AASM睡眠分期规则.ppt
卡尔曼滤波算法和扩展卡尔曼滤波算法
sqlserver2008数据库实例练习
贝叶斯经济时间序列预测
蓝讯SDK开发_工具链及IDE_包含RV32-Toolchain-Setup_v0.9.0_及codeblocks-17.12_修改时间20191226.zip
代码统计工具 cct
22《隨緣》情是隨緣的露珠.mp4
fhe-code1.zip
javaEE上传文件
AIX 5.3安装文档
Rational Rose 2003 rational_perm.dat
TMS320C6678开发板历程
c++围棋可执行文件