云计算技术课程设计;基于hadoop的词频统计设计;hadoop,mapreduce,hdfs
2022-06-19 15:04:40 1.85MB 云计算 hadoop 词频统计 mapreduce
1
一个用于词频统计的jar包
2022-06-13 13:05:36 36.7MB 个人
1
此案例使用的是IDEA开发工具,项目属于maven项目 该词频统计案例中,数据源是自动产生的(java程序自定义生成的),针对自定义生成的数据完成词频统计,完成后打包上传到storm程序中执行
2022-05-30 19:07:53 4.72MB storm 源码软件 java 大数据
1
本文介绍了python实现简单中文词频统计示例,分享给大家,具体如下: 任务 简单统计一个小说中哪些个汉字出现的频率最高 知识点 1.文件操作 2.字典 3.排序 4.lambda 代码 import codecs import matplotlib.pyplot as plt from pylab import mpl mpl.rcParams['font.sans-serif'] = ['FangSong'] # 指定默认字体 mpl.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题 word = [] coun
2022-05-12 19:58:13 111KB python python函数 python实例
1
上市公司数字经济词频统计,采用python爬虫以及文本分析得出,数据准确可靠。 包括不限于: 数字金融 自然语言处理 移动支付 智慧农业 数字营销 金融科技 智能营销 数字货币 物联网 机器学习 征信 人工智能 联盟链 智能投顾 开放银行 电子商务 云计算 智能客服 人脸识别 云计算 互联网金融 数字货币 物联网 人工智能 移动互联 机器学习 人工智能 云计算 物联网 工业互联网 移动互联网 网联 电子商务 云计算 深度学习 智能机器人 工业互联网 虚拟现实 智能机器人 电子商务 物联网 人工智能 云计算 电子商务 智能家居 移动互联网 移动互联 B2B 人工智能 B2C 电子商务 物联网 数据挖掘 商业智能 智慧农业 物联网 人工智能 B2C 电子商务 云计算 智能机器人 移动互联网 物联网 云计算 工业互联网 电子商务 工业互联网 电子商务 智能电网 B2B B2C O2O 电子商务 网联 物联网 人工智能 电子商务 物联网 人工智能 电子商务 云计算 智能交通 自动驾驶 商业智能 数据挖掘 智慧农业 数字营销 物联网 机器学习 人工智能 电子商务 云计算 混合现实 工业互联网 云
2022-05-02 11:04:35 1.3MB 爬虫 python 数字经济词频 上市公司
主要是读取文本,然后进行分词、词干提取、去停用词、计算词频,有界面,很实用亲测可用, 谢谢支持。
2022-04-08 01:11:51 70KB 词频计算
1
一个很常见的C语言大作业:1、从文件中读取一段英文,然后输出到控制台。2、统计英文段落中各单词的数目。3、输出数量最多的10个单词。
hadoop hadoop课程主页 这里是我的一些hadoop程序 最基本的wordcount,倒排索引,还有一个是对倒排索引的排序。数据用的是hadoop课程上给的武侠小说的数据。
2022-04-03 08:34:04 20.36MB Java
1
需求: 1.设计一个词频统计软件,统计给定英文文章的单词频率。 2.文章中包含的标点不计入统计。 3.将统计结果以从大到小的排序方式输出。 设计: 1.因为是跨专业0.0···并不会c++和java,只能用仅学过的C语言进行编写,还是挺费劲的。 2.定义一个包含单词和频率两个成员的结构体来统计词频(进行了动态分配内存,可以处理较大文本)。 3.使用fopen函数读取指定的文档。 4.使用fgetc函数获取字符,再根据取得的字符是否是字母进行不同的处理。 5.采用快速排序法对统计结果进行排序。 5.将整个统计结果循环输出。 部分代码: 结构体定义: struct fre_word { i
2022-03-24 23:26:39 115KB c c语言
1
对文件进行词频统计,最终按照单词出现次数排序输出前100个,并且将统计好的单词写入另一个文件
2022-03-24 22:43:43 8.36MB 词频统计
1