只为小站
首页
域名查询
文件下载
登录
爬取网页获得关键词
词频
.py
通过python写的爬取网页热并获取对应的
词频
***************************************************** 注释较为详细,可以自己输入网址爬取,形成本地文档
2022-03-19 15:29:42
2KB
爬虫
热词
词频
1
莎士比亚文集
词频
统计并行化算法_实验文件
这是《高校云计算应用创新大赛》里的最后一道题,题目是莎士比亚文集
词频
统计并行化算法。由于原网站上的实验文件已经无法下载了,所以这里上传一份,包含 shakespear.zip、stopword.txt.
2022-03-15 16:07:47
1.96MB
shakespear
stopword
1
三国演义.txt(python
词频
统计练习文件)
此文件用于初学者通过python来制作词云使用,配合我的博客相关词云基础语法进行使用,没有任何商业价值,仅供初学者使用和玩耍。
2022-03-13 15:50:21
1.68MB
python
分词文件
1
Hadoop-Streaming:Hadoop2.6 MapReduce2 Python3.5的一些经典入门程序:
词频
统计、好友推荐、PageRank-源码
Hadoop MapReduce Mapreduce是一个分布式运算程序的编程框架,是用户开发“基于hadoop的数据分析应用”的核心框架。Mapreduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并发运行在一个hadoop集群上。 Why MapReduce? 1.海量数据在单机上处理因为硬件资源限制,无法胜任 2.而一旦将单机版程序扩展到集群来分布式运行,将极大增加程序的复杂度和开发难度 3.引入mapreduce框架后,开发人员可以将绝大部分工作集中在业务逻辑的开发上,而将分布式计算中的复杂性交由框架来处理 MapReduce编程规范 1.用户编写的程序分成三个部分:Mapper,Reducer,Driver(提交运行mr程序的客户端) 2.Mapper的输入数据是KV对的形式(KV的类型可自定义) 3.Mapper的输出数据是KV对的形式(K
2022-03-10 13:56:25
2.1MB
Python
1
Java
词频
统计SortWord.zip
使用词表,遍历替换文章单词,再进行
词频
统计 使用两重循环,分别遍历时态替换表 lemmas.txt 和介词表 disablewords.txt 替换文章重复时态和介词,之后使用 treeMap 统计对应词的数量
2022-03-06 15:39:55
249KB
Java
词频
1
文本分类之
词频
统计(分词、词干提取、去停用词、计算
词频
,有界面)
主要是读取文本,然后进行分词、词干提取、去停用词、计算
词频
,有界面,很实用
2022-02-22 13:58:59
70KB
词频计算
1
PyFlink
词频
统计完整代码
该实例的处理过程是通过 Flink 对文件存储系统里的数据进行离线批处理,统计指定文件下的单词数,并将统计结果存储到其他文件下。 该实例业务实现过程如下: - 首先使用 `filesystem` 作为连接器,按照指定的 `csv` 格式来批量地读取指定路径的文件或文件夹,以此创建源数据表。 - 然后,在 Flink 中执行批处理实例逻辑,完成批处理任务。 - 最后,使用 `filesystem` 连接器,将处理后结果写入目标文件或文件夹内,构建结果表。
2022-02-21 19:11:27
4KB
PyFlink
实时大数据
1
python文件
词频
统计
读取给定文本文件,统计单词,计算TOP 10 有一个文件sample.txt,对其进行单词统计,不区分大小写,并显示单词重复最多的10个单词。
2022-02-21 00:03:59
1KB
python开发
1
词频
统计软件ROSTCM6.rar
ROST CM 6是武汉大学沈阳教授研发编码的国内目前唯一的以辅助人文社会科学研究的大型免费社会计算平台。该软件可以实现微博分析、聊天分析、全网分析、网站分析、浏览分析、分词、
词频
统计、英文
词频
统计、流量分析、聚类分析等一系列文本分析。
2022-02-18 20:55:13
8.57MB
统计
1
词频
统计软件.exe
统计文章中不重复的单词数
2022-02-18 15:58:52
11KB
单词
统计
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
东南大学英语技术写作慕课所有答案
多目标优化算法(四)NSGA3的代码(python3.6)
Keil5安装包
云视通扫描工具.zip
matlab时频分析工具箱+安装方法+函数说明+最新版tftb.
Vivado license 永久
现代操作系统原理与实现.pdf
粒子群多无人机协同多任务分配.zip
stm32f103+OLED12864+FFT音乐频谱(多种显示效果 提供原理图)
基于蒙特卡洛生成电动汽车充电负荷曲线程序
Android小项目——新闻APP(源码)
Alternative A2DP Driver 1.0.5.1 无限制版
画程(版本6.0.0.127)setup个人版
2019年秋招—华为硬件工程师笔试题目.pdf
BP_PID控制仿真.rar
最新下载
test_pcl.zip
【SHP文件-2022.07】江西省行政区划(省、市、县)+道路网+公路网
School Days HQ GPK文件解包工具
国科大模式识别期末考试题 2016.pdf
运算放大器基本仿真实例
国科大模式识别历年期末试题
牟乃夏-ArcGIS Engine地理信息系统开发教程(基于C#.NET)
东南Dx7多媒体系统升级包
红外星人win10主题
江西省乡镇级区划图 shp格式
其他资源
Proteus仿真 8086+8255+按键+数码管
ESP8266+OLED屏实现天气预报+温度显示+NTP时间同步6屏带中文显示V8.9
微电网离并网控制策略
STM32F407 FSMC控制AD7606、SRAM、NOR FLASH
IT售前咨询白皮书(全)
最大匹配matlab程序
在串str中查找字串substr最后一次出现的位置
QT一个多界面自由切换代码
Keras数据集-npz格式(minist, boston_housing, reuters, imdb)
echarts-gl.js
Model-Driven Software Engineering in Practice
抽奖程序,可以实现随机摇号,并且可以动态显示
SecureCRSecureFXPortable.rar
情人节表白 love.rar
输变电三维设计.rar
circleci-hello-world-nodejs:一个简单的node.js“ hello world”应用程序,用于在Circle-CI上演示持续集成和部署(CICD)!-源码
《高效进阶》线上模拟赛日程安排.pdf
逆滤波和维纳滤波 matlab
MSP430F5529中文指导
电子通讯录.vbproj.user
华为支付SDK服务端回调接口V1.0.1