爬取了深沪股票的资讯,包含标题、时间、来源、内容、关键词、链接和股票ID
2021-10-02 02:25:06 11KB Python开发-Web爬虫
1
功能 连续获取一个或多个微博关键词搜索结果,并将结果写入文件(可选),数据库(可选)等所谓微博关键词搜索即:搜索正文中包含指定关键词的微博,可以指定搜索的时间范围。举个栗子,通常您可以搜索包含关键字“迪丽热巴”且发布日期在2020-03-01和2020-03-16之间的微博。搜索结果数量巨大,对于非常热门的关键字,在一天的指定时间范围内,可以获得1000万以上的搜索结果。注意这里的一天指的是时间筛选范围,具体多连续将这1000万微博下载到本地还要看获取的速度。1000万只是一天时间范围可获取的微博数量,如果想获取更多微博,可以增加时间范围,比如10天,最多可获得1000万X10 = 1亿条搜索结果,当然你也可以再加大时间范围。对于大多数关键字,微博一天产生的相关搜索结果应该低于1000万,因此可以说本程序可以获取指定关键字的全部或近似全部的搜索结果。 ,如微博正文,发布者等,详情见部分。支
2021-09-30 18:49:18 21KB Python
1
电信设备-有关关键词的动态信息具有热度判定功能的归类库.zip
2021-09-28 10:00:41 74KB 资料
1
热门关键词的、随机词语摆放 [注:本内容来自网络,在此分享仅为帮助有需要的网友,如果侵犯了您的权利,麻烦联系我,我会第一时间删除,谢谢您。]
2021-09-27 09:18:51 1.42MB android源码 关键字 随机位置
1
标题组合,关键词+关联词组合成标题 无毒,绿色,免费,实用的小工具 不是一词二词三词这种垃圾
2021-09-24 16:43:12 854KB 淘宝标题组合 关键词 热词 标题制作
1
刷搜索引擎下拉框关键词,刷淘宝关键词排名,刷网站关键词排名
2021-09-24 14:44:05 4.95MB 刷下拉框
1
TF(Term Frequency)词频,在文章中出现次数最多的词,然而文章中出现次数较多的词并不一定就是关键词,比如常见的对文章本身并没有多大意义的停用词。所以我们需要一个重要性调整系数来衡量一个词是不是常见词。该权重为IDF(Inverse Document Frequency)逆文档频率,它的大小与一个词的常见程度成反比。在我们得到词频(TF)和逆文档频率(IDF)以后,将两个值相乘,即可得到一个词的TF-IDF值,某个词对文章的重要性越高,其TF-IDF值就越大,所以排在最前面的几个词就是文章的关键词。 TF-IDF算法的优点是简单快速,结果比较符合实际情况,但是单纯以“词频”衡量一个
2021-09-23 18:21:46 53KB python python算法 tf-idf
1
EXCEL拆分宏工具(保留格式,可选多sheet拆分,按选定关键词拆分,效率高) 运行平台 MS OFFICE 2016
2021-09-23 15:16:21 147KB excel 拆分
1
jquery实现input搜索输入关键词后自动筛选相关信息效果
2021-09-17 11:49:56 33KB jquery input 搜索输入
1
关键词的提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键。系统从语言的词性角度考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法(FS),并利用TFIDF算法来筛选出关键词以完成将Web文档进行快速有效分类的目的。实验表明,该方法在不影响分类准确率的情况下,分类的速度明显提高。
1