句子关键词提取算法设计,李明浩,,本文从网络答疑系统的设计与开发的需要出发,讨论了句子关键词提取的总体思路,即“先分解再综合,遵循组句规律,抽取特征,降低
2022-03-22 20:52:07 206KB 首发论文
1
通过python写的爬取网页热并获取对应的词频 ***************************************************** 注释较为详细,可以自己输入网址爬取,形成本地文档
2022-03-19 15:29:42 2KB 爬虫 热词 词频
1
直通车 关键词 组合生成器 做淘宝直通车的用得着
2022-03-18 23:47:32 588KB 直通车 关键词 组合生成器
1
基于改进的TFIDF关键词自动提取算法研究,基于改进的TFIDF关键词自动提取算法研究
2022-03-16 19:31:03 108KB TFIDF 关键词提取
1
淘宝关键词挖掘软件,淘宝关键词优化神器,淘宝行业关键词采集
1
利用谷歌搜索SQL注入漏洞关键词 目标关键字+inurl:id 英语字母及单词+inurl:id 网站域名+inurl:id 阿拉伯数字+inurl:id inurl:asp?id= inurl:Article_Print.asp? EnCompHonorBig.asp?id=随便加个数字 showproduct.asp?id=随便加个数字 inurl:ManageLogin.asp EnCompHonorBig.asp?id= 随便加个数字 inurl: (asp?=数字) inurl: (php?=数字 等等 里面都有很多。 非常简单好用
1
主要为大家详细介绍了TF-IDF与余弦相似性的应用,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
2022-03-09 19:06:23 222KB TF IDF 余弦 关键词
1
keyextract_word2vec #基于Word2Vec的文本关键词抽取方法 大多数人都是将Word2Vec作为词向量的等价名词,也就是说,纯粹作为一个用来获取词向量的工具,关心模型本身的读者并不多。 可能是因为模型过于简化了,所以大家觉得这样简化的模型肯定很不准确,所以没法用,但它的副产品词向量的质量反而还不错。 没错,如果是作为语言模型来说,Word2Vec实在是太粗糙了。 但是,为什么要将它作为语言模型来看呢? 抛开语言模型的思维约束,只看模型本身,我们就会发现,Word2Vec的两个模型 —— CBOW和Skip-Gram —— 实际上大有用途,它们从不同角度来描述了周围词与当前词的关系,而很多基本的NLP任务,都是建立在这个关系之上,如关键词抽取、逻辑推理等。 有心想了解这个系列的读者,有必要了解一下Word2Vec的数学原理。当然,Word2Vec出来已经有好几年了,介绍
2022-03-09 15:20:23 6KB 附件源码 文章源码
1
IEEE电气和电子工程师协会_工程科学类的全部 关键词索引.pdf
2022-03-07 16:11:45 341KB IEEE
1
关键词提取是自然语言研究领域的基础和关键点,在很多领域都有广泛的应用。以本校图书馆提供的8045篇《红色中华》新闻为源数据,首先对数据进行数据清理,去除其中的噪声数据,然后对每篇新闻进行数据结构解析,在解析的基础上计算了词语的TFIDF权重、词位置权重、词性权重、词长权重和词跨度权重,综合考虑这些权重计算出词语的综合权重,以综合权重最大的前8个词语作为新闻的关键词。从准确度、召回率及F1值3个指标对改进算法、经典的TFIDF算法和专家标注进行对比,发现改进算法在3个指标上均优于经典的TFIDF算法,与专家标注比较接近,值得推广应用。
2022-03-06 15:04:53 1.61MB TFIDF; 词性; 词跨度; 词长;
1