文字挖掘 此代码可用于为文档分配关键字,并从文档数据库中查找单词之间的关联规则。 此外,只需稍加修改,就可以使用搜索关键字创建文档建议系统。 入门 克隆此存储库 执行textMining.py 系统将要求您提供支持和信心。 输入那些,您将获得关联规则作为输出。 就是这样。 做得好! 先决条件 需要在计算机上安装python 3.6。 运行测试 编写代码的方式是,当您执行TextMining.py时,它将检查名为documentDatabase的文件夹并读取其中的所有.txt文件。 每个文本文件都充当一个单独的文档。 由于代码的输入应该是文档数据库,因此我们在documentDatabase文件夹中有多个文档。 读取所有文档,然后通过删除停用词来对其进行清洁。 使用词干进一步清除单词。 停用词列表可以在listOfStopWords.txt中找到 Example of stemmin
2022-04-14 18:09:34 37KB python text-mining tf-idf data-mining-algorithms
1
IBM SPSS Modeler数据与文本挖掘实战----数据和程序
2022-04-13 13:45:31 2.1MB SPSS Modeler 挖掘实战 程序
1
面向财经新闻的文本挖掘系统设计与实现 面向财经新闻的文本挖掘系统设计与实现面向财经新闻的文本挖掘系统设计与实现面向财经新闻的文本挖掘系统设计与实现
2022-03-26 15:14:15 3.58MB 人工智能
1
中科院计算所,讲述“信息检索”比较全的讲义,值得参考.
2022-03-18 11:28:31 12.53MB 信息检索 搜索引擎 中文分词 文本挖掘
1
Twitter情绪分析 这是一种自然语言处理问题,其中通过使用机器学习模型对消极消息中的消极消息进行归类来进行情感分析,以进行分类,文本挖掘,文本分析,数据分析和数据可视化 介绍 如今,自然语言处理(NLP)成为数据科学研究的温床,而NLP的最常见应用之一就是情感分析。 从民意测验到制定完整的营销策略,该领域已完全重塑了企业的运作方式,这就是为什么这是每个数据科学家都必须熟悉的领域。 与一组人手动完成相同任务所需的时间相比,可以在几秒钟内处理成千上万个文本文档的情感(以及其他功能,包括命名实体,主题,主题等)。 我们将按照解决一般情感分析问题所需的一系列步骤进行操作。 我们将从预处理和清理
1
ROST CM 6是武汉大学沈阳教授研发编码的国内目前唯一的以辅助人文社会科学研究的大型免费社会计算平台。该软件可以实现微博分析、聊天分析、全网分析、网站分析、浏览分析、分词、词频统计、英文词频统计、流量分析、聚类分析等一系列文本分析,用户量超过7000,遍布海内外100多所大学
2022-03-03 17:19:39 10.82MB rost 文本挖掘
1
Law Crime Mining Based on Corpus build and content analysis by NLP methods. 基于领域语料库构建与NLP方法的裁判文书与犯罪案例文本挖掘项目
2022-03-02 10:09:03 33MB Python开发-自然语言处理
1
今天找词库找得很苦,非得要积分很麻烦,明明都是开源的。这里我下载了知网的开源情感词典和大连理工的开源情感词典,分享在这里,后面是提取地址,请大家走链接: https://pan.baidu.com/s/1GBn9TY1Fuggq-2SQJP5QVg 提取码: 8zyt
2022-02-24 21:28:01 1.25MB 情感词典 情感词库 文本挖掘
1
使用python对51job的招聘信息进行爬虫,使用python对职位信息输出词云,词频统计图,使用jieba库进行分词,然后使用gensim的word2vec进行词向量训练,然后使用sklearn的k-means算法进行聚类。压缩包内有代码,数据,简单的小论文文档,代码来源于网络,论文自己写的,水平一般。代码在anaconda的spyder开发环境可以正常运行。
2022-02-19 21:55:10 2.02MB python爬虫 词云 词向量 K-means文本聚类
1
整合文本挖掘的商务智能系统结构研究收集.pdf
2022-01-27 10:04:10 2.87MB 网络技术资源