Text-Mining:使用TF-IDF算法查找关键字的文本挖掘代码和使用Apriori算法生成关联规则的文本挖掘代码

上传者: 42173205 | 上传时间: 2022-04-14 18:09:34 | 文件大小: 37KB | 文件类型: ZIP
文字挖掘 此代码可用于为文档分配关键字,并从文档数据库中查找单词之间的关联规则。 此外,只需稍加修改,就可以使用搜索关键字创建文档建议系统。 入门 克隆此存储库 执行textMining.py 系统将要求您提供支持和信心。 输入那些,您将获得关联规则作为输出。 就是这样。 做得好! 先决条件 需要在计算机上安装python 3.6。 运行测试 编写代码的方式是,当您执行TextMining.py时,它将检查名为documentDatabase的文件夹并读取其中的所有.txt文件。 每个文本文件都充当一个单独的文档。 由于代码的输入应该是文档数据库,因此我们在documentDatabase文件夹中有多个文档。 读取所有文档,然后通过删除停用词来对其进行清洁。 使用词干进一步清除单词。 停用词列表可以在listOfStopWords.txt中找到 Example of stemmin

文件下载

资源详情

[{"title":"( 27 个子文件 37KB ) Text-Mining:使用TF-IDF算法查找关键字的文本挖掘代码和使用Apriori算法生成关联规则的文本挖掘代码","children":[{"title":"Text-Mining-master","children":[{"title":"listOfStopWords.txt <span style='color:#111;'> 2.18KB </span>","children":null,"spread":false},{"title":"documentDatabase","children":[{"title":"doc25.txt <span style='color:#111;'> 1.77KB </span>","children":null,"spread":false},{"title":"doc13.txt <span style='color:#111;'> 1.68KB </span>","children":null,"spread":false},{"title":"doc8.txt <span style='color:#111;'> 4.32KB </span>","children":null,"spread":false},{"title":"doc14.txt <span style='color:#111;'> 4.78KB </span>","children":null,"spread":false},{"title":"doc21.txt <span style='color:#111;'> 2.26KB </span>","children":null,"spread":false},{"title":"doc18.txt <span style='color:#111;'> 3.02KB </span>","children":null,"spread":false},{"title":"doc5.txt <span style='color:#111;'> 1.25KB </span>","children":null,"spread":false},{"title":"doc12.txt <span style='color:#111;'> 2.34KB </span>","children":null,"spread":false},{"title":"doc22.txt <span style='color:#111;'> 1.13KB </span>","children":null,"spread":false},{"title":"doc16.txt <span style='color:#111;'> 3.29KB </span>","children":null,"spread":false},{"title":"doc4.txt <span style='color:#111;'> 561B </span>","children":null,"spread":false},{"title":"doc9.txt <span style='color:#111;'> 549B </span>","children":null,"spread":false},{"title":"doc11.txt <span style='color:#111;'> 1.12KB </span>","children":null,"spread":false},{"title":"doc1.txt <span style='color:#111;'> 2.79KB </span>","children":null,"spread":false},{"title":"doc10.txt <span style='color:#111;'> 1.14KB </span>","children":null,"spread":false},{"title":"doc19.txt <span style='color:#111;'> 2.67KB </span>","children":null,"spread":false},{"title":"doc7.txt <span style='color:#111;'> 2.77KB </span>","children":null,"spread":false},{"title":"doc3.txt <span style='color:#111;'> 1.22KB </span>","children":null,"spread":false},{"title":"doc15.txt <span style='color:#111;'> 2.63KB </span>","children":null,"spread":false},{"title":"doc17.txt <span style='color:#111;'> 4.55KB </span>","children":null,"spread":false},{"title":"doc20.txt <span style='color:#111;'> 2.73KB </span>","children":null,"spread":false},{"title":"doc6.txt <span style='color:#111;'> 620B </span>","children":null,"spread":false},{"title":"doc2.txt <span style='color:#111;'> 2.77KB </span>","children":null,"spread":false}],"spread":false},{"title":"aprioriInput.txt <span style='color:#111;'> 3.52KB </span>","children":null,"spread":false},{"title":"TextMining.py <span style='color:#111;'> 12.61KB </span>","children":null,"spread":false},{"title":"README.md <span style='color:#111;'> 2.00KB </span>","children":null,"spread":false}],"spread":true}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明