Text-Mining:使用TF-IDF算法查找关键字的文本挖掘代码和使用Apriori算法生成关联规则的文本挖掘代码

上传者: 42173205 | 上传时间: 2022-04-14 18:09:34 | 文件大小: 37KB | 文件类型: ZIP
文字挖掘 此代码可用于为文档分配关键字,并从文档数据库中查找单词之间的关联规则。 此外,只需稍加修改,就可以使用搜索关键字创建文档建议系统。 入门 克隆此存储库 执行textMining.py 系统将要求您提供支持和信心。 输入那些,您将获得关联规则作为输出。 就是这样。 做得好! 先决条件 需要在计算机上安装python 3.6。 运行测试 编写代码的方式是,当您执行TextMining.py时,它将检查名为documentDatabase的文件夹并读取其中的所有.txt文件。 每个文本文件都充当一个单独的文档。 由于代码的输入应该是文档数据库,因此我们在documentDatabase文件夹中有多个文档。 读取所有文档,然后通过删除停用词来对其进行清洁。 使用词干进一步清除单词。 停用词列表可以在listOfStopWords.txt中找到 Example of stemmin

文件下载

资源详情

( 27 个子文件 37KB ) Text-Mining:使用TF-IDF算法查找关键字的文本挖掘代码和使用Apriori算法生成关联规则的文本挖掘代码
Text-Mining-master
listOfStopWords.txt 2.18KB
documentDatabase
doc25.txt 1.77KB
doc13.txt 1.68KB
doc8.txt 4.32KB
doc14.txt 4.78KB
doc21.txt 2.26KB
doc18.txt 3.02KB
doc5.txt 1.25KB
doc12.txt 2.34KB
doc22.txt 1.13KB
doc16.txt 3.29KB
doc4.txt 561B
doc9.txt 549B
doc11.txt 1.12KB
doc1.txt 2.79KB
doc10.txt 1.14KB
doc19.txt 2.67KB
doc7.txt 2.77KB
doc3.txt 1.22KB
doc15.txt 2.63KB
doc17.txt 4.55KB
doc20.txt 2.73KB
doc6.txt 620B
doc2.txt 2.77KB
aprioriInput.txt 3.52KB
TextMining.py 12.61KB
README.md 2.00KB
[{"title":"( 27 个子文件 37KB ) Text-Mining:使用TF-IDF算法查找关键字的文本挖掘代码和使用Apriori算法生成关联规则的文本挖掘代码","children":[{"title":"Text-Mining-master","children":[{"title":"listOfStopWords.txt <span style='color:#111;'> 2.18KB </span>","children":null,"spread":false},{"title":"documentDatabase","children":[{"title":"doc25.txt <span style='color:#111;'> 1.77KB </span>","children":null,"spread":false},{"title":"doc13.txt <span style='color:#111;'> 1.68KB </span>","children":null,"spread":false},{"title":"doc8.txt <span style='color:#111;'> 4.32KB </span>","children":null,"spread":false},{"title":"doc14.txt <span style='color:#111;'> 4.78KB </span>","children":null,"spread":false},{"title":"doc21.txt <span style='color:#111;'> 2.26KB </span>","children":null,"spread":false},{"title":"doc18.txt <span style='color:#111;'> 3.02KB </span>","children":null,"spread":false},{"title":"doc5.txt <span style='color:#111;'> 1.25KB </span>","children":null,"spread":false},{"title":"doc12.txt <span style='color:#111;'> 2.34KB </span>","children":null,"spread":false},{"title":"doc22.txt <span style='color:#111;'> 1.13KB </span>","children":null,"spread":false},{"title":"doc16.txt <span style='color:#111;'> 3.29KB </span>","children":null,"spread":false},{"title":"doc4.txt <span style='color:#111;'> 561B </span>","children":null,"spread":false},{"title":"doc9.txt <span style='color:#111;'> 549B </span>","children":null,"spread":false},{"title":"doc11.txt <span style='color:#111;'> 1.12KB </span>","children":null,"spread":false},{"title":"doc1.txt <span style='color:#111;'> 2.79KB </span>","children":null,"spread":false},{"title":"doc10.txt <span style='color:#111;'> 1.14KB </span>","children":null,"spread":false},{"title":"doc19.txt <span style='color:#111;'> 2.67KB </span>","children":null,"spread":false},{"title":"doc7.txt <span style='color:#111;'> 2.77KB </span>","children":null,"spread":false},{"title":"doc3.txt <span style='color:#111;'> 1.22KB </span>","children":null,"spread":false},{"title":"doc15.txt <span style='color:#111;'> 2.63KB </span>","children":null,"spread":false},{"title":"doc17.txt <span style='color:#111;'> 4.55KB </span>","children":null,"spread":false},{"title":"doc20.txt <span style='color:#111;'> 2.73KB </span>","children":null,"spread":false},{"title":"doc6.txt <span style='color:#111;'> 620B </span>","children":null,"spread":false},{"title":"doc2.txt <span style='color:#111;'> 2.77KB </span>","children":null,"spread":false}],"spread":false},{"title":"aprioriInput.txt <span style='color:#111;'> 3.52KB </span>","children":null,"spread":false},{"title":"TextMining.py <span style='color:#111;'> 12.61KB </span>","children":null,"spread":false},{"title":"README.md <span style='color:#111;'> 2.00KB </span>","children":null,"spread":false}],"spread":true}],"spread":true}]

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明
服务器状态检查中...