文字挖掘 此代码可用于为文档分配关键字,并从文档数据库中查找单词之间的关联规则。 此外,只需稍加修改,就可以使用搜索关键字创建文档建议系统。 入门 克隆此存储库 执行textMining.py 系统将要求您提供支持和信心。 输入那些,您将获得关联规则作为输出。 就是这样。 做得好! 先决条件 需要在计算机上安装python 3.6。 运行测试 编写代码的方式是,当您执行TextMining.py时,它将检查名为documentDatabase的文件夹并读取其中的所有.txt文件。 每个文本文件都充当一个单独的文档。 由于代码的输入应该是文档数据库,因此我们在documentDatabase文件夹中有多个文档。 读取所有文档,然后通过删除停用词来对其进行清洁。 使用词干进一步清除单词。 停用词列表可以在listOfStopWords.txt中找到 Example of stemmin
2022-04-14 18:09:34 37KB python text-mining tf-idf data-mining-algorithms
1
反编译C#项目得到源代码,恢复窗体的.cs和.resx文件间的关联.zip
2022-04-13 08:13:03 59KB c#
用python进行关联规则挖掘,欢迎大家来和我一起交流心得!
2022-04-11 18:40:50 2KB python
1
安装oracle所需的依赖包及依赖包关联的依赖,解压压缩包到目录可直接离线安装这些rpm包,全量安装包都在这了binutils、compat-libcap1-1.10、compat-libstdc++-33-3.2.3-69、glibc-2.12-1.212.el6_10.3、glibc-devel-2.12-1.212、libaio-0.3.107-10、libaio-devel-0.3.107-10、libgcc-4.4.7-23、libstdc++-4.4.7-23、libstdc++-devel-4.4.7-23、unixODBC-2.2.14-14、unixODBC-2.2.14-14、unixODBC-devel-2.2.14-14......
2022-04-11 17:03:58 29.98MB oracle linux centos 数据库
1
抖音如何正确关联热点上热门?
2022-04-11 14:10:46 843KB 抖音
1
这是一份豆瓣电影评论分析,包含用户评论、不同国随着时间增长,电影流行趋势变化 为由用户电影评论构建tf-idf模型抽取的关键短语。由电影风格标签抽取的关联规则。通过kmeans算法聚类电影,样本通过one-hot编码为特征,然后再使用kmeans算法聚类
2022-04-11 14:10:33 145.23MB 数据分析 机器学习 python 关联规则
写得非常好的FPGrowth程序,规范、简洁
2022-04-10 19:24:55 7.93MB 数据挖掘 FPGrowth 关联分析
1
世界国家表+世界省份表+世界城市表 共3个数据表,相互之间通过id关联 其中省份表结构如下 CREATE TABLE `province` ( `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '关联city表的province_id', `country_id` int(11) NOT NULL DEFAULT 0 COMMENT '国家id', `province_name` varchar(100) NOT NULL DEFAULT '' COMMENT '省份名称', PRIMARY KEY (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=3836 DEFAULT CHARSET=utf8mb4 COMMENT='省份表';
2022-04-10 19:03:36 22.49MB 世界地址表 世界城市表 地图 地理
1
人工智能算法+灰色关联分析模型
1
图书馆图书借阅关联规则挖掘c#报告、程序完整
2022-04-08 01:46:02 730KB 规则挖掘程序
1