【2018新书】统计分析与数据挖掘应用手册(Handbook of Statistical Analysis and Data Mining Applications,2 edition)
2021-12-27 19:06:47 21.3MB 数理统计 数据挖掘
1
数据挖掘 (DM) 涉及一种核心算法,它使数据比基本见解和知识更深入。 事实上,数据挖掘更多是知识发现过程的一部分。 信用卡 (CC) 提供商为其客户提供多张卡。 所有信用卡用户必须是真实和真诚的。 任何类型的错误都可能导致金融危机。 由于无现金交易的快速增长,不太可能,虚假交易也可以增加。 欺诈交易可以通过研究各种行为的信用卡作为先前的交易历史数据集来识别。 如果与可用成本模式有任何偏差,则为虚假交易。 DM 和机器学习技术 (MLT) 广泛应用于信用卡欺诈检测 (CCFD)。 在这份调查报告中,我们展示了各种广泛使用的 DM 和 MLT 检测信用卡欺诈的迹象。
2021-12-26 18:54:16 545KB Data Mining (DM)
1
#Python中的关联规则挖掘 文件描述: apriori.py:apriori算法的Python实现。 此代码读取用户指定的事务数据库文件,并根据用户指定的支持和置信度值生成频繁的项目集和关联规则。 DataSetx.txt:(x:1,2,3,4,5)五个不同的包含事务的数据集文件。 用法: 修改apriori.py的第14行,并指定要使用的数据集文件的名称。 从命令行运行程序:python apriori.py 出现提示时,以百分比形式提供支持和置信度值 生成频繁的项目集和关联规则
2021-12-26 17:22:38 4KB Python
1
MS-Excel是金融专业学生的默认软件,而命令行计量经济学软件则使财务分析更加容易,尤其是对于重复性任务。 这项研究提出了一些针对Stata的用户书面命令,旨在供金融专业学生使用。 这些命令和示例说明了如何访问各种财务数据以及如何在财务分析中实施常见的统计和计量经济学方法。
2021-12-23 22:58:19 4.21MB Stata finance data mining
1
association-rule-mining 使用Apriori和FP-growth进行关联规则挖掘
2021-12-22 15:28:21 4KB Python
1
武汉理工大学面向对象与多线程综合实验 - 数据挖掘系统实验迭代实现源码、实验指导书、课程资源
1
cars_train_set.zip
2021-12-21 13:01:49 934.61MB data mining
1
这本书基于两门斯坦福大学计算机科学专业的课程: CS246 和 CS35A。它的受众为计算机专业的本科学生,不需要任何基础(高中数学学好即可)。剑桥大学出版社出版。译本名为《大数据:互联网大规模数据挖掘与分布式处理》。 This book evolved from material developed over several years by Anand Rajaraman and Jeff Ullman for a one-quarter course at Stanford. The course CS345A, titled “Web Mining,” was designed as an advanced graduate course, although it has become accessible and interesting to advanced undergraduates. When Jure Leskovec joined the Stanford faculty, we reorganized the material considerably. He introduced a new course CS224W on network analysis and added material to CS345A, which was renumbered CS246. The three authors also introduced a large-scale data-mining project course, CS341. The book now contains material taught in all three courses.
2021-12-17 21:10:35 2.62MB Massive Data
1
数据挖掘中英论文; 上面是中文翻译,下面是英文原文; 图文并茂。
2021-12-17 17:20:23 7.4MB Data Mining
1
ECLAT关联规则挖掘 等价类转换关联规则挖掘算法的Python实现 我在无聊的时候写了这篇文章,并希望找到一个很好的算法来加快Cython的速度。 不幸的是,这个问题并不能轻易实现优化(而频繁模式挖掘的FP-tree方法要快得多)。 该算法在其擅长的各种数据集上(存储10个具有100万条记录的商品的商店)仍然非常快,但是在1000个具有1000条记录的商品的数据集上,它会显得很笨拙。 我的工作很乱。 也许我会回去整理一天。
1