数据挖掘 (DM) 涉及一种核心算法,它使数据比基本见解和知识更深入。 事实上,数据挖掘更多是知识发现过程的一部分。 信用卡 (CC) 提供商为其客户提供多张卡。 所有信用卡用户必须是真实和真诚的。 任何类型的错误都可能导致金融危机。 由于无现金交易的快速增长,不太可能,虚假交易也可以增加。 欺诈交易可以通过研究各种行为的信用卡作为先前的交易历史数据集来识别。 如果与可用成本模式有任何偏差,则为虚假交易。 DM 和机器学习技术 (MLT) 广泛应用于信用卡欺诈检测 (CCFD)。 在这份调查报告中,我们展示了各种广泛使用的 DM 和 MLT 检测信用卡欺诈的迹象。
2021-12-26 18:54:16 545KB Data Mining (DM)
1
欺诈检测模型
2021-12-26 17:28:43 1.23MB JupyterNotebook
1
为了方便付款和无分类,如今信用卡付款已变得非常流行。 从我们的银行帐户中,我们可以直接在线支付款项。 尽管采用这种简单的付款方式,但它仍具有欺诈的缺点。 未授权人员访问其他人的银行详细信息称为入侵者。 这些入侵者还可以访问一些未经授权的交易。 为了防止这种情况,我们需要一些强大的机制。 在本文中,我们使用了三种不同的分类算法(逻辑回归,随机森林和支持向量)进行欺诈检测,并将发现这三种算法的准确性比较。
2021-12-24 13:08:01 729KB Credit card fraud Classification
1
市场调研-中国欺诈检测和预防软件和工具市场现状及未来发展趋势.doc
2021-12-24 13:02:32 664KB
1
欧洲的信用卡持卡人在2013年9月2天时间里的284807笔交易数据,其中有492笔交易是欺诈交易,占比0.172%。数据采用PCA变换映射为V1,V2,...,V28 数值型属性,只有交易时间和金额这两个变量没有经过PCA变换。输出变量为二值变量,1为正常,0为欺诈交易。
2021-12-15 12:09:54 68.1MB 欺诈检测 风险识别
1
此资料里面的内容主要是解决如何在大数据集(本资料中是28w)中检测出欺诈数据集(本资料中是500),通过对原始数据集的处理之后,利用机器学习的方法,对其进行建模处理,然后不断进行模型的调优,最后达到检测效果。
2021-12-13 16:39:45 172.11MB 信用卡 欺诈检测
1
Kaggle IEEE-CIS欺诈检测
2021-12-08 15:29:19 18KB Python
1
欺诈是电信行业面临的主要挑战。 这些欺诈者损失了大量收入,这些欺诈者开发了不同的技术和策略来欺骗服务提供商。 对于要保留在该行业中的任何服务提供商,应将这些欺诈者的活动造成的预期损失降到最低,甚至不能完全消除。 但是由于海量数据的性质和所涉及的数百万订户的缘故,要发现这一群人变得非常困难。 为此,需要一种最佳的分类器和预测概率模型,该模型可以捕获订户的当前和过去的历史,并对它们进行相应的分类。 在本文中,我们开发了一些预测模型和最佳分类器。 我们模拟了八十(80)个订户的样本:他们的呼叫数量和呼叫持续时间,并将其分类为四个子样本,每个样本大小为二十(20)个。 我们获得了各组的先验概率和后验概率。 我们将这些后验概率分布分为两个样本多元数据,每个样本都有两个变量。 我们开发了区分真实订阅者和欺诈订阅者的线性分类器。 最优分类器(βA+ B)的后验概率为0.7368,我们根据该最优点对订户进行分类。 本文关注的是国内用户,感兴趣的参数是每小时的通话次数和通话时间。
2021-12-02 10:22:21 776KB 欺诈识别 电讯 最佳分类器 先验概率
1
该存储库包含在《会计研究杂志》上发表的论文中使用的数据和代码。 如果您在研究中使用我们的数据和代码,请引用我们的论文,如下所示: 杨宝,柯斌,李斌,余嘉莉和张杰(2020)。 。 会计研究杂志,58(1):199-235。 数据说明表 1.描述哪些作者处理了数据并进行了分析。 Yang Bao和Julia Julia处理了数据。 杨宝,宾科,李斌和余嘉莉共同进行了分析。 2.关于如何获取或生成原始数据的详细说明,包括数据源,下载或获取数据的特定日期以及用于生成数据的工具(例如,用于调查或实验)。 我们建议一位以上的作者能够为原始数据的所述来源提供担保。 本文使用档案数据。 数据主要来自可商购的来源。 详情如下所示。 AAER数据:我们最初的会计欺诈样本来自美国加州大学伯克利分校财务报告和管理中心(CFRM)编制的SEC的会计和审计执行公告(AAER)。 本文当前版本中使用的AA
1
整体系统架构和软件栈,怎样利用和改进Spark来形成最终方案。 如何搭建快速强大的特征衍生,选择和转化流程(Pipeline)。我们会在细节方面展示真实数据所带来的挑战和我们开发的采样,填充,缩放和其他领域专用的特征转换模块。我们正在将其中的许多内容贡献给Spark社区。 深入分析我们使用的算法怎样解决数据的不平衡性及与其他算法的对比结果。 在实现过程中累积的其他开发经验
2021-09-28 14:16:33 1.31MB Spark
1