团队简介 大家好,我们是金融情报信息决定赛道的葫芦娃团队,本赛题的队伍成员均来自哈工大深圳的人类自然语言技术(HLT)小组,成员包括刘宇瀚,李嘉明,殷熔磾,刘道兴以及袁朝发。指导老师为徐睿峰教授。 方案分享 我们进行以下六点进行介绍 首先是任务简介与数据格式,具体的数据下载详见,也可以data文件夹里面的数据 整个数据存在一下的特征: 我们的整体方案流程如下: 数据集构造部分,我们按照如下形式构造,即内部实体级情感分类任务 数据预先部分我们采用如下操作: 为了更好学习到语料的信息,我们对语言模型在本数据集上又进行一次预训练 之后我们采用
1
一篇讲述信用卡违约预测模型分析以及影响因素探究的论文,信用卡对于银行来说是高收益和高风险并存的业务,伴随信用卡业务发展的是各大银行都在利用网络和 移动端的数据来建立客户的信用评分系统。如何从客户所填的资料里对客户进行信用评估、如何鉴别所填资料的真假性及应该要求客户填什么类型的资料等对银行来说是至关重要的。本文基于2005年台湾信用卡客户数据,建立Lasso-Logistic及随机森林模型来探索影响客户信用的关键因素,包括个体特征及某些客观特征,通过比较模型的预测准确度以及F得分等指标来选择预测效果更优的模型对银行信用卡违约进行预测分析。信用卡违约预测模型的建立以及影响客户信用的关键因素的探索,对于银行选择客户和设计资料填写具有重要的指导价值,并且能够为信贷决策提供一定的理论支持,具有很强的理论和现实意义。
2021-12-17 22:37:45 662KB 欺诈模型 信用卡违约模型 违约预测
1
信用卡欺诈是金融机构的一个广泛问题,涉及使用支付卡进行的盗窃和欺诈。 在本文中,我们探索了线性和非线性统计模型以及机器学习模型在真实信用卡交易数据上的应用。 建立的模型是受监督的欺诈模型,试图识别哪些交易最有可能是欺诈性的。 我们讨论了数据探索,数据清理,变量创建,特征选择,模型算法和结果的过程。 探索和比较了五个不同的监督模型,包括逻辑回归,神经网络,随机森林,增强树和支持向量机。 增强树模型显示了针对此特定数据集的最佳欺诈检测结果(FDR = 49.83%)。 所得模型可以在信用卡欺诈检测系统中使用。 可以在相关业务领域(如保险和电信)中执行类似的模型开发过程,以避免或检测欺诈行为。
2021-12-17 01:30:41 956KB 行业研究
1
对日益严重的电信欺诈问题,文章设计一个有效、可扩展的电信欺诈管理系统。该系统能够对运营商及第三方的多源数据进行统一、有效管理,采用大数据分析的方法准实时发现电信欺诈事件,针对新型欺诈事件可以快速扩展、升级,能够满足内、外部用户的多重业务需求。试验结果表明,本系统具有较好的性能,可以应用于大数据环境下的准实时识别电信欺诈事件。
2021-12-16 15:42:20 1.21MB 工程技术 论文
1
欧洲的信用卡持卡人在2013年9月2天时间里的284807笔交易数据,其中有492笔交易是欺诈交易,占比0.172%。数据采用PCA变换映射为V1,V2,...,V28 数值型属性,只有交易时间和金额这两个变量没有经过PCA变换。输出变量为二值变量,1为正常,0为欺诈交易。
2021-12-15 12:09:54 68.1MB 欺诈检测 风险识别
1
此资料里面的内容主要是解决如何在大数据集(本资料中是28w)中检测出欺诈数据集(本资料中是500),通过对原始数据集的处理之后,利用机器学习的方法,对其进行建模处理,然后不断进行模型的调优,最后达到检测效果。
2021-12-13 16:39:45 172.11MB 信用卡 欺诈检测
1
Kaggle IEEE-CIS欺诈检测
2021-12-08 15:29:19 18KB Python
1
欺诈是电信行业面临的主要挑战。 这些欺诈者损失了大量收入,这些欺诈者开发了不同的技术和策略来欺骗服务提供商。 对于要保留在该行业中的任何服务提供商,应将这些欺诈者的活动造成的预期损失降到最低,甚至不能完全消除。 但是由于海量数据的性质和所涉及的数百万订户的缘故,要发现这一群人变得非常困难。 为此,需要一种最佳的分类器和预测概率模型,该模型可以捕获订户的当前和过去的历史,并对它们进行相应的分类。 在本文中,我们开发了一些预测模型和最佳分类器。 我们模拟了八十(80)个订户的样本:他们的呼叫数量和呼叫持续时间,并将其分类为四个子样本,每个样本大小为二十(20)个。 我们获得了各组的先验概率和后验概率。 我们将这些后验概率分布分为两个样本多元数据,每个样本都有两个变量。 我们开发了区分真实订阅者和欺诈订阅者的线性分类器。 最优分类器(βA+ B)的后验概率为0.7368,我们根据该最优点对订户进行分类。 本文关注的是国内用户,感兴趣的参数是每小时的通话次数和通话时间。
2021-12-02 10:22:21 776KB 欺诈识别 电讯 最佳分类器 先验概率
1
欺诈识别 使用RNN训练和测试模型以预测信用卡欺诈交易。 #如何使用模型: 从链接下载名为creditcard.csv的数据集。 下载python脚本欺诈_detection.py 将脚本和csv数据文件保存在同一文件夹中,否则在脚本文件的第13行中提及csv文件的路径 运行代码以查看培训和测试的准确性
2021-11-24 11:49:39 2.86MB Python
1
安然欺诈项目 休斯顿的安然综合体- 安然是美国最大的公司之一。 由于公司欺诈,它破产了。 由于联邦调查的结果,大量的安然数据(电子邮件和财务数据)已进入公共记录。 该项目旨在建立一个分类器,该分类器可以基于公共的安然财务和电子邮件数据集来预测安然员工涉及欺诈的情况。 有关安然丑闻的更多详细信息,请参见 。 工作流程 该项目分为3个主要阶段: 功能选择和工程 算法选择 选型 特征选择与工程 首先,清理数据; 由于我们对个人数据感兴趣,因此删除了与“总计”和“公园旅行社”相对应的数据。 另外,“ LOCKHART EUGENE E”数据全为零,并且也被删除。 一些功能也被删除。 由于“ to
2021-11-21 19:00:23 2.77MB python machine-learning random-forest scikit-learn
1