本项目的数据来源于网新银行举办的数据建模比赛的数据,特征包含三类数据,客户基本信息(x1-x11),行为类数据(x12-x56),风险评分类数据(x57-x161),但具体是什么特征我们并无从得知,因此想从特征实际意义入手分析建模是及其困难的。数据包含训练集30000个样本,测试集10000个样本,每个样本除开161个特征变量,还包括干预变量(treatment)和响应变量(y),干预变量把数据集分为两类,实验集(treatment = 1),控制集(treatment = 0),实验集和控制集的比例大致为1:4。 源码包含用随机森林做缺失值填充、画qini曲线、主程序三个文件 原文链接:https://blog.csdn.net/qq_52073614/article/details/136763601
2024-10-29 21:38:07 4.88MB 数据集
1
接收市场实时行情,自动下单交易,并生成交易日志。 重要: 1、使用本程序最好主观与量化结合。 2、最好在有确定趋势的前提下开启本软件。 3、智能程序能够自主交易,但是最好还是有人值守。 4、第一笔出现亏损,退出程序,停止当日交易。第一笔盈利可以继续运行,直到出现第一笔亏损,退出交易程序,结束交易。 5、震荡市赚钱很难,就是神仙也没有办法,因此不是参与市场的时机,禁止启动本程序,发财还是要靠机遇。 6、智能软件并非万能,开发者已竭尽全力提供优秀作品,但未来诸事确实不能未卜先知,市场有风险,阁下需慎之又慎。 期货真相: 大型趋势性行情可遇不可求,因此耐得住寂寞,能够忍受市场漫长的震荡出清,也是一种能力。对于资金量较小的散户,三五几月的震荡盘整便可以使资金耗尽,淘汰出局,成为亏损的大多数中的普通一员。因此,绝大多数时候保持观望,空仓持币等待机会来临,是小资金必须的生存战略。 当然,还有一种长线持仓策略,更需要极好的心态去扛住亏损。 期货大法: 第一种日内短线策略,便是基于本策略程序的交易方法,获取超短小额收益,积少成多,集腋成裘。可以规避市场大动荡带来的不确定性。
2023-11-05 17:50:49 3MB 量化研究 数据分析
1
用于疲劳检测的数据集,数据集分为两类:疲劳状态和非疲劳状态,每个状态下都是人脸部图像的分割图像。  在该模型架构下:将人脸图像作为输入,从中检测并裁剪出面部特征点,这些裁剪出的面部特征,如眼睛、眼圈(眼睑)、鼻子、嘴巴以及整个面部皮肤图像等五个部分分别作为输入有针对性的训练各个模型,然后各个模型将预测返回输入图像所对应的疲劳值,最终将这些值加权求和,(眼睛和黑眼圈的权重更高)最终值来确定一个人的疲劳程度。
数据挖掘中聚类的分析与研究,赵富,,聚类分析是数据挖掘中的一个重要研究领域。它将数据对象分组成为若干个类或簇,使得在同一个簇中的对象比较相似,而不同簇中的对
2022-12-14 19:25:34 198KB 数据挖掘
1
该数据集包括2017年和2018年期间从科隆周围德国高速公路的无人机视频记录中提取的11万辆车辆的后处理轨迹,包括汽车和卡车(见图5)。 在六个不同地点,记录了60次,平均长度为17分钟(共16.5小时),覆盖了约420米长的路段。
1
学习者 StudyFinder是一种灵活且可配置的应用程序,可从Clinicaltrials.gov提取研究结果,并从替代数据源(例如临床试验管理系统)中扩充数据。 StudyFinder还具有一个基本的主题组件,可以进行进一步的自定义。 如果您条件,请与studyFinder团队联系: 。 有兴趣在您所在的机构使用StudyFinder,或者 对StudyFinder有任何疑问,或 想要了解有关该工具的更新或增强的更多信息。 发展 开始使用开发环境的最简单方法是使用docker-compose : 运行docker-compose run web rake db:create db:migrate db:seed来初始化数据库和搜索索引。 运行docker-compose up -d以启动开发服务器。 访问http://localhost:3000/以查看该应用程序。 部署
2022-10-31 23:58:55 2.2MB Ruby
1
Quora Duplicate Questions Dataset 是用于判别文本中问题对是否重复的数据集,其被用于文本分类研究,旨在为任何人提供训练和测试语义等效模型的机会。 该数据集由超过 400,000 行潜在问题重复对组成,每行包含问题的 ID、问题的完整文本以及指示该行是否包含重复对的二进制值。 该数据集由 Quora 团队于 2017 年发布,主要发布人有 Shankar Iyer、Nikhil Dandekar 和 Kornél Csernai。
2022-07-13 16:05:22 12.35MB 数据集
1.1 发展历史:从秀场、游戏到泛娱乐,从PC转战移动 1.2 行业现状:老牌直播已上市,创业公司不断增加 三、行业梳理及观察 3.1 产业链 3.2 商业模式 3.3 行业格局 全景图 巨头布局:大流量平台纷纷发力,BAT外仍有众多玩家 秀场直播:赛道拥挤,同质化严重 游戏直播:行业五强已出现,腾讯布局早,占绝对优势 泛娱乐直播:行业刚刚起步,仍在探索试错 3.4 案例分析 四、行业思考 4.1 拥挤的赛道,仍需探索的平台定位,资本胜者胜 4.2 全民直播植根社交属性,流量为王 4.3 植根娱乐,优质内容是留存用户关键 4.4 立足长远,真需求与高付费意愿缺一不可23
2022-07-06 23:47:05 2.2MB 研究数据
1
数据挖掘在餐饮业的应用,刘志磊,,近些年来数据挖掘发展迅速,而且在一些商业应用中取得了很大进展,比如在零售业中,帮助店主合理安排商品的摆放、进货数量及时机
2022-06-17 11:42:59 539KB 数据挖掘
1
CCER数据库特供研究数据系列.doc
2022-05-09 11:03:42 102KB 文档资料 数据库 database