中国工业经济刊登的文章,另外还有引用的代码程序、算法和原始数据及分析研究结果(见相同论文标题的另外附加文件)。《中国工业经济》期刊勇立潮头,率先在国内期刊界公开论文数据和程序等资料,代码数据开源,让论文结果复制成为可能,方便大家基于此做更深入的分析和研究。
2025-03-28 21:28:43 1.18MB
1
银行卡电信诈骗危险预测 一、包含以下实验: 使用机器学习算法(包含三个算法,分别为KNN、决策树、集成学习bagging),实现银行电信诈骗数据集实现二分类任务; 二、包含一个课程汇报PPT: 1、数据集介绍; 2、算法介绍; 3、实验步骤(包含数据分析探索+模型建立+融合模型); 4、实验结果及分析; 运行平台:jupyter; 二分类准确率(acc)都是99%以上,对于小白上手学习机器学习,是一个非常不错的练手项目;对于正在上数据分析、数据挖掘、机器学习课程的同学来说,这也是一个非常不错的汇报项目,可以直接拿里面的课程ppt进行汇报;
2025-03-28 17:30:57 80.05MB 机器学习 课程资源 数据集
1
机器学习模型案例与SHAP解释性分析:涵盖类别与数值预测,CatBoost、XGBoost等六大模型深度解析及SHAP分析比较,shap分析代码案例,多个机器学习模型+shap解释性分析的案例,做好的多个模型和完整的shap分析拿去直接运行,含模型之间的比较评估。 类别预测和数值预测的案例代码都有,类别预测用到的6个模型是(catboost、xgboost、knn、logistic、bayes,svc),数值预测用到的6个模型是(线性回归、随机森林、xgboost、lightgbm、支持向量机、knn),机器学习模型; SHAP解释性分析; 多个模型比较评估; 类别预测模型(catboost、xgboost、knn、logistic、bayes、svc); 数值预测模型(线性回归、随机森林、xgboost、lightgbm、支持向量机、knn); 完整shap分析代码案例; 模型之间比较评估。,"多模型SHAP解释性分析案例集:类别预测与数值预测的全面比较评估"
2025-03-27 23:28:10 47KB ajax
1
① 地震灾害评估及建筑结构特征数据集 ② 最新地震爆发数据集 (1990-02-03 至 2023-03-03) ③ 土耳其地震救灾推文数据集 ④ 阿联酋地震数据集 (2010 至 2023) ⑤ 新西兰地震数据集 ⑥ 日本地震数据集 (2019/1/1-2021/12/03) ⑦ 2023全球地震数据集 ⑧ 土耳其地震发数据集 (1910 至 2017) ⑨ 希腊地震数据集 (1965 至 2023 ) ⑩ 印度尼西亚地震数据集 11 全球地震数据集 (2001 年 1 月 1 日至 2023 年 1 月 1 日) 12 地震感知数据集 (那不勒斯地震事件的公众反应和情绪反应分析)
2025-03-27 18:56:07 172.14MB 数据集 地震数据 机器学习
1
一个包含网络钓鱼邮件数据的集合。网络钓鱼邮件是一种欺诈性的电子邮件,通常伪装成合法的通信,目的是诱骗收件人透露敏感信息,如用户名、密码、信用卡信息等。这个数据集可能被用于研究、开发和测试反钓鱼技术,帮助识别和防范网络钓鱼攻击。是一个综合性的网络钓鱼邮件数据集,由研究人员整理而成,旨在帮助研究者分析网络钓鱼邮件的特征并改进检测方法。该数据集整合了多个来源的电子邮件数据,包括Enron、Ling、CEAS、Nazario、尼日利亚诈骗和SpamAssassin等数据集,涵盖了邮件的正文、主题、发件人和收件人信息等内容。 最终的数据集包含约82,500封邮件,其中42,891封为钓鱼邮件,39,595封为合法邮件。这些数据可用于训练和测试机器学习模型,以提高对网络钓鱼邮件的识别能力。数据集的结构清晰,每封邮件都有明确的标签,方便研究人员进行分类和分析。此外,该数据集还被用于开发基于BERT的自然语言处理模型,以实现高效的网络钓鱼邮件检测。
2025-03-25 20:39:39 77.12MB 机器学习
1
本数据集为机器视觉道路障碍检测voc格式数据集,主要包含车载视角下道路中的障碍,如汽车行人摩托车,除此之外还有一部分道路中的路障、施工围挡、升降栅栏的数据集,实际训练的话可以再去数据集网站下载补充常见的汽车行人数据集。
2025-03-24 20:18:46 318.25MB 数据集 机器学习 目标检测
1
机器学习实战教程,小项目
2025-03-22 17:06:42 66.09MB 机器学习 python
1
多算法模型(BI_LSTM GRU Mamba ekan xgboost)实现功率预测。包括数据处理、特征工程、模型训练、模型推理和结果输出,最终结果以 JSON 格式返回。可灵活替换模块和数据集。实现轻松上手,快速训练快速推理。项目代码如下 data/ │ ├── data_process1.py # 数据预处理代码 ├── data_process.csv # 预处理数据文件 └── 91-Site_1A-Trina_10W.csv # 原始数据文件 inference/ │ ├── myprocessor.py # 推理主代码入口 ├── logs/ # 日志文件路径 │ └── logging.log # 推理日志文件 ├── config/ # 配置文件路径 │ └── config.yaml # 推理配置文件 ├── output/ # 推理输出路径 │ └── ...
2025-03-05 14:03:34 41.05MB 功率预测 机器学习 人工智能
1
python-双重机器学习(Double Machine Learning, DML)是一种结合了机器学习和因果推断的统计方法,它在经济管理领域有着广泛的应用。这种方法特别适用于处理高维数据和复杂的非线性关系,同时能够提供无偏的参数估计。在经济管理领域,DML 可以用于估计政策效果、市场反应、消费者行为等。例如,研究者可以使用 DML 来评估某一政策变化对经济指标的影响,或者分析市场干预措施对消费者购买行为的改变。DML 通过正交化技术解决了传统机器学习在因果推断中的偏差问题,使得研究者能够在控制混淆变量的同时,准确地估计出核心参数。 本数据以一个双重机器学习的案例展开,展示了双重机器学习的使用方法。
2025-02-27 23:01:51 357KB python 机器学习
1
内容概要:本文详细介绍了清华大学双聘教授张家铖关于DeepSeek及其AI幻觉的研究成果,涵盖了AI幻觉的概念与成因,如何评估和缓解幻觉的风险,以及幻觉的潜在创造性应用。具体而言,文中首先解释了什么是AI幻觉,探讨了它为何发生,特别是模型训练中的数据偏差、泛化困难等问题。其次,对DeepSeek和类似模型在多种情境下进行幻觉评测,并给出了详细的幻觉率统计数据。接着讨论了幻觉在金融、医疗等领域造成的问题,并提出了减轻这些负面影响的方法,比如联网搜索、双AI验证、提示词工程等。最后强调了幻觉在艺术创造和技术突破方面的积极意义。 适合人群:对于希望深入了解人工智能技术尤其是大型语言模型行为特征的专业人士来说是非常有价值的参考资料;对于关注AI发展和社会影响的一般公众也能提供重要见解。 使用场景及目标:该研究不仅揭示了现有AI系统的潜在风险,还鼓励开发者采用更好的方法来评估和改进他们的系统;同时也展示了幻觉在创造性领域的潜力,如艺术创作和技术革新等方面的应用前景。 其他说明:文档中提供了若干具体的应用案例,比如金融机构利用DeepSeek提升服务质量的例子,还有关于如何有效防范AI产生幻觉的实践经验分享。此外,还提及了一些新兴的应用趋势,例如通过幻觉促进科学研究的新模式。
2025-02-23 15:28:48 3.57MB 人工智能 自然语言处理 机器学习
1