数据挖掘项目 我在复旦大学数据挖掘过程中在R中所做的数据挖掘项目(内容为中文!) 这确实是一个“了不起的”课程...
2021-12-12 17:32:18 13.4MB HTML
1
由于学生的成功率反映了教育组织的成功,因此学生成功率不断提高的趋势成为所有教育组织的目标。 除此之外,学生完成中学后接受高等教育的意愿是教育组织最重要的目标之一。 许多原因会影响这种意愿,揭示这些原因可能会增强学生的意愿。 数据挖掘工具(尤其是决策树算法)可以被认为是找到隐藏模式以实现这些目标的最佳选择。 本工作中使用的实验数据集是由米尼奥大学的 Paulo Cortez 和 Alice Silva 收集和分析的两门课程(数学(395 个实例)和葡萄牙语(拥有 659 个实例的葡萄牙语课程))的葡萄牙学生的数据集,葡萄牙。 在这项工作中应用和试验了三种决策树算法(J48、RepTree 和 Hoeffding Tree(VFDT))。 结果表明,J48算法最适合对学生完成高等教育和课程成功的意愿进行分类和预测。
2021-12-06 10:04:50 809KB Educational Data Mining
1
MATLAB神经网络温度预报代码降雨预测使用数据挖掘方法 建议的系统在此,我们预测蒙特利尔市降雨的发生。 预测是一项艰巨的任务,对于“降雨”而言,预测甚至更加复杂和动态。 它取决于各种参数,例如最高温度,最低温度,相对湿度,露点,风速等。这些参数会不时变化,而且天气会随地理位置及其大气变量而变化。它根据以下步骤来预测降雨的发生:步骤1-我们使用数据挖掘方法收集了过去27年蒙特利尔的天气预报数据,并预测了未来几个月的降雨。 为此,我们从加拿大政府网站收集了1990年至2017年的天气预报数据。 步骤2-由于获取的数据是实时数据,因此对原始天气数据集进行数据预处理和数据转换。 提取的原始数据集具有9个属性。 在这里,我们使用诸如最高温度,最低温度,平均相对湿度,露点,风速,阵风,平均压力(海)和平均压力(站)之类的属性来预测总降水量。 步骤3-清理数据集并将其分为两组,一个训练集包含1990年至2015年的数据,一个测试集包含2017年的数据,使用训练数据对模型进行训练,训练后的数据将用作数据库,模型根据测试数据进行准确性测试。 第4步-为此,我们使用一些回归方法来预测未来几天的降雨量。
2021-12-04 17:40:38 356KB 系统开源
1
数据挖掘 步骤:CLIQUE聚类算法的实现 执行说明:在代码块中: 通过单击github存储库中的“代码”按钮下载文件夹。 解压缩打开的文件夹并复制文件夹路径。 现在在代码块IDE中,转到“设置”选项卡,然后单击“编译器”。 之后,选择“搜索目录”选项卡 在该文件夹中,在“编译器”部分下添加文件夹路径: 例如,如果文件夹名称是ABC,则C:\ Users ... \ ABC 7.构建并运行该程序。 它最初将在目标数据文件上运行。 B.参考文献: R. Agrawal,J。Gehrke,D。Gunopulos和P. Ragha-van,“用于数据挖掘应用的高维数据的自动子空间聚类”。 Pyclustering存储库-( )
2021-12-01 17:56:07 14.78MB C++
1
研究 发布基于飞轮的前沿研究工作,包括CV,NLP,KG,STDM等领域的顶会论文和比赛冠军模型。 目录 计算机视觉 任务类型 目录 简介 论文链接 图像检索 基于GNN的快速图像检索。 车流统计 AICITY2020车流统计竞赛数据集A TOP1方案。 -- 车辆再识别 给定目标车辆,在检索库中检索同id车辆,支持多种特征子网络。 -- 车辆异常检测 在监控视频中检测车辆异常情况,例如车辆碰撞,失速等。 -- 医学图像分析 任务:在AS-OCT图像的公共数据集上进行闭角类型分类和巩膜突点定位;相应模型:对应以上各任务的替代模型。 -- 光流估计 基于金字塔式处理,逐层学习细部光流,设计代价容量函数三原则的CNN模型,用于光流估计。 语义分割 针对多个数据集的图像语义分割模型的实现,包括Cityscapes,Pascal Context和ADE20K。 -- 轻量化检测 百度之星轻量化检测比赛评估工具。 -- 地标检索与识别 基于检索的地标检索与识别系统,支持地标型与非地标型识别,识别与检索结果相结合的多重识别结果投票和重新排序。 图像分类 模型利用重定义网络(URNet)
2021-11-30 18:47:39 85.49MB nlp data-mining computer-vision deep-learning
1
抽水数据挖掘水表 目标是为数据集中的每个记录预测水位的运行状况。 为您提供了以下有关水位的信息: amount_tsh-总静水头(可用于水位的水量) date_recorded-输入行的日期 出资者-谁为井提供了资金 gps_height-井的高度 安装程序-安装井的组织 经度-GPS坐标 纬度-GPS坐标 wpt_name-水位的名称(如果有的话) num_private- 盆地-地理水盆 子村-地理位置 地区-地理位置 region_code-地理位置(编码) district_code-地理位置(编码) lga-地理位置 病房-地理位置 人口-井周围的人口 public_meeting-对/错 recorded_by-输入此行数据的组 scheme_management-谁经营水位 scheme_name-谁操作水位 允许-如果允许水位 construction_year
2021-11-28 14:20:31 5.05MB JupyterNotebook
1
抽水数据挖掘水表 推动数据竞争的动力:数据挖掘地下水位。目的是为数据集中的每个记录预测水位的运行状况 进行中的工作将会更新!
2021-11-28 13:06:20 13.15MB JupyterNotebook
1
在网络安全框架中,入侵检测是基准测试之一,并且是保护PC免受许多线程侵害的基本方法。 入侵检测中的巨大问题以大量的虚假警报表示。 这个问题激发了一些专家来发现根据数据挖掘来减少错误警报的解决方案,这是在大数据(例如KDD CUP 99)中使用的分析过程的考虑因素。本文对处理入侵检测中的错误警报的各种数据挖掘分类进行了综述。 。 根据测试结果,在KDD CUP 99上进行数据挖掘的许多过程中,没有任何一个过程可以准确地显示所有攻击类别,并且没有错误警报。 多层感知器的最佳精度为92%; 但是,在基于规则的模型中,最佳训练时间是4秒。 结论是,应使用各种程序来处理几种网络攻击。
2021-11-26 16:24:34 147KB Intrusion Detection Data Mining
1
Introduction TipDM建模平台,是由广东泰迪智能科技股份有限公司研发并开源的数据挖掘工具,TipDM建模平台提供数据丰富的数据预处理、 数据分析与数据挖掘组件,帮助广大中小企业快速建立数据挖掘工程,提升数据处理的效能。同时,我们也在积极 推动大数据挖掘社区建设,构建校企对接桥梁,为企业精准推送优质大数据挖掘人才;在产业需求的基础上推动高 校的人才培养工作。 Documentation Communication Features 基于Python,用于数据挖掘建模。 使用直观的拖放式图形界面构建数据挖掘工作流程,无需编程。 支持多种数据源,包括CSV文件和关系型数据库。 支持挖掘流程每个节点的结果在线预览。 提供5大类共40种算法组件,包括数据预处理、分类、聚类等数据挖掘算法。 支持新增/编辑算法组件,自定义程度高。 提供众多公开可用的数据挖掘示例工程,一键创建,快速运行。
2021-11-22 16:45:50 11.06MB workflow machine-learning data-mining tensorflow
1
RMDL:RMDL:用于分类的随机多模型深度学习
1