《数据挖掘》 Weka实验报告 姓名 _ 学号_ 指导教师 开课学期 2015 至 2016 学年 2 学期 完成日期 2015年6月12日 1.实验目的 基于http://archive.ics.uci.edu/ml/datasets/Breast+Cancer+WiscOnsin+%28Ori - ginal%29的数据,使用数据挖掘中的分类算法,运用Weka平台的基本功能对数据集进 行分类,对算法结果进行性能比较,画出性能比较图,另外针对不同数量的训练集进行 对比实验,并画出性能比较图训练并测试。 2.实验环境 实验采用Weka平台,数据使用来自http://archive.ics.uci.edu/ml/Datasets/Br- east+Cancer+WiscOnsin+%28Original%29,主要使用其中的Breast Cancer Wisc- onsin (Original) Data Set数据。Weka是怀卡托智能分析系统的缩写,该系统由新西兰怀卡托大学开发。Weka使 用Java写成的,并且限制在GNU通用公共证书的条件下发布。它可以运行于几乎所有操作 平台,是一款免费的,非商业化的机器学习以及数据挖掘软件。Weka提供了一个统一界 面,可结合预处理以及后处理方法,将许多不同的学习算法应用于任何所给的数据集, 并评估由不同的学习方案所得出的结果。 3.实验步骤 3.1数据预处理 本实验是针对威斯康辛州(原始)的乳腺癌数据集进行分类,该表含有Sample code number(样本代码),Clump Thickness(丛厚度),Uniformity of Cell Size(均匀的细胞大小), Uniformity of Cell Shape (均匀的细胞形状),Marginal Adhesion(边际粘连),Single Epithelial Cell Size(单一的上皮细胞大小),Bare Nuclei(裸核),Bland Chromatin(平淡的染色质),Normal Nucleoli(正常的核仁), Mitoses(有丝分裂),Class(分类),其中第二项到第十项取值均为1- 10,分类中2代表良性,4代表恶性。 通过实验,希望能找出患乳腺癌客户各指标的分布情况。 该数据的数据属性如下: 1. Sample code number(numeric),样本代码; 2. Clump Thickness(numeric),丛厚度; 3.Uniformity of Cell Size(numeric)均匀的细胞大小; 4. Uniformity of Cell Shape(numeric),均匀的细胞形状; 5.Marginal Adhesion(numeric),边际粘连; 6.Single Epithelial Cell Size(numeric),单一的上皮细胞大小; 7.Bare Nuclei(numeric),裸核; 8.Bland Chromatin(numeric),平淡的染色质; 9. Normal Nucleoli(numeric),正常的核仁; 10.Mitoses(numeric),有丝分裂; 11.Class(enum),分类。 3.2数据分析 由http://archive.ics.uci.edu/ml/datasets/Breast+Cancer+WiscOnsin+%28Ori- ginal%29得到一组由逗号隔开的数据,复制粘贴至excel表中,选择数据——分列——下 一步——逗号——完成,该数据是有关乳腺癌数据集,有11个属性,分别为Sample code number(样本代码),Clump Thickness(丛厚度),Uniformity of Cell Size(均匀的细胞大小),Uniformity of Cell Shape (均匀的细胞形状),Marginal Adhesion(边际粘连),Single Epithelial Cell Size(单一的上皮细胞大小),Bare Nuclei(裸核),Bland Chromatin(平淡的染色质),Normal Nucleoli(正常的核仁), Mitoses(有丝分裂),Class(分类),因为复制粘贴过来的数据没有属性,所以手工 添加一行属性名。Weka分类数据需把excel保存为一个csv文件。 3.2.1 .csv -> .arff 将CSV转换为ARFF最迅捷的办法是使用WEKA所带的命令行工具。 打开weka,之后出现GUI界面,如图1所示: (图1) 点击进入"Exploer"模块,要将.csv 格式转换为 .arff格式,点击open file...,打开刚保存的"乳腺癌数据集.csv 数据挖掘实验报告主要探讨了如何使用Weka这一数据挖掘工具对乳腺癌数据集进行分类和分析。实验的目标是基于UCI机器学习库中的Breast Cancer Wisconsin (Original)数据集,利用Weka的分类算法进行预测,并对不同算法的性能进行比较。Weka是由新西兰怀卡托大学开发的开源软件,它支持多种操作系统,并提供了丰富的数据预处理、学习算法和评估工具。 实验环境主要涉及Weka平台和乳腺癌数据集。乳腺癌数据集包含了11个属性,包括丛厚度、细胞大小均匀性、细胞形状均匀性等,以及一个分类标签,表示肿瘤是良性还是恶性。实验者需要先对数据进行预处理,例如在Excel中整理数据,并将其转换为Weka可读的CSV格式。 在数据预处理阶段,首先需要了解每个属性的意义,然后导入数据,通常需要手动添加属性名称。由于Weka需要ARFF格式的数据,因此需要将CSV文件转换为ARFF。这可以通过Weka的命令行工具或图形用户界面(GUI)实现,比如在“Explorer”模块中选择打开CSV文件,系统会自动将其转换为ARFF格式。 数据分析阶段,实验者可能应用了Weka中的一系列分类算法,如决策树、贝叶斯网络、随机森林等,并对这些算法的性能进行了评估。性能比较通常包括准确率、召回率、F1分数等指标,同时通过绘制混淆矩阵和ROC曲线来直观地展示模型的优劣。此外,实验可能还涉及到训练集大小对模型性能的影响,通过改变训练集的数量,观察并比较不同规模训练集下的分类效果。 通过这样的实验,可以学习到数据挖掘的基本流程,包括数据清洗、特征工程、模型构建和评估。同时,还能掌握Weka工具的使用,理解不同分类算法的工作原理和适用场景。实验报告最后会总结实验结果,提出可能的改进策略,例如特征选择、参数调优等,以提高模型的预测能力。这样的实践对于理解数据挖掘技术在实际问题中的应用具有重要意义。
2024-07-13 18:13:04 987KB 文档资料
1
在电子工程领域,IIC(Inter-Integrated Circuit)总线是一种广泛应用的串行通信协议,由Philips(现为NXP Semiconductors)在1982年开发。它主要用于连接微控制器与各种外围设备,如EEPROM、传感器、显示驱动器等。在这个"IIC proteus仿真实验"中,我们主要关注的是如何在Proteus模拟环境中理解和操作IIC协议,并通过24C04 EEPROM进行实践。 24C04是一款基于IIC接口的EEPROM(Electrically Erasable Programmable Read-Only Memory),存储容量为512字节(64页,每页8字节)。它广泛用于存储配置数据、非易失性信息等,因为即使断电,存储的数据也能保持不变。 在Proteus中进行IIC仿真实验,首先需要了解IIC的基本原理。IIC协议有两个信号线:SDA(Serial Data Line)和SCL(Serial Clock Line)。数据在SDA线上以时钟脉冲同步的方式传输,而SCL线则提供这个同步时钟。通信过程中,主设备(通常是微控制器)控制时钟,并且可以作为发送方或接收方。从设备根据接收到的时钟信号响应数据。 在实验中,你需要设置微控制器(如Arduino或AVR)的IIC接口,编程以发送IIC起始条件、地址、命令和数据。IIC起始条件是当SCL为高时,SDA由高变低;结束条件则是SDA在SCL为高时由低变高。地址包括7位从设备地址和1位读/写位,读/写位决定是向从设备写入数据还是读取数据。 24C04的IIC地址通常为1010000x(x表示从设备的A0~A2引脚状态,取决于物理连接)。你可以编写代码向24C04写入数据,然后读取以验证写入是否成功。在Proteus中,你可以看到虚拟的IIC线路图,观察SDA和SCL的波形变化,帮助理解IIC通信的过程。 文件"IICѧϰ"可能包含有关IIC协议的理论知识,如时序图、数据传输格式等,而"IIC学习"可能是一份详细的实验指南,包括步骤、代码示例和注意事项。在实际操作中,你需要按照这些文件中的指导,将微控制器的IIC接口配置正确,并确保与24C04的通信无误。 通过这样的仿真实验,不仅可以加深对IIC协议的理解,还能熟悉Proteus这种强大的电子设计与仿真工具。它可以帮助你在没有实物硬件的情况下验证设计,减少实验成本,提高学习效率。同时,对于24C04这类常见IIC设备的操作,也会使你在实际项目中更加得心应手。
2024-07-11 11:56:21 1.57MB IIC proteus 24C04
1
(本资源完全免费) 2021年版北京科技大学计通学院数字逻辑全部实验,内容如下 1.流水灯 2.加法器 3.滚动学号 4.状态机 5.体重秤 6.大实验:流水线+电梯 包含全部代码,以及相关资料和参考报告 以上内容仅供参考,希望学弟学妹们能够从大学中收获自己想要的
2024-07-09 09:36:33 154.99MB 北京科技大学 数字逻辑
1
标题“LPC-ARM7-LED-串口实验-proteus仿真”涉及到的是基于ARM架构的LPC2138微控制器进行LED控制和串行通信的实践项目,结合了Proteus仿真软件来模拟电路运行。这个实验是学习嵌入式系统、微处理器编程以及硬件设计的一个好例子。 LPC2138是一款基于ARM7TDMI-S内核的微控制器,由NXP(前飞利浦半导体)制造。它拥有丰富的外设接口,包括UART(通用异步收发传输器),用于串行通信,以及GPIO(通用输入/输出)引脚,可用于控制LED灯的亮灭。在这个项目中,开发者将编写C或汇编语言代码来配置和操作这些硬件资源。 PLL(锁相环)初始化代码是设置微控制器工作频率的关键部分。LPC2138可以通过调整PLL的参数以提高内部时钟速度,从而提升系统的运行效率。正确的PLL配置可以确保微控制器的各个模块以期望的速度运行,比如UART和GPIO。 UART初始化涉及设置波特率、数据位、停止位、奇偶校验等参数,以确保与外部设备(如计算机或另一个微控制器)进行有效通信。在这个实验中,源码会包含设置UART的函数,以便发送简单数据。 然后,LED的控制是通过GPIO端口实现的。代码会包含对GPIO寄存器的操作,用以设置特定引脚为输出模式,并通过写入0或1来控制LED的亮灭。这通常是通过循环或条件语句来实现,以达到特定的闪烁效果。 Proteus是一个强大的电子设计自动化工具,可以模拟硬件电路,包括微控制器和外围设备。在这个实验中,LPC2138的电路图将在Proteus环境中搭建,而源码会在虚拟环境中运行,模拟LED灯的点亮和串口通信的过程。这为开发者提供了一个无需实际硬件就能测试代码的平台,降低了实验成本并提高了效率。 通过这个项目,学习者可以深入理解ARM微控制器的工作原理,掌握如何编写初始化代码,使用串口通信,以及如何通过软件控制硬件设备。同时,Proteus仿真的使用也能增强他们的硬件设计和调试技能。这个综合性的实验是嵌入式系统学习的重要组成部分,对于理解硬件和软件之间的交互具有重要意义。
2024-07-08 21:02:38 70KB ARM UART PROTEUS
1
针对煤矿井下"三机"自动化中的采煤机定位精度较低的问题,根据采煤机工作环境恶劣、空间封闭、干扰较多的特点,提出了一种基于捷联惯性导航(SINS)的采煤机位姿定位方法。该方法利用捷联惯性导航系统中的三轴加速度计和三轴陀螺仪实时测量采煤机的加速度和角速度信息,并根据四元数捷联惯导位姿解算方法解算出采煤机的实时位置和姿态信息,得到精确的采煤机运动轨迹,实现对采煤机的实时体定位。对定位平台进行仿真和利用综采工作面"三机"实验装置搭建采煤机捷联惯导定位实验平台进行实验,结果表明,采煤机捷联惯导定位系统能够准确跟踪基准轨迹,采煤机沿工作面方向运行20 m,位置姿态跟踪误差分别为0.5 m和0.7°,满足煤矿采煤机定位精度要求,该系统能够实现采煤机的实时精确定位。
1
哈工大计算机网络实验(含实验报告) HTTP 代理服务器的设计与实现 HTTP 分组收发实验 HTTP 分组转发实验 可靠数据传输协议——GBN协议的设计与实现 利用 Wireshark 进行协议分析 简单网络组建与配置
2024-07-07 14:56:34 4.74MB 网络 网络工具 计算机网络
1
1设计目标本项目的设计属于SDRAMBridge中的一个电路模块目的是为SDRAM访问的申请者提供一个任务队列管理器使得SDRAM访问申请者的任务申请和实际的与SDRAM的数据传输能够并行工作提高SD
2024-07-06 18:49:42 761KB 数字系统设计
1
主要用于多视角卫星影像的三维重建算法,资源共9个文件,其中8个文件分别对应八个压缩文件包,代表每个区域的影像,每个压缩包里对应着多视角卫星影像和RPC文本文件,第九个文件为机载激光雷达产生的真值影像文件,本数据为s2p算法的主要实验数据。数据整体情况:数据量整体较小,但覆盖的类型全,如低矮建筑,中高层建筑,高层建筑等,对卫星三维重建的鲁棒性要求较高,因此是做卫星三维重建的不二选择,目前很多相关论文都拿此进行实验和算法调整优化。
2024-07-06 16:40:42 994.39MB 数据集
1
实验五——单周期MIPS处理器的设计与实现1主要涵盖了MIPS处理器的基础知识,单周期处理器的设计方法以及如何通过增量方式实现这一处理器。该实验旨在帮助学生熟悉MIPS处理器的常用指令集,掌握单周期处理器的数据通路和控制单元设计,以及进行功能验证。 MIPS处理器是一种流行的精简指令集计算机(RISC)架构,具有简洁高效的特点。在实验中,学生需要掌握至少10条MIPS指令,例如 lw(load word,从内存加载数据到寄存器)、sw(store word,将寄存器数据存储到内存)、lui(load upper immediate,加载立即数的高16位)、ori(or immediate,或操作立即数)、addiu(add immediate unsigned,无符号加立即数)、addu(add unsigned,无符号加法)、slt(set less than,设置小于标志)、beq(branch if equal,等于则跳转)、bne(branch if not equal,不等于则跳转)和j(jump,无条件跳转)。 单周期处理器设计中,数据通路是处理器的核心部分,它处理指令和数据,包括ALU(算术逻辑单元)、寄存器、存储器访问等。控制单元则负责解读当前指令,生成必要的控制信号以驱动数据通路。在这个实验中,数据通路采用32位宽度,以匹配MIPS的32位指令集。寄存器文件由32个32位寄存器构成,支持异步读/同步写操作。指令存储器和数据存储器分别使用ROM和RAM,前者异步读取指令,后者则采用异步读/同步写模式。 实验环境包括Windows 10或Ubuntu 16.04操作系统,以及Xilinx Vivado 2018.2开发工具,利用FPGA(现场可编程门阵列)硬件云平台进行实际实现。在设计过程中,学生需要按照增量方式进行,这意味着他们将逐步完善处理器的设计,从基础组件开始,如程序计数器(PC)、寄存器文件、指令存储器和数据存储器,然后添加必要的组合逻辑来实现指令解码和执行。 实验内容包括设计一个名为MiniMIPS32的处理器,它具备32位数据通路,小端模式,支持上述10条MIPS指令。处理器的寄存器文件遵循异步读/同步写模式,且采用哈佛结构,即独立的指令存储器和数据存储器,指令存储器用ROM实现,数据存储器用RAM实现。设计的顶层模块MiniMIPS32_SYS连接了各个子模块,包括输入输出端口,以实现与外部存储器的通信。 这个实验是一个全面的实践项目,涵盖了处理器设计的多个关键方面,包括硬件描述语言(如SystemVerilog HDL)、微体系结构和逻辑控制,旨在深化学生对MIPS处理器工作原理的理解,并提升他们在FPGA开发中的技能。通过这个实验,学生将能够亲手构建一个基本的MIPS处理器,并通过测试用例验证其正确性。
2024-07-06 15:02:50 652KB 测试用例 操作系统 windows ubuntu
1
在本实验中,我们将深入探讨电商网站前端页面的内容编写,这是国开电大《WEB开发基础》课程形考任务1的重要部分,旨在帮助学生掌握基本的网页开发技能。实验1的核心目标是创建一个功能完善的电商网站前端界面,这涉及到HTML、CSS以及可能的JavaScript等前端技术的运用。 一、HTML结构构建 HTML(HyperText Markup Language)是网页内容的基础,用于定义网页的结构。在电商网站中,我们需要创建如下主要元素: 1. 页面头部:包括标题、元信息和链接资源(如CSS样式表和JavaScript文件)。 2. 导航栏:提供网站各个部分的快速访问链接。 3. 主体区域:展示商品分类、推荐产品、搜索功能等。 4. 侧边栏:可以包含购物车、用户登录注册、广告等辅助信息。 5. 底部:包含版权信息、联系方式和网站地图等。 二、CSS样式设计 CSS(Cascading Style Sheets)用于控制网页的布局和视觉表现。在电商网站设计中,我们需要注意以下几点: 1. 响应式设计:确保页面在不同设备上都能良好显示。 2. 色彩搭配:选择符合品牌形象且易于阅读的颜色方案。 3. 字体选择:合理设置字体大小、行高和字间距,提高可读性。 4. 布局管理:使用网格系统或Flexbox、Grid布局,实现灵活多变的页面布局。 5. 图片优化:使用适当的图片格式,控制文件大小,提高加载速度。 三、JavaScript交互功能 为了提升用户体验,前端开发通常会用到JavaScript来实现动态效果和交互功能,例如: 1. 搜索功能:实时反馈搜索结果,提供筛选和排序选项。 2. 购物车:添加、删除商品,计算总价,显示购物车状态。 3. 滚动加载:当用户滚动到页面底部时,自动加载更多内容。 4. 表单验证:在用户提交信息前进行数据有效性检查。 5. 动画效果:如滑动导航、过渡效果等,增强视觉吸引力。 四、SEO优化 为了提高搜索引擎的可见性,前端开发也需要考虑SEO(Search Engine Optimization): 1. 元标签:如title、description、keywords,帮助搜索引擎理解页面内容。 2. URL结构:清晰、简洁的URL有利于爬虫抓取和用户理解。 3. 内容可爬性:确保文本内容不被CSS或JavaScript隐藏。 4. 加速移动页面(AMP):对于移动用户,使用AMP技术可提升加载速度。 通过本实验,学生将能够运用HTML、CSS和JavaScript构建一个基本的电商网站前端页面,同时了解和实践网页设计的最佳实践,包括响应式设计、交互功能实现和SEO优化。这将为他们进一步学习更复杂的前端框架和技术奠定坚实基础。
2024-07-05 22:03:51 1.29MB
1