1. 数据集的获取。 使用SCIKIT-LEARN自带的数据读取函数load_wine(),获取原始葡萄酒数据集。 2. 获取数据集内,样本数目、类别数目,各类样本数目 3. 样本集基本信息获取: (1)获取并输出该数据集的类别信息(含:类别数目,类别名称); (2)获取数据集的特征数目、特征名称;样本数目、各类别样本数目。 4.样本集的描述统计,获取并输出显示样本集内每个特征的描述性统计指标 包括:均值、标准差、最小值、最大值、第1四分位、第2四分位、第3四分位。 5. 认识每一种特征的分布情况 (1)估计每个特征分布的斜度 (2)以单变量直方图形式可视化样本集关于每个特征取值的分布情况 (3)以单变量密度曲线方式可视化每个特征的分布 6. 了解任意一对特征之间的线性相关程度: (1)估计任意一对特征之间的相关系数,得到相关系数矩阵,并进行可视化; (2)绘制散点矩阵,借助散点矩阵,理解两特征之间的线性相关性 7. 基于箱式图的各特征取值分布的可视化,理解各特征关于不同类别样本的类鉴别特性:针对每个特征,基于原始样本集及其类别信息,在相同的图形窗口,绘制箱型图
2022-04-27 16:05:36 5KB sklearn 源码软件 python 人工智能
1
一个简单的量化研究框架,具备基本的数据获取、因子分析、机器学习、回测及结果分析功能。
2022-04-27 11:05:50 49.84MB 机器学习 文档资料 人工智能
通过 MATLAB Web 浏览器识别和交互选择表格,并将数据作为元胞数组导入 MATLAB。
2022-04-12 09:25:35 28KB matlab
1
众所周知,JAVA语言虽然在TCP/UDP传输方面给予了良好的定义,但对于网络层以下的控制,却是无能为力的。JPCAP扩展包弥补了这一点。    JPCAP实际上并非一个真正去实现对数据链路层的控制,而是一个中间件,JPCAP调用wincap/libpcap,而给JAVA语言提供一个公共 的接口,从而实现了平台无关性。在官方网站上声明,JPCAP支持FreeBSD 3.x, Linux RedHat 6.1, Fedora Core 4, Solaris, and Microsoft Windows 2000/XP等系统。
2022-04-07 17:00:48 74KB java jpcap
1
基于webservice的C#中国股票实时数据获取源代码
2022-03-11 16:52:45 314KB C# 股票 实时数据 源代码
1
Java编写,获取CN-DBpedia中文三元组数据,将最终结果保存到txt文件中,需要准备entity.txt文件,文件中一行对应一个实体。
2022-02-20 10:44:42 3KB Java 三元组 知识工厂 数据获取
1
三维可视化系统是智慧矿山建设的空间信息基础支撑平台(4DGIS)的有机组成部分。首先介绍了三维可视化发展历程;其次,结合当前三维可视化技术发展趋势,从三维数据获取与建模、三维软硬件技术、三维专业应用3个层次开展全方位的技术归纳与总结。重点阐述了透明工作面勘探技术及三维建模方法,介绍了三维巷道数据获取的激光LiDAR、全景图像和全景视频、立体视觉和深度相机等新技术,以及WebGL、云渲染等前沿网络可视化开发技术,探讨了虚拟现实、增强现实硬件技术进展。在应用方面,剖析了三维可视化系统在矿山领域应用的难点问题,指出一个通用的三维可视化或者三维地理信息系统是远远不够的,三维可视化系统应该从可视化展示局限性,逐渐深入到透明化勘探、智能化采矿设计、智慧通风、安全生产综合管理、工业智能管控、地表环境监测、灾害事故反演、虚拟仿真培训等领域形成各具特色的专题应用。此外,还介绍了最新的CityGML、Geo3DML、三维瓦片等国际三维数据标准。
1
selenium爬虫学习——CNKI内容数据获取
2022-01-28 19:03:14 6KB 爬虫 selenium python 测试工具
自己写的Python抓取妹子图片网站,爬虫源码 特点: 用的正则表达式写的,运行速度比bs快! 如果换地址,则需要修改正则表达式。 特色: 可以按照需求指定下载页面的范围; 对于有地址没有图片的网页进行容错处理; 对于多次获取返回状态301进行了处理; 注意: 运行需在python3上,需要安装对应的库和模块 警告:只可用于学习Python数据挖掘/数据获取/爬虫用,源码里面涉及的网站仅作学习使用!
2021-12-29 11:51:47 4KB Python 数据获取 数据挖掘 爬虫
1