一、前情介绍 在之前对yolov3的学习中,有时候发现小样本数据集容易出现过拟合或者泛化能力不强的问题,在对这一问题提出的不同解决方法进行了摸索和尝试,发现提高数据集样本容量是一个比较直接和简单粗暴的方法,以下纪录这一实验方法。 二、环境 直接交代环境,都是相对较简单,在这里博主没遇到过坑 os numpy PIL imgaug 三、代码 import xml.etree.ElementTree as ET import os import numpy as np from PIL import Image import shutil import imgaug as ia from imga
2021-09-17 14:30:18 204KB 数据 样本
1
msyql 员工员工样本数据库, 由于官方得下载路径速度太慢, 本人做了一次搬运 有关法律信息,请参阅《法律声明》。 有关使用MySQL的帮助,请访问 MySQL论坛,您可以在此与其他MySQL用户讨论您的问题。 本资源仅供个人学习,使用, 不得用于其他非法行径,即传播, 本人不承担任何法律责任
2021-09-11 20:32:58 109.22MB mysql
1
机器学习算法之KNN算法 样本数据 具体操作方法参考 https://www.php3.cn/a/313.html
2021-09-05 15:20:24 1.62MB 机器学习 KNN算法
1
博客https://clouddaidai.blog.csdn.net/article/details/119926474 所需样本数据
2021-08-26 14:12:01 30KB knn算法样本数据
1
行业资料-交通装置-一种基于造船生产设计过程的设备样本数据管理系统.zip
minitab18 入门样本数据
2021-08-24 18:33:23 90KB minitab18
1
【知识准备】 探索性数据分析的基本原理和方法;Python语言及相关包的运用;Pandas;Numpy;Matplotlib;Seaborn;Scikit-Leart。 【实训要求】 1、观察样本数据的结构和数据特征; 2、读取样本数据,观察样本数据结构和头尾各10行数据; 3、对样本数据进行分析,找出业务数据中的分布规律; 4、用可视化方法对分析结果进行展示。 5、观察并找出每个特征的样本数据的缺失值和异常值等并提出解决办法; 6、对样本数据进行预处理; 7、采集样本数据存入HBase数据库(选)。 【实训内容】 任务2-1 1、数据源:“sodadata”文件夹下“联通数据_Sample”。 2、项目数据集: 表一结果_Sample_1000条.csv 表二结果_Sample_1000条.csv 3、针对表一样本数据: (1)分析并展示不同时间段采样的基站服务区内移动用户的活跃度分布; (2)分析并展示服务区内移动用户工作时间和休息时间的活跃度分布,筛选出当地居民和外来移动用户; (3)分析用户活动规律,根据其通信特点进行分类。(选做) 4、针对表二样本数据: (1)分析并展示样本数据中年龄、性别、终端品牌等各类数据的分布规律; (2)分析缺失和异常数据,提出处理预处理方案; (3)筛选高价值重点用户(提示:从业务量或消费等方面思考); (4)如果表一和表二从相同的服务区采集,请思考并提出你的进一步分析方案和商业营销方案。(选做) 5、用Jupyter Notebook根据实训要求编写程序和文档,最终结果打印输出为PDF文档;
1
Anderson-Darling 检验(Anderson 和 Darling,1952 年)用于测试数据样本是否来自特定分布。 它是对 Kolmogorov-Smirnov (KS) 检验的修改,并且比 KS 检验赋予尾部更多的权重。 KS 测试是无分布的,因为临界值不依赖于被测试的特定分布。 Anderson-Darling 检验在计算临界值时使用特定分布。 这样做的优点是允许进行更灵敏的测试,缺点是必须为每个分布计算临界值。 Anderson-Darling 检验仅适用于少数特定分布。 测试计算如下: AD2 = 积分{[F_o(x)-F_t(x)]^2/[F_t(x)(1-F_t(x)0]}dF_t(x) AD2a = AD2*a 请注意,对于给定的分布,Anderson-Darling 统计量可以乘以常数 a(通常取决于样本大小 n)。 这些常数在 Stephens (1
2021-08-21 13:01:18 4KB matlab
1
Anderson-Darling 检验(Anderson 和 Darling,1952 年)用于测试数据样本是否来自特定分布。 它是对Kolmogorov-Smirnov(KS)测试的改进,与KS测试相比,赋予尾巴更大的重量。 KS 测试是无分布的,因为临界值不依赖于被测试的特定分布。 Anderson-Darling 检验在计算临界值时使用特定分布。 这样做的优点是允许进行更灵敏的测试,缺点是必须为每个分布计算临界值。 Anderson-Darling 检验仅适用于少数特定分布。 测试计算如下: AD2 = 积分{[F_o(x)-F_t(x)]^2/[F_t(x)(1-F_t(x)0]}dF_t(x) AD2a = AD2*a 注意,对于给定的分布,可以将Anderson-Darling统计量乘以常数a(通常取决于样本大小n)。 这些常数在 Stephens (1974, 19
2021-08-08 17:22:35 4KB matlab
1
Python从零实现 K-mean 和K-中心点聚类算法的样本数据
2021-08-06 20:48:48 4KB kmeans算法
1