农作物病害分类图像数据集,训练图像总数为32768张,验证图像总数为4992张
2022-04-27 20:07:18 140B 分类 源码软件 数据挖掘 人工智能
目前,Transformer已经霸榜计算机视觉各种任务,但是缺点也很明显就是参数量太大无法用在移动设备,为了解决这个问题,Apple的科学家们将CNN和VIT的优势结合起来,提出了一个轻量级的视觉网络模型mobileViT。 根据论文中给出的Top-1成绩的对比结果,我们可以得出,xs模型参数量比经典的MobileNetV3小,但是精度却提高了7.4%,标准的S模型比ResNet-101,还高一些,但是参数量也只有ResNet-101的九分之一。这样的成绩可谓逆天了! 本文从实战的角度出发,带领大家感受一下mobileViT,我们还是使用以前的植物分类数据集,模型采用MobileViT-S。
2022-04-27 20:07:17 945.36MB 分类 源码软件 数据挖掘 人工智能
随着互联网技术的快速发展,互联网上的文本数据变得越来越多,传统的人工文本类 别划分方法已经无法应对当前的数据量,自动文本分类技术成为研究的热点。作为文本挖 掘技术的主要分支,文本分类技术可以有效解决大数据发展下的文本自动分类需求。特征 选择和文本分类算法是文本分类技术的两个关键部分,本文主要针对这两个部分进行研究。 在特征选择部分,本文提出一种基于卡方统计量(CHI)和互信息(MI)的混合特征 选择方法(CHMI),该方法首先针对卡方统计量方法对低频词敏感的缺点,引入词频因子 进行改进,然后使用调节参数改善互信息方法对类别敏感的不足,最终结合改进后的两种 方法,得到对低频词和类别均有较好处理效果的混合特征选择方法。实验结果表明,与传 统的卡方统计量方法和互信息方法相比,本文方法在支持向量机、朴素贝叶斯和K最近邻 分类器上,均可以有效提高文本分类的准确率。 在文本分类算法部分,分类器采用支持向量机,支持向量机的核心是核函数,本文提 出一种基于多项式核函数和高斯核函数的混合核函数。该核函数具有多项式核函数和高斯 核函数的优点,既具有多项式核函数能够提取整体特征的能力,又利用高斯核函数对局部
2022-04-27 20:07:01 2.93MB 机器学习 分类 人工智能 数据挖掘
商业智能时代已经全面到来,分析型人才的岗位数量在就业市场中呈现井喷式增长。无论是从事产品研发的工程师,还是从事产品推广的市场人员、人力资源和财务会计人员,都需要掌握数据分析技术,否则很有可能被人工智能替代。 本书包括 18 章,涉及使用 R 语言做数据分析和数据挖掘的主要分析方法。其中,第 1、 2 章为数据分析方法概述,第 3 章为 R 语言编程基础,第 4 章到第 8 章为统计学习方法,第 9 章到第 16 章为数据挖掘方法,第 17 章为特征工程,第 18 章为 R 文本挖掘。每章都根据所涉及的知识点的不同,选取了实用的案例,并为读者准备了相应的练习题。 本书作为 CDA 数据分析师系列丛书中《如虎添翼!数据处理的 SPSS 和 SAS EG 实现(第 2 版)》和《胸有成竹!数据分析的 SPSS 和 SAS EG 进阶(第 2 版)》的姊妹篇,将前两本书的内容进行整合并做了重大拓展,而且秉承了该系列丛书的特点:内容精练、重点突出、示例丰富、语言通俗。可以作为广大从业人员自学商业数据分析的读物,适合大中专院校师生学习和阅读,同时也可以作为高等院校商科、社会科学及相关培训机构的教材
2022-04-27 16:41:56 319KB 数据挖掘 人工智能 r语言 学习
1
苹果叶部病害图像数据集包含5类常见的苹果叶部病害:花叶病、锈病、灰斑病、斑点落叶病、褐斑病。共有20000余张图像
2022-04-27 16:05:56 839.41MB 分类 数据挖掘 人工智能 机器学习
东北大学数据科学基础(Matlab) .md markdown笔记(带作业&lab&期末作业答案) 方便学弟学妹啰
2022-04-27 16:05:36 7.01MB matlab 数据挖掘 东北大学
1
1.数据集的获取。 使用SCIKIT-LEARN的自带的鸢尾花数据集,获取该数据集150个样本的后两个特征及相应类别标签。 2.数据集的最小包围盒的获取,以及数据集的划分。 (1)获取原始二维空间中150个样本的最小包围矩形[x1_min, x1_max]*[x2_min,x2_max],并记录有关参数值。 (2)将数据集按照类别标签分层随机打乱,基于hold-out法,构建训练集(80%)与测试集(20%) 3. 模型的学习。 利用训练集,学习两种复杂程度不同的CART分类树,可视化两个分类树的学习结果。 4. 基于测试集的分类树的评价。 (1)结合测试集各样本的类别预测结果及真实类别答案,生成混淆矩阵,并可视化混淆矩阵 (2)基于混淆矩阵,估计每个类别的查准率、查全率、F1值,以及宏查准率、宏查全率、宏F1值;估计总体预测正确率. 5. 分类树的使用。 (1)在原始二维空间的矩形区域[x1_min-1, x1_max+1]*[x2_min-1,x2_max+1]内,分别在水平、垂直方向以0.02为间隔,细分生成离散格子点。 (2)分别以每个格子点作为一个待决策样本,对其分类
2022-04-27 16:05:35 5KB 分类 sklearn 数据挖掘 人工智能
1
基于机器学习的新闻标题分类系统
2022-04-27 11:05:45 10MB 机器学习 分类 人工智能 数据挖掘
采用灰狼算法(GWO)优化BP回归预测matlab2019,内置数据集可以直接运行,全中文注释
2022-04-27 09:15:38 20KB 算法 回归 文档资料 数据挖掘
林业有害生物分类图像数据集(99种生物,共近2000张图片)黑蚱蝉,蟪蛄,蒙古寒蝉等99种生物,共近2000张图片,各生物种类数据数量基本平衡
2022-04-27 09:15:17 104.31MB 分类 数据挖掘 人工智能 机器学习