本小组研究的课题是基于深度学习的图像识别,最终实现的是对海量图片数据的学习和准确的识别,不仅如此,我们测试了几种不同的分类模型,并比较预测结果,计算预测准确率,对预测方法进行优化,希望得到一种最高效的预测方法,从而实现真正的机器智能化识别。 本小组课设主要基于python开发环境下的scikit-learn标准库以及PIL图像处理库,并采用matplotlib实现最终结果的比对,PIL库用于图像的特征值批量读取,scikit-learn标准库用于分类模型的构建,matplotlib则用于显示最终结果。
2023-03-03 15:35:15 1.89MB 图像处理 图像识别 深度学习 神经网络
1
图像描述是一个有挑战性的人工智能问题,涉及为给定图像生成文本描述。字幕生成是一个有挑战性的人工智能问题,涉及为给定图像生成文本描述。一般图像描述或字幕生成需要使用计算机视觉方法来了解图像内容,也需要自然语言处理模型将对图像的理解转换成正确顺序的文字。近期,深度学习方法在该问题的多个示例上获得了顶尖结果。深度学习方法在字幕生成问题上展现了顶尖的结果。这些方法最令人印象深刻的地方:给定一个图像,我们无需复杂的数据准备和特殊设计的流程,就可以使用端到端的方式预测字幕。本教程将介绍如何从头开发能生成图像字幕的深度学习模型。完成本教程,你将学会:该教程共分为6部分:1.图像和字幕数据集2.准备图像数据3
1
该系统实现了基于深度框架的语音识别中的声学模型和语言模型建模,其中声学模型包括CNN-CTC、GRU-CTC、CNN-RNN-CTC,语言模型包含transformer、CBHG,数据集包含stc、primewords、Aishell、thchs30四个数据集。 本项目现已训练一个迷你的语音识别系统,将项目下载到本地上,下载 thchs 数据集并解压至 data,运行 test.py,不出意外能够进行识别,结果如下: the 0 th example. 文本结果: lv4 shi4 yang2 chun1 yan1 jing3 da4 kuai4 wen2 zhang1 de di3 se4 si4 yue4 de lin2 luan2 geng4 shi4 lv4 de2 xian1 huo2 xiu4 mei4 shi1 yi4 ang4 ran2 原文结果: lv4 shi4 yang2 chun1 yan1 jing3 da4 kuai4 wen2 zhang1 de di3 se4 si4 yue4 de lin2 luan2 geng4 shi4 lv4 de2 xi
2023-03-02 18:14:02 108.36MB 语音识别 深度学习 语音 识别
1
Python基于深度学习的舌象诊断系统源码.zip
2023-03-02 17:23:17 42.67MB python 深度学习
1
基于深度学习resnet网络开发的花卉分类识别系统,包含5种类别的花卉(玫瑰、向日葵、紫罗兰等),包含训练文件,也可以自己训练。可以单张图片识别也可多张一起识别,并开发了gui系统界面。在readme文件中做了说明。(有没有GPU均可运行)
2023-03-02 16:51:08 152.7MB 深度学习 resnet 分类算法 花卉分类
1
Linear algebra and its applications 麻省理工 线性代数公开课教材 可以配合视屏使用
2023-03-02 15:55:49 13MB 线性代数 机器学习 深度学习 数学
1
深度学习方法及应用——深度学习和语音识别领域专家、微软研究院邓力博士和俞栋博士原著.rar 深度学习方法及应用——深度学习和语音识别领域专家、微软研究院邓力博士和俞栋博士原著.rar 深度学习方法及应用——深度学习和语音识别领域专家、微软研究院邓力博士和俞栋博士原著.rar
2023-03-01 16:30:51 19.68MB 深度学习
1
压缩包包含 1:CIFAR10原始数据集 2:CIFAR10转化为图片后的格式(PNG),分为train和test的两个文件夹,每个文件夹下有10个类别 CIFAR10数据集介绍:CIFAR-10 是由 Hinton 的学生 Alex Krizhevsky 和 Ilya Sutskever 整理的一个用于识别普适物体的小型数据集。一共包含 10 个类别的 RGB 彩色图 片:飞机( a叩lane )、汽车( automobile )、鸟类( bird )、猫( cat )、鹿( deer )、狗( dog )、蛙类( frog )、马( horse )、船( ship )和卡车( truck )。图片的尺寸为 32×32 ,数据集中一共有 50000 张训练圄片和 10000 张测试图片
2023-03-01 16:30:02 300.77MB 人工智能 数据集 深度学习 神经网络
1
AlexNet模型是Hinton的学生Alex Krizhevsky在2012年提出来的。AlexNet包含了几个比较新的技术点,也首次在CNN中成功应用了ReLU、Dropout和LRN等Trick。 AlexNet主要使用的新技术点如下: (1)成功使用ReLU作为CNN的激活函数,并验证其效果在较深的网络超过了sigmoid,解决了sigmoid在网络较深时的梯度弥散问题。 (2)训练时使用dropout随机忽略一部分神经元,以避免过拟合,主要是最后几个全连接层使用了dropout。 (3)在CNN中使用重叠的最大池化,避免平均池化的模糊化效果。并且提出让步长比池化核的尺寸小,这样池化层的输出之间会有重叠和覆盖,提升了特征的丰富性。 (4)提出了LRN层,对局部的神经元活动创建竞争机制,使其中响应比较大的值变得更大,增强了模型的泛化能力。 (5)使用CUDA加速深度卷积网络的训练,利用GPU强大的并行计算能力,处理神经网络训练时大量的矩阵运算。 (6)数据增强,大大减轻过拟合,提升泛化能力。
2023-03-01 15:22:13 6KB TensorFlow AlexNet模型 深度学习
1
pytorch深度学习框架虽然在一些方面上不如tensorflow,但是具备自己特有的优势,本代码是深度学习和pytorch之间的一些例程,以供学习~
2023-03-01 15:13:51 29.97MB pytorch python 深度学习
1