本例提取了猫狗大战数据集中的部分数据做数据集,演示tensorflow2.X版本如何使用Keras实现图像分类,分类的模型使用ResNet50。本文实现的算法有一下几个特点: 1、自定义了图片加载方式,更加灵活高效,不用将图片一次性加载到内存中,节省内存,适合大规模数据集。 2、加载模型的预训练权重,训练时间更短。 3、数据增强选用albumentations。
2022-01-23 09:15:29 936.29MB 分类 big data 数据挖掘
本例提取了猫狗大战数据集中的部分数据做数据集,演示tensorflow2.0以上的版本如何使用Keras实现图像分类,分类的模型使用DenseNet121。本文实现的算法有一下几个特点: 1、自定义了图片加载方式,更加灵活高效,节省内存 2、加载模型的预训练权重,训练时间更短。 3、数据增强选用albumentations。 详见:https://wanghao.blog.csdn.net/article/details/122607363?spm=1001.2014.3001.5502
2022-01-20 21:08:39 695.31MB 分类 big data 数据挖掘
解压密码:123 安装说明:https://blog.csdn.net/hongfu951/article/details/118517942 SPSS统计2013是一个令人印象深刻和领先的统计软件应用程序的商业,政府,学术和研究的目的。 它将为您提供一些非常先进的统计分析和预测工具。 这个应用程序提供了综合的实用程序集,可以一起工作,以分析大数据集,检测趋势,以及生成准确的预测。 SPSS统计2013是专门为具有先进的统计方法和研究工具知识的分析师和统计程序员开发的,以及他们在做出更好的决策方面的使用。 包中包含的数据编辑器类似于任何电子表格应用程序,它允许您手动输入数据或从Cognos BI、Lotus、dBase、Excel、文本或以选项卡分隔的文件导入数据库。 这个应用程序配备了先进的统计分析工具和数据管理工具,可以帮助您处理大型数据集。SPSS Statistics 2013支持描述性统计、线性和广义模型处理、回归以及曲线估计。 它还允许趋势预测,这将使您能够创建模型和运行光谱分析和特征质量控制,数据模拟能力和ROC曲线分析。 总之,IBM SPSS统计2013是一个令人印象深刻的应用程序,用于商业,政府,学术和研究目的。
MASR中文语音识别模型(大数据集训练的),源码地址:https://github.com/yeyupiaoling/MASR
2022-01-10 16:11:05 546.58MB 语音识别 pytorch asr masr
该GPS轨迹数据集由182位用户在(微软亚洲研究院)Geolife项目中收集,历时超过五年(2007年4月至2012年8月)。 该数据集的GPS轨迹由一系列时间戳点表示,每个点都有其中包含纬度,经度和海拔高度的信息。 该数据集包含17,621个轨迹,总距离为1,292,951公里,总持续时间为50,176小时。 这些轨迹由不同的GPS记录仪和GPS手机记录,并具有各种采样率。 91.5%的轨迹以密集表示记录,例如 每1~5每秒秒或每5~10米。 该数据集记录了广泛的用户户外活动,不仅包括回家和上班等生活习惯还有一些娱乐和体育活动,如购物,观光,餐饮,远足和骑自行车。 这条轨迹数据集可用于许多研究领域,例如移动模式挖掘,用户活动识别,基于位置的社交网络,位置隐私和位置建议。 虽然这个数据集分布在中国30多个城市,甚至在美国和欧洲的一些城市,大部分数据都是在中国北京创建的。 图1绘制了该数据集在北京的分布(热图)。该位于加热条右侧的数字表示某个位置产生的点数。
2021-12-28 11:27:10 200MB GPS 轨迹 大数据
1
PPASR中文语音识别(最终级)模型(大数据集训练的),源码地址:https://github.com/yeyupiaoling/PPASR
如果你的电脑内存较小那么想在本地做一些事情是很有局限性的(哭丧脸),比如想拿一个kaggle上面的竞赛来练练手,你会发现多数训练数据集都是大几G或者几十G的,自己那小破电脑根本跑不起来。行,你有8000w条样本你牛逼,我就取400w条出来跑跑总行了吧(狡滑脸)。 下图是2015年kaggle上一个CTR预估比赛的数据集: 看到train了吧,原始数据集6个G,特征工程后得多大?那我就取400w出来train。为了节省时间和完整介绍分批读入数据的功能,这里以test数据集为例演示。其实就是使用pandas读取数据集时加入参数chunksize。 可以通过设置chunksize大小分批读入,也
2021-11-26 12:53:32 82KB AND AS pan
1
世界人口分析 使用国家和大洲的两个大数据集,使用Tableau进行了一些分析和仪表板/故事报告,并得出了一些关键的见解和答案。
2021-11-22 16:30:06 1.42MB
1
http://megaface.cs.washington.edu/dataset/download/content/MegaFace_dataset.tar.gz 下载网址: 65G
2021-11-16 14:44:10 2KB 人脸 大数据集
1
基于Tensorflow 2.x实现的声纹识别大数据集预测模型和预训练模型,源码地址:https://github.com/yeyupiaoling/VoiceprintRecognition-Tensorflow
2021-10-25 16:09:14 184.92MB tensorflow 声纹识别 中文声纹识别