训练集数据为【105*35像素的jpg图片+对应正确验证码csv文件】。共两万个测试数据,验证码为 大小写字母+数字 的组合,图片名称对应csv文件的ID栏,train文件+train_label文件。test是测试图片。
2022-11-18 14:30:54 40.86MB Captcha验证码 深度学习 训练集
1
推荐系统:百万首歌曲数据集的推荐系统
1
Income数据集是通过Education预测Income。该数据集可用于单输出单输出的训练和测试环境。
2022-11-15 22:25:31 1KB dataset
1
这是包含1000只猫(Cat)的数据集,均为图片格式(命名以.jpg结尾)
非官方的Lip2Wav数据集预处理脚本 数据集是大规模的语音合成语音数据集。 该脚本允许下载和预处理数据集的各个部分,并且运行速度更快。 例如,要仅运行dl测试,只需为以下所有步骤指定--splits test --speakers dl 。 要求 该脚本需要ffmpeg ,并已在Ubuntu 20.04.1 LTS上进行了测试。 安装 pip install git+https://github.com/enhuiz/lip2wav-dataset.git 脚步 1.从YouTube下载原始视频 在一个空文件夹下,运行以下命令: lip2wav-dataset download --splits test --speakers dl 此步骤将自动下载指定的扬声器并进行分割(即,训练/验证/测试)。 如果未指定,则将下载所有扬声器/分离器。 2.将原始视频切成间隔 lip2wav-dat
2022-11-15 16:34:08 24KB Python
1
汉语词典 总计收录21104个汉字和符号。 符号包括标点符号和数学符号等 full.json为完整数据,包含细分: word , word pinyin ,带音调的拼音 pinyin2 ,无音调的拼音 strokes , strokes数 radical ,偏旁 url ,该字所在页面 html ,原页面详情部分html detail ,详情部分文本 full.{start}-{end}.json为分片后的数据,方便git diff slim.json删除了detail , url和html细分 words.json只保留汉字 pinyin-alias.json带音调和不带音调的单韵母的对照表 个人使用,禁止商用。
2022-11-12 11:06:31 33.36MB dataset chinese chinese-characters chinese-words
1
dataset_coco.json+dataset_flickr8k.json+dataset_flickr30k.json
2022-11-04 10:00:36 35.04MB imagecaption
1
matlab精度检验代码1.网络 审查: 很棒的项目 cosmiq Radiant MLHub开放库,用于地球观测机器学习。 [] 2.图像分类 数据集 每班图片 场景类 图片总数 空间分辨率(m) 图片大小 年 UC Merced土地使用 100 21岁 2100 0.3 256×256 2010年 WHU-RS19 〜50 19 1005 最高0.5 600×600 2010年 RSSCN7 400 7 2800 -- 400×400 2015年 RSC11 〜100 11 1232 0.2 512×512 2016年 西里湖 200 12 2400 2个 200×200 2016年 援助 200〜400 30 10000 0.5〜0.8 600×600 2017年 欧洲卫星 2000 2500 3000 10 27000 -- 64×64 2017年 NWPU-RESISC45 700 45 31500 〜30至0.2 256×256 2017年 模式网 800 38 30400 0.062〜4.693 256×256 2017年 RSI-CB RSI-CB128(〜800) R
2022-10-29 17:57:27 37KB 系统开源
1
自述文件 这些python程序用于从Bosch motor生成和预处理3D点云。 他们可以借助在自动导出电动机的CAD模型。 之后,它们可以在的帮助下用于生成和标记3D点云数据。 准备中 如果已经下载了Blensor: 将文件夹utils_haodong放入路径:''Blensor-1.0.18-Blender-2.79-Winx64 \ 2.79 \ scripts \ addons'' 开始使用 创建Motor的CAD模型 运行 。 在工作空间中打开一个文本编辑器,并加载文件 。 保存CAD模型的路径可以在第105行至第108行中定义。 def main() : Upper_Bolt_Nummber = ['1', '2', '3'] save_dir_TypeA1 = "F:\KIT\Masterarbeit\Dateset\Test\TestforScript\T
2022-10-20 20:07:42 11KB Python
1
使用Python库研究数据集 在这个项目中,我分析了一个数据集,然后传达了关于它的发现。 我使用Python库NumPy,pandas和Matplotlib进行了分析。 我选择进行分析的数据集包含有关从电影数据库(TMDb)收集的10,000部电影的信息,包括用户评分和收入。 我分析了此数据集,以回答2个问题:1)哪些电影通常收入最高? 2)每年哪种类型最受欢迎? 在项目的“数据整理”部分,我加载了数据,检查其清洁度,然后修剪并清理数据集以进行分析。 在该项目的“探索性数据分析”部分中,我使用了内置的函数库来描述数据并对其进行可视化,最后总结了我的发现和结论。
2022-10-19 16:11:14 3.76MB HTML
1