数据集提取器 将pcaps转换为json和csv文件 我们解析每个流,并创建一个包含4个文件的文件夹: flow.pcap-双流,由5个元组确定 flow_info.json-具有元数据,例如端口,ips,数据包输入/输出,字节输入/输出和扩展... flow_labels.json-应用程序,类别,加密协议和扩展... time_series.csv-pkt_time,pkt_relative_time,pkt_size,pkt_direction 此外,我们创建一个index.csv,其中包含来自json文件的元数据,因此非常容易过滤和选择特定流。 索引由于大小而未上载,但请参见read_index.ipynb以获取静态信息 将json&csv转换为流图片并另存为npy文件 FlowPic方向 双向流 上游流量 下游流量 修整基于时间:我们从每个流的X秒开始获取数据包 图片尺寸
2023-02-11 01:22:47 32KB Python
1
百度迁徙规模数据 爬取数据集(包含迁入和迁出) 包含全国所有地级市 基于 Python爬取 数据集格式为 xlsx 注意:本资源不包含代码!!!
2023-02-10 16:39:42 4.43MB 百度迁徙 数据集
1
基于pytorch的垃圾分类,带训练模型和数据集的下载链接! 多达200类别-垃圾分类! 附带5种先进的图像分类网络! 代码支持知识蒸馏,里面有详细的教程! 代码里面还有50+种模型选择,支持对比实验,每个模型都支持Imagenet预训练权重,详细请看代码里面的Readme!!
2023-02-10 12:21:40 3.46MB 图像分类 垃圾分类 pytorch
1
SMP2020微博情绪分类技术评测数据集 本次技术评测使用的标注数据集由哈尔滨工业大学社会计算与信息检索研究中心提供,原始数据源于新浪微博,由微热点大数据研究院提供,数据集分为两部分。     第一部分为通用微博数据集,该数据集内的微博内容是随机获取到微博内容,不针对特定的话题,覆盖的范围较广。     第二部分为疫情微博数据集,该数据集内的微博内容是在疫情期间使用相关关键字筛选获得的疫情微博,其内容与新冠疫情相关。     因此,本次评测训练集包含上述两类数据:通用微博训练数据和疫情微博训练数据,相对应的,测试集也分为通用微博测试集和疫情微博测试集。参赛成员可以同时使用两种训练数据集来训练模型。     每条微博被标注为以下六个类别之一:neutral(无情绪)、happy(积极)、angry(愤怒)、sad(悲伤)、fear(恐惧)、surprise(惊奇)。     通用微博训练数据集包括27,768条微博,验证集包含2,000条微博,测试数据集包含5,000条微博。     疫情微博训练数据集包括8,606条微博,验证集包含2,000条微博,测试数据集包含3,000
2023-02-09 16:48:42 44.7MB 数据集 NLP 情感分析
1
内容:常用高光谱分类数据集,包括常用的Indian pines\KSC\Purdue\DC\HOUSTON\Botswana\Salinas等,基本上写论文是够用的公开数据集; 使用方法:格式全部为mat格式,可以在Python和Matlab上使用; 使用建议:建议使用不同传感器的数据集来验证自己分类方法的有效性。
2023-02-09 03:26:12 980.35MB 遥感 高光谱数据集
1
使用RGBD数据集进行点云绘制-附件资源
2023-02-07 16:30:29 106B
1
facial_keypoint 用于面部关键点检测的Kaggle数据集。 清理数据,将图像列分离出一个数组以读取RGB值,然后将数据集分为X和Y值进行学习,使用20%的比例进行测试。 最后,实现了一个具有三个卷积层和两个密集层以及最终密集层作为输出的卷积神经网络。 尚未实施:Tensorboard以提高模型的准确性和损失。
2023-02-07 14:35:07 62KB JupyterNotebook
1
命名实体识别数据集ccks2020
2023-02-07 10:51:52 1.24MB 命名实体识别
1
日光诱导叶绿素荧光 SIF(Sun/Solar-induced Chlorophyll Fluorescence)是植物在太阳光照条件下,由光合中心发射出的光谱信号(650—800 nm),具有红光(690 nm左右)和近红外(740 nm左右)两个波峰,能直接反映植物实际光合作用的动态变化。 SIF遥感是近年迅速发展起来的植被遥感技术,可弥补当前植被遥感观测的不足,为陆地生态系统碳循环和植被监测等提供了新的思路和技术。以基于“绿度”观测的植被指数(如NDVI)为代表的植被遥感在过去30年极大地促进了从宏观尺度上来理解和认识地球生物圈,但其只能通过“绿度”来探测植物“潜在光合作用”。叶绿素荧光在植被光合生理探测方面具有独特的技术优势,是“实际光合作用”的直接探测方法。 总初级生产力(Gross primary productivity,GPP)是指单位时间内生物(主要是绿色植物)通过光合作用所固定的有机碳量,又称总第一性生产。SIF与光合过程的紧密联系使得其成为指示植被光合变化的有效探针,也是监测GPP强有力的手段。
2023-02-06 15:40:31 353.37MB 数据集 遥感 植被 全球变化
1
将Mapillary Vistas数据集转换为Coco格式 此python脚本可帮助您将枫叶远景数据集转换为coco格式。 简单的介绍 这是给定的instance图像。 标签信息嵌入到每个像素值中。 pixel / 256 # the value represents this pixel belongs to which label. pixel %6 # the value represents this pixel is the i-th instance of its label. 下载链接 您可以从以下链接下载CoCo格式(以JSON注释)的培训和验证集。 [1] [2]
2023-02-05 17:45:20 10KB Python
1