svdmi 该Python脚本包含NLP中的几种常用预处理,例如PPMI计算,基于SVD的降维和基于PLSR的分布预测。 依存关系 需要以下软件包。 Python 2.7(未经Python 3测试) 麻木 安装 svdmi没有特定的安装。 一旦安装了所有依赖项,就可以按照用法部分所述运行svmi。 用法 PPMI 积极的点向互惠信息 $ python svdmi.py -m PPMI -i raw_co-occurrences_matrix_file_name -o ppmi_matrix_file_name SVD 基于奇异值分解的降维(SVD1)和矩阵平滑(SVD2)。 对于SVD1模式 $ python svdmi.py -m SVD1 -i matrix_file_name -o dimensionality_reduced_matrix_file_name -n
2021-11-02 01:00:25 5.36MB Python
1
1、欧空局哥白尼服务器,批量下载哨兵系列,包括哨兵1号、2号、3号和5P的批量下载以及批量预处理。sentinel-1 GRDH数据支持批量多线程预处理,包括去噪,轨道文件自动下载校准,多视处理等。sentinel-2支持基于sen2cor插件多线程大气校正,并转格式为tiff/envi/img格式。 2、USGS服务器,可以批量高速下载Landsat1-5 MSS ,Landsat4-5 TM, Landsat7 ETM以及Landsat-8 OIL数据,并支持辐射定标,6S大气校正。Landsat7和Landsat8支持全色波段融合。支持SRTM下载,sentinel-2下载 3、支持MODIS所有产品的批量高速下载。下载源为Nasa网站。并支持MODIS产品的批量预处理。保持hdf格式转tiff/env/img格式,坐标系添加。 4、支持下载ASF网站sar数据,包括alos,sentinel-1等,包括12.5米分辨率全球DEM数据 以及Landsat1-8全系列数据,modis全系列,并支持所下载数据包括6S大气校正在内的批量预处理。以及批量裁剪、栅格矢量互转,批量波段运算等功能。 5、提供基于开源机器学习算法的,贝叶斯分类器、随机森林、支持向量机、神经网络等监督分类器,以及聚类分析等非监督分类器。支持遥感多光谱数据的分类。 6、提供基于矢量数据shapefile格式的批量处理工具箱,包括批量坐标转换、矢量转栅格、栅格转矢量、矢量合并、DEM等高线提取、SHP转KML、KML转SHP。栅格数据工具箱包括:栅格去碎斑,栅格镶嵌,栅格批量重投影,栅格批量重采样,栅格批量裁剪,栅格统计,植被覆盖度批量计算,批量RPC正射校正,批量波段运算,批量栅格格式转换,Landsat-8批量地表温度反演(劈窗算法,单窗算法),Landsat-8批量湿度反演。 7、支持高分-1WFV,高分-6WFV,高分-1PMS,高分-2PMS,高分-6PMS数据批量辐射定标6S大气校正,RPC正射校正,批量全色融合。 8、支持word批量转PDF以及PDF批量转word。
2021-11-01 18:04:14 545.48MB sentinel 哨兵2号 Landsat8 批量下载
1
face_recognition 项目名称为:自建数据集人脸识别。该项目利用电脑自带摄像头或者已有照片进行人脸数据集建立,再进行人脸检测,人脸识别,人脸预测,包括数据采集、数据预处理、建模、模型训练、模型使用预测全过程。项目使用Openc3进行数据采集、数据预处理,Keras 进行建模,模型参考了VGG16网络,包含4个卷积层,5个LeRu层,2个池化层,3个Dropout层,2个全连接层,1个flatten层,1个分类层,共18层。 更多内容,请看代码中的 read_me.pdf !
2021-10-31 19:45:51 201KB Python
1
数据挖掘论文合集,这是数据预处理部分的论文。相关的论文还有关联挖掘、聚类挖掘、决策树、数据挖掘的实际应用等部分,这些都会陆续上传。
2021-10-30 23:18:17 1.86MB 数据挖掘 预处理 dm
1
今天小编就为大家分享一篇python数据预处理 :数据共线性处理详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
2021-10-30 15:48:47 85KB python 数据 共线性
1
R语言 台湾银行还款预测 数据预处理 距离判别
2021-10-28 18:00:54 1.83MB python
1
哨兵全系列卫星遥感数据下载,批量预处理,包括大气校正,转格式重采样。landsat-8,MODIS批量下载预处理。支持国产高分1/2/6卫星数据批量大气校正、全色波段融合,正射校正等。
2021-10-28 10:20:06 440.44MB 哨兵2 sentinel landsat-8 MODIS
1
脑MRI序列的预处理 这是对ADNI数据集的大脑MR图像进行预处理的管道通过使用FMRIB软件库( FSL )和高级归一化工具( ANTs )。 1.安装FSL和ANT 按照说明下载并安装FSL 。 从或源代码编译ANT 。 2.安装Python软件包 所有必需的库如下所示: tqdm 麻木 科学的 py 尼巴​​贝 matplotlib sciKit-fuzzy(可选) scikit-learn(可选) 3.下载数据集 此仓库中使用的数据集是ADNI1和ADNI2的AD和NC筛选图像。 见。 这是原始图像的一个样本。 4.重新组织文件 将工作目录切换到src 。 运行reorgnize.py,它将ADNI1和ADNI2合并到一个文件夹中。 python reorgnize.py 5.注册 运行registraion.py通过FSL FLIRT将图像转换为模板的坐标系。
2021-10-27 19:09:18 60.85MB mri registration preprocessing enhancement
1
文本预处理介绍 文本预处理一般是指将原始数据通过数据转换,缺失处理等手段转化为符合要求的“新”数据集的过程。预处理本身是一件极其耗费时间的事情,繁琐且涉及细节很多。预处理做的不好,对后面的建模分析等等都会有很大的影响。 对于自然语言的文本数据,处理过程一般包括文本清洗、分词等,其中每个步骤在中英文处理时都有些不同,如中文分词的难度远大于英文,而英文需要转换大小写、词形还原等步骤。 接下来将会分别介绍中英文预处理中的重点环节,结合实际介绍和使用包括jeba,NLTK 等工具包,实现分词和词干提取等步骤,最后展示完成一个(词频统计)实际任务。 一般来说,文本数据预处理的第一步是文本清洗,这个环节非
2021-10-26 15:35:32 46KB 分词 文本分析 替换
1
[英语] 该演示展示了如何实现 ZCA 白化以输入到卷积神经网络 (CNN)。 其解释请参考补充文件。 CNN 的输入层可以自动对图像进行归一化通过指定“ zscore”。 但是到2020a还没有实现ZCA白化,这个脚本最后定义了ZCA函数作为辅助函数。 [日本人]在这个演示中,ZCA 白化作为深度学习分类的预处理。 ZCA美白请参考参考资料。如果在定义图像输入层时指定'zscore',则可以自动进行预处理。但是,尽管您可以使用均值、标准偏差等进行“逐像素”预处理,但考虑到“像素间”信息的 ZCA 认识到,在 2020a 中,无法在“”内指定名称。 ZCA美白可以非常有效[4],取决于数据和网络等许多条件,它可能对提高准确性的贡献不大。 [参考] [1] Matlab 答案:如何将 PCA 应用于图像以通过示例降低其维数? https://jp.mathworks.com/matlab
2021-10-26 15:16:54 2.74MB matlab
1