中英文停用词stop_words,共3018个
2021-11-25 18:01:56 23KB 停用词 stopword nlp 数据预处理
1
基于遗传算法的数据预处理组合方法.pdf
2021-11-25 11:02:59 153KB 算法 遗传算法 数据结构 参考文献
为了防止过度无谓的下载,设置了密码:xiangpengmeng 指纹识别C代码(包括图像预处理和图像匹配)
1
用于文本数据预处理的去除停用词,每个词以换行的形式分割
2021-11-23 19:15:40 41KB 停用词 分词 预处理
1
活动识别研究预处理 关于 这是一个关于识别日常活动的研究项目,包括步行、跑步、站立、躺着、慢跑等,使用来自加速度计、陀螺仪、磁力计、GPS 等传感器的数据。 内容 ActivityRecognition-预处理: 一个用于预处理数据并从原始数据文本中提取特征的 Java 程序。 并将原始数据传输到 arff 文件中进行 WEKA 分类。 亲戚们 :一个从 LPMS-B 传感器和手机收集数据的 Android 应用程序; :其他研究机构和我们自己收集的活动识别数据集,包括WISDM、USCB和ZJU。 贡献者 主要的 茹晨光@浙江大学,中国
2021-11-23 14:06:36 8KB Java
1
语音信号预处理需要欲加重处理,其目的是将高频部分家中增加高频分辨率,以去除口鼻辐射影响。
2021-11-22 21:03:51 1KB 语音预处理
1
信号预处理——零均值化 在测试中由数据采集所得的原始信号,在分析前需要进行预处理,以提高数据的可靠性和真实性,并检查信号的随机性,以便正确地选择分析处理方法。本设计中,我们采用零均值化处理。 零均值化处理又称中心化处理。信号的均值相当于一个直流分量,而直流信号的傅里叶变换是在 处的冲激函数,因此若不去除均值,在作信号谱分析时,将在 处出现一个大的谱峰,并会影响在 左右处的频谱曲线,使它产生较大的误差。 设采样数据为 (n=1,2,…,N),其均值通过下式计算: 用下式进行零均值化处理: 处理后, 就变为一个均值为零的新信号 (n=1,2,…,N)。
2021-11-22 15:17:42 2.79MB 故障诊断
1
Matlab 深度学习图像预处理,图像数据增广函数。深度学习训练时,需要大量的训练数据。而数据往往不易获得。本程序为标准的图像数据增广函数。功能包括对图像的旋转、翻转、亮度调整。可以扩展到各类图像文件格式。
2021-11-19 18:53:50 2KB MATLAB
1
xgboost代码回归matlab “#EEG_preprocessing”此存储库包含用于预处理EEG数据的Maltab和Python文件。 Matlab文件是进一步分析的预处理步骤。 预处理执行如下: 滤波(0.5 – 30 Hz)2.重新参考(通用平均参考)3.使用EEGLAB ICA插件计算ICA权重。 4.仅查找和选择用于干净数据的实际试验(针对整个数据集)5.使用-1到2秒之间的间隔。 6.为了拒绝人为因素,使用了SASICA。 7.消除数据趋势并消除线路噪声。 8.消除异常时期以上步骤是研究有关该主题和实验方法的现有论文的结果。 python文件是用于将EEG数据分类为从Kaggle数据库获取的抓取力数据的分析代码。 此处提供了数据集的描述:。 在分析中,我执行了数据的简单转换并应用了Microsoft的LightGbM算法。 该代码可用作将来在其他EEG数据集上使用的模板。 使用GrigSearch和Cross-Validation选择lightGBM参数。 与lightGBM一起使用了其他算法,例如逻辑回归,XGboost,SVM,但是lightGBM在速度(Top1
2021-11-19 14:48:59 5KB 系统开源
1