行业分类-物理装置-基于知识库的数据清洗方法及装置.zip
自然语言处理:用paddle对人民日报语料进行分词,停用词,数据清洗和熵计算 数据集提取: 公众号:YOLO的学习进阶日常 然后回复:nlp1 安装本地飞桨 本人 win10 python3.7 用的CPU 安装方式: pip install paddlepaddle -i https://pypi.tuna.tsinghua.edu.cn/simple pip install –upgrade paddlepaddle -i https://pypi.tuna.tsinghua.edu.cn/simple 安装成功如下: import paddle.fluid paddle.fluid.
2021-07-22 23:21:23 167KB add dd ddl
1
讲述了人工智能领域的数据清洗的各种指导和方法:数据缺失、混乱、重复怎么办?最全数据清洗指南!要获得优秀的模型,⾸先需要清洗数据。这是⼀篇如何在 Python 中执⾏数据清洗的分步指南。
2021-07-22 22:23:25 2.04MB 人工智能 机器学习 深度学习 数据分析
1
python 空气质量AQI 数据分析与预测----用到的库,数据集,数据清洗-附件资源
2021-07-15 14:53:46 106B
1
贵州省大数据清洗加工规范,大数据中数据清理规范文档。
2021-07-05 15:38:12 1.19MB data clean
1
风速-功率是风电机组发电性能的重要指标,对风电场的运行管理具有重要意义。风速-功率数据是通过安装在风电场的监视控制与数据采集(SCADA)系统采集得到的,原始数据存在大量噪声,给后续应用研究带来了很大的挑战。基于风速-功率数据的空间分布特征,将风速-功率数据分为3类,并改进了数据预处理方法bin算法,提出了基于分区域(dbin)算法的异常数据识别清洗方法及流程。实验结果表明,dbin算法识别异常数据的效率比传统算法更高,具有较强的通用性。
1
rank1-AI judge.rar
2021-07-05 12:06:53 1.57MB 数据清洗
1
1. 在jar包执行时,会出现ansj中的类找不到的错误,解决方法是将ansj和nlp两个包上传到hadoop节点上,然后运行程序的执行命令时加上jar包就可以了。 2. 重复运行程序的时候因为之前生成结果文件但是没有删掉,运行程序的时候出现文件已存在所以无法建立新的文件。 3. 运行时会存在classNotFound的错误,因为包名和类名错误,所以运行时的命令要把包名类名等都写对。 4. Linux上查看结果文件的时候中文是乱码,用PuTTY连接linux即可解决
2021-07-02 15:09:40 2KB 大数据 数据清洗
1
该论文是由本人和国赛队友共同完成,我的队伍是中北大学2021年国赛冲击国一的种子队伍之一。文章3,4,5题建立的数学模型原理极其复杂,请谨慎下载,预计该篇论文保底省二,冲击省一
2021-06-29 17:42:09 1.72MB 指派问题 数学建模 数据清洗
1