只为小站
首页
域名查询
文件下载
登录
Python数据挖掘 数据预处理案例(以航空公司数据为例)源代码+文件
Python数据挖掘 数据预处理案例(以航空公司数据为例)源代码+文件 完美解决复制代码后出现的空格问题,以及程序不能执行问题。
2022-12-20 20:07:22
43.27MB
数据挖掘
海量数据挖掘
数据预处理
航空公司数据
1
使用python进行文本预处理和提取特征的实例
如下所示:
文本过滤
result = re.sub(r'[^\u4e00-\u9fa5,。?!,、;:“ ”‘ '( )《 》〈 〉]', , content)#只保留中文和标点 result = re.sub(r'[^\u4e00-\u9fa5]', ,content)#只保留中文 result = re.sub(r'[^\0-9\.\u4e00-\u9fa5,。?!,、;:“ ”‘ '( )《 》〈 〉]', , content)#只保留中文和标点和数字 r
2022-12-20 13:07:40
40KB
jieba
python
python实例
1
2019年疫情数据的预处理数据挖掘可视化这是基于jupyter的源码
一、数据预处理与导入 1、2019_nCoV_data.csv是2020年1月-3月世界新冠疫情的数据,要求对2019_nCoV_data.csv进行数据预处理做以下操作,要求: (1)Sno编号列没有用,需要删除 部分国家对应的地区为NAN,需要填充为空白字符串 (3)部分国家/地区,受感染人数为0,也被列在表格中,需要删去 (4)查看受影响的国家/地区的数量,Country一列中将'Mainland China', 'Hong Kong' , 'Macau', 'Taiwan' 等统一修正为'China';另外需将'Korea, South'改为'South Korea'。 2、对于DXYArea.csv也需要进行数据预处理,要求做以下操作: (2)countryEnglishName一列中将 'HongKong' , 'Macao'等统一修正为'China'。 (3)将updateTime转换成date格式(输出为该数据的新列updateTime1,也就是只保留日期部分)。 (4)因为大部分城市都没有加“市”字,所以要把直辖市的下属区的“区”字去掉;还有一些没有变化规律的城市名
2022-12-16 21:50:44
944KB
可视化大屏
人脸识别预处理
本代码做人脸识别的预处理,包含 直方图均衡化和 中值滤波。
2022-12-14 16:01:08
953B
人脸识别
预处理
直方图均衡化
中值滤波
1
SEEG_Scripts:Python脚本主要使用mne-python预处理和分析SEEG数据
SEEG脚本 该存储库包含主要使用mne-python的stereotactic-EEG(SEEG)的预处理和分析脚本。 有两种主要的数据格式: Raw和Epoch 。 特征 语言:Python 软件包:mne-python,numpy,光谱连接,matplotlib,visbrain,pandas等 操作系统:Windows,Linux,MacOs 开始吧 首先,使用Anaconda或python本身创建一个python环境。 如果您有Anaconda或Miniconda,则只需键入以下命令 在您的终端中conda create -n [enve name] python=3.7 或者您可以从下载python 3.7(或更高版本) 然后输入python -m venv [enve name] 其次,使用requirements.txt安装所需的软件包。 键入pip insta
2022-12-14 15:29:57
11KB
Python
1
TextClassificationSystem:系统的介绍如何构建一个完整的文本分类系统,包括数据预处理,主要方法的原理介绍和实现细节,实验结果与分析,网页演示的构建以及项目文件的组织方式。项目的原理和处理细节可以查看我的博客专栏:https
文字分类系统 系统的介绍如何构建一个完整的文本分类系统,包括数据预处理,主要方法的原理介绍和实现细节,实验结果与分析,网页演示的构建以及项目文件的组织方式。项目的原理和处理细节可以查看我的博客专栏: :
2022-12-12 21:42:24
6.42MB
系统开源
1
彩色预处理阿尔茨海默病MRI(磁共振成像)数据集
彩色预处理阿尔茨海默病MRI(磁共振成像)所有的图像都被调整为128 x 128像素。该数据集有四类图像。该数据集由总共6400张MRI图像组成。1类轻度痴呆(896张图片)2类中度痴呆(64张图片)3类非痴呆(3200张图片)4类非常轻度痴呆(2240张图片)
2022-12-09 11:27:51
28MB
数据集
深度学习
MRI
图像
ASGCN:EMNLP 2019论文的代码和预处理数据集,标题为“基于方面的图卷积网络的基于方面的情感分类”
澳新网 ASGCN -为SPECT小号pecificģ拍摄和ÇonvolutionalÑetwork 论文的代码和预处理数据集,标题为“” ,,和。 更新 :我介绍了一个新的模型,该模型包含在有向依赖关系树上的双向图卷积网络。 2020年10月5日:由于下载时字向量已损坏(例如,Gloves.840B.300d.txt通常太大),许多人可能会遇到。 因此,我们在rest14数据集中发布了经过的单词嵌入,作为腌制的文件以及供您验证可重复性。 要求 Python 3.6 PyTorch 1.0.0 SpaCy 2.0.18 numpy的1.15.4 用法 使用以下命令安装软件包和语言模型 pip install spacy 和 python -m spacy download en 生成图形数据 python dependency_graph.py 使用此链接下载经过预训练的
2022-12-07 20:37:53
38.62MB
Python
1
gcn/gat模型中预处理数据用的脚本 如何把数据整成gcn/gat模型需要的数据格式 process
图模型中数据预处理所用的脚本, 包括dgl,gcn,gat都是用的这个预处理过程。
2022-12-06 17:26:30
7KB
图模型
gcn
gat
预处理
1
数据集预处理存放路劲11111
数据集预处理规范
2022-12-06 12:29:05
2KB
目标检测
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
OLED显示温度和时间-STM32F103C8T6(完整程序工程+原理图+相关资料).zip
基于Matlab的PI/4 DQPSK的调制解调源代吗
copula程序及算法.zip
20200318附加-2019年电赛综合测评方案详细计算过程(pdf版本,有朋友反映word版本乱码,特意转为pdf)
VideoDownloadHelper去除120分钟时间限制-高级版.zip
Monet智能交通场景应用
Academic+Phrasebank+2021+Edition+_中英文对照.pdf
token登录器.rar
2022学术英语写作(东南大学) 章节测试+期末test答案
多目标优化算法(二)MOEAD(附带NSGA2)的文档和代码(MATLAB)
科研伦理与学术规范 期末考试2 (40题).pdf
云视通扫描工具.zip
基于MATLAB的水果图像识别
模型预测控制MPC(模型预测电流控制,MPCC)的simulink仿真,2016b版本
多机器人编队及避障仿真算法.zip
最新下载
基与yoloV8姿态检测实现坐、站立、跌倒姿态推理评估(含源代码)
VMwareWorkstation安装包
C How to Program 9th Edition, Global Edition
mt4一键交易EA插件
STM32F103RCT6+1.44TFT屏幕显示
QT专业医疗界面仪器设计.zip
C# WPF实现读取显示DICOM
随机过程 方兆本答案
随机过程答案 方兆本 科学出版社
方兆本随机过程答案.pdf
其他资源
JavaWeb基于SSM框架的仓库管理系统(源码+数据库文件)
math.h头文件
STM32 迷宫小车
QGraphicsSceneDemo.zip
《Powerbuilder9·0实用教程》源代码和书.rar
2018年电工杯A题完整论文
19个MD2的3D人物模型
IAI RC联机软件 内置USB驱动
python2048游戏源代码
python爬取高德地图全国农贸市场数据,基于python3哈
基于Java-GUI的四则运算练习系统.rar
悬吊式起重机动力学仿真-悬吊式起重机动力学仿真.rar
jsp+mysql火车订票系统.zip
精简过的苹方SC字体,只包含3500个常用汉字和英文字母
中国智适应教育行业白皮书
抓包HTTP Debugger Pro v9.11.zip
Ubuntu操作
GPU Gems 3
小程序解压包软件.zip
睿亚训-智慧教育云整体解决方案
noip模拟题2 含数据、题解、标程 sz
棋牌游戏平台服务端的设计与实现
Mathematical Methods for Physics and Engineering, Third Edition
中医病历处方软件免费版本V2.0