_基于文本挖掘的数据分析岗位人才需求分析.caj
2023-01-16 11:07:49 3.43MB
1
传统的防窃漏电方法主要通过定期巡检、定期校验电表、用户举报窃电等手段来发现窃电或计量装置故障。但这种方法对人的依赖性太强,抓窃查漏的目标不明确。目前很多供电局主要通过营销稽查人员、用电检查人员和计量工作人员利用计量异常报警功能和电能量数据查询功能开展用户用电情况的在线监控工作,通过采集电量异常、负荷异常、终端报警、主站报警、线损异常等信息,建立数据分析模型,来实时监测窃漏电情况和发现计量装置的故障。根据报警事件发生前后客户计量点有关的电流、电压、负荷数据情况等,构建基于指标加权的用电异常分析模型,实现检查客户是否存在窃电、违章用电及计量装置故障等。
2023-01-15 15:35:18 1.12MB 数据挖掘 大数据 Rapidminer
1
基于Spark的分布式大数据分析算法研究
2023-01-15 03:16:25 422KB 研究论文
1
Excel数数字看板55+套,数据分析模板,数据分析可视化图表,使用于各个行业,汇报演示。数字驾驶舱: 财务年终报表数据化可视板块、销售活动数据可视化动态看板、人力资源动态可视化看板、融资及资金用途数据可视化看板、工资预算可视化看板、设备运维看板、销售员业绩可视化看板、回款可视化、预算可视化等各种可视化看板
1
数据分析案例--红酒数据集分析 介绍: 这篇⽂章主分析了红酒的通⽤数据集,这个数据集⼀共有1600个样本,11个红酒的理化性质,以及红酒的品质(评分从0到10)。这⾥主 要⽤python进⾏分析,主要内容分为:单变量,双变量,和多变量分析。 注意:我们在分析数据之前,⼀定要先了解数据。 1.导⼊python中相关的库 import numpy as np import pandas as pd import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns # 颜⾊ color = sns.color_palette() # 数据print精度 pd.set_option('precision',3) 2.读取数据 注意:读取数据之前应该先看⼀下数据⽂件的格式,再进⾏读取 我们看到这个数据使⽤';'进⾏分隔的,所以我们⽤';'进⾏分隔读取 pandas.read_csv(filepath, sep=', ' ,header='infer', names=None) filepath:⽂本⽂件路径;sep:分隔符;header默认使⽤第⼀⾏作为列名,如果header=None则pandas为其分配默认的列名;也可使⽤ names传⼊列表指定列名 data=pd.read_csv(r'H:\阿⾥云\红酒数据集分析\winequality-red.csv',sep=';') data.head() 先读取数据的前五⾏ 然后我们也可以把这个整理好的数据,再另存为csv⽂件或者excel⽂件 data.to_csv(r'H:\阿⾥云\红酒数据集分析\winequality-red2.csv') data.to_excel(r'H:\阿⾥云\红酒数据集分析\winequality-red3.xlsx') winequality-red2.csv如图: winequality-red3.xlsx如图: 这样呢,我们就保存好了⽂件。这也是整理⽂件的⼀种⽅式 3.查看数据集的数据类型和空值情况等 可以看出没有缺失值,数据整齐 4.单变量分析 #简单的数据统计 data.describe() 5.绘图 # 获取所有的⾃带样式 plt.style.available # 使⽤⾃带的样式进⾏美化 plt.style.use('ggplot') #获取所有列索引,并且转化成列表格式 colnm = data.columns.tolist() fig = plt.figure(figsize = (10, 6)) for i in range(12): #绘制成2⾏6列的图 plt.subplot(2,6,i+1) #绘制箱型图 #Y轴标题 sns.boxplot(data[colnm[i]], orient="v", width = 0.5, color = color[0]) plt.ylabel(colnm[i],fontsize = 12) #plt.subplots_adjust(left=0.2, wspace=0.8, top=0.9) plt.tight_layout() print('\nFigure 1: Univariate Boxplots') colnm = data.columns.tolist() plt.figure(figsize = (10, 8)) for i in range(12): plt.subplot(4,3,i+1) #data.hist绘制直⽅图 data[colnm[i]].hist(bins = 100, color = color[0]) plt.xlabel(colnm[i],fontsize = 12) plt.ylabel('Frequency') plt.tight_layout() print('\nFigure 2: Univariate Histograms') 品质 这个数据集的⽬的是研究红酒品质和理化性质之间的关系,品质的评价范围是0-10,这个数据集中的范围是3到8,有82%的红酒品质是5 或6 酸度相关的特征 这个数据集有7个酸度相关的特征:fixed acidity, volatile acidity, citric acid, free sulfur dioxide, total sulfur dioxide, sulphates, pH。前6个特征都与红酒的pH的相关。pH是在对数的尺度,下⾯对前6个特征取对数然后作histogram。另外,pH值主要是与fixed acidity有关fixed acidity⽐volatile acidity和citric acid⾼1到2个数量级(Fi
2023-01-12 16:16:52 789KB 文档资料
1
这本书主要介绍了如何使用pandas进行数据分析,使用的python语言,书是中文的
2023-01-11 09:26:07 13.37MB pandas
1
该文件为python学习资料,涵盖python的基础学习、提升的爬虫学习、数据分析学习以及一些实践项目。希望对你有帮助! PS:解压密码见文件名
2023-01-09 20:31:37 243.43MB python 学习资料
1
PUBG-数据分析
2023-01-09 20:18:01 4.5MB JupyterNotebook
1
很棒的学术数据分析 学术数据分析的资源清单,包括数据集,论文和有关文献计量学,引文分析的代码以及其他学术共享资源。 可在线访问 目录 隶属关系 高度度量和尺寸 工具 发布数据集和分析的用户界面 收集开放获取文件的工具 研究论文分类工具 可视化 语言处理和信息提取 引文和元数据提取 出版地点 期刊 专题会议 工作坊 暑期学校 协会与社区 会费 用markdown-toc生成的目录 数据集 出版与引文 Arnet矿工 微软学术图 打开学术图-MAG + AMiner OpenAIRE研究图-在此处了解更多信息 语义学者语料库 CiteSeer 考研 用于引用字符串解析的CORA数据集 人文和多语言引文字符串解析Flux-CiM和ICONIP ,有关详细信息,请参见Neural ParsCit论文 社会科学对英语和德语引文的引文字符串解析数据-与Grobid和Cermine的比较 Cro
2023-01-09 09:12:21 19KB
1
本PPT中主要针对CANape插入虚拟函数进行说明; 在汽车标定测试开发过程中,对测量数据(dat、mdf等文件格式)分析时,有时需要进行数据分析,比如原始的测量数据中有发动机转速、扭矩参数,但是没有功率参数,但是功率可以根据转速和扭矩参数计算,计算公式power=T*n/9550。根据分析数据的需要,我们可以利用CANape的函数功能,计算间接信号,并在图形窗口中显示,方便数据统计分析。 本文以简单的功率计算说明。
2023-01-08 12:23:22 891KB CANape 数据分析 汽车软件测试 标定
1