威胁情报本身是一种历史记录,用于参考,类似于人的信用,让网络中的各个字段也有信用。用数据驱动安全,在攻击者进行攻击时,自动匹配攻击者所使用的网络各个字段的信用,信用低者必将引起注意。威胁情报的来源一般分为由商业产品、开源产品提供的外部情报和由日志平台、FW、WAF、蜜罐等系统提供的内部情报。威胁情报的分类整理是落地应用的基石,所有的分析与应用均应基于此展开。 当前,企业安全普遍面临着防护系统各自为营、海量告警日志人工处理不及时、没有规则就无法发现其他异常流量,很多告警发出后却没有相应的应急响应等痛点。将威胁情报、日志和流量进行关联分析,对分析结果进行自动和人工响应,来补充已部署的各种安全设备和防护系统做不到的防护,通过这些我们才能更清楚地看清生产网络中黑或灰色流量究竟是什么。 公司介绍 威胁情报的价值 威胁情报的分类 威胁情报的来源 生产网络中的应用 深度挖掘
2021-08-08 13:00:32 1.88MB 威胁情报 数据挖掘 流量分析 日志分析
二八定律: 20%的客户,为企业带来约80%的利益。 在竞争激烈的航空市场里,很多航空公司都推出了优惠的 营销方式来吸引更多的客户。在此种环境下,如何将公司 有限的资源充分利用,提示企业竞争力,为企业带来更多 的利益。 广泛用于分析客户价值的是RFM模型,它是通过三个指标(最近消费 时间间隔(Recency)、消费频率(Frequency)、消费金额(Monetary)) 来进行客户细分,舟刊出高价值的客户。如果分析航空公司客户价值 ,此模型不再适用,存在一些缺陷和不足:
2021-08-08 09:09:29 1.96MB 数据挖掘 数据分析 数据模型 客户分析
目前 ,医治疗一般都是采用,医辨证的原则 结合临床医师的从医 经验和医学指南进行诊断 然而此方法也存在一定的缺陷。 原始数据情况 患者信息属性说明 患者信息数据 初步分析: 针对乳腺癌患者 可运用,医截断疗法进行治疗 在辨病的基础上围绕 各个病程的特殊证候先证而治型; 依据医学指南 将乳腺癌辨证统一化 为六种证型。且患者在围手术期 、围化疗期、围放疗期和内分泌治疗期等各个病程阶段 基本都会出现 特定的临床症状。 通过关联规则算法 挖掘各,医证素与乳腺癌TNM分期之间的关系。探 索不同分期阶段的三阴乳腺癌患者的,医证素分布规律 以及截断病变 发展、先期干预的治疗思路 指导三阴乳腺癌的,医临床治疗。
2021-08-08 09:09:29 1.39MB 数据挖掘 数据分析 数据模型 关联分析
从事渔业生产有经验的从业者可通过观察水色变化调控水 质,用来维持养殖水体生态系统中浮游植物、微生物类、 浮游动物等合理 眼观察进行判断 结果的可比性、可重复性降低,不易推广应用。当前,数 字圈像处理技术为计算机监控技术在水产养殖业的应用提 供更大的空间。在水质在线监测等方面,数字圈像处理技 术是基千计算机视觉,以专家经验为基础,对池塘水色进 行优劣分级,达到对池塘水色的准确决速判别。 初步分析: 通过对抇摄的水样,采集得到水样图像,而图像数据的维度过大,不容 易分析,需要从中提取水样图像的特征,提取反映图像本质的一些关键 指标,以达到自动进行图像沪别或分类的目的。显然,图像特征提取是 图像沪别或分类的关键步骤,图像特征提取的效果如何直接影响到图像 沪别和分类的好坏。 图像特征主要包括有颜色特征、纹理特征、形状特征、空间关系特征等 。与几何特征相比,颜色特征更为稳健,对于物体的大小和方向均不敏 感,表现出较强的鲁棒性。本案例中由于水色图像是均匀的,故主要关 注颜色特征。
2021-08-08 09:09:28 2.57MB 数据挖掘 数据分析 数据模型 图像分析
全国大学生数据挖掘竞赛网站是一个致力于为高校师生提供 各类数据挖掘资源、资讯和竞赛活动开展的综合性网站,高校师生可通过网站获取 到所需的竞赛通知、教学资源、项目需求、培训课程等信息。另一方面,作为该网 站的技术支持方(TipDM公司)也希望能通过该网站及时知道访问者当前最关心什 么、关注什么,以便公司对新推出的产品和服务快速出作调整和响应。 用户进入网站主页查找资源一般是按不同类别栏目进入,再从细分栏目下寻找到目 标资源,但用户感兴趣的资源可能是跨类别,用户自行寻找则相对困难,此时需要 网站提供推荐功能,推荐用户可能感兴趣的页面,便于用户快速找到所关注的资源 ;同时访问网站的用户很多,但不同用户群体感兴趣的内容不一样,适合推荐的服 务也不一样,有的用户对数据挖掘领域不是太熟悉,相关的技术还不熟悉,此时就 需要提供相应的培训资源,有的用户是寻求企业级的数据挖掘服务,希望找到数据 挖掘在企业方面的应用,此时就需要提供相应的企业应用服务资源。对于网站而言 ,可结合用户访问网站的行为,挖掘出不同用户群体,推荐匹配的服务,提高用户 留存率。 如何利用用户的访问数据,挖掘出页面之间的联系,对用户进行推荐呢? TipDM公司目前希望在培训业务上得到推广,如何结合业务需要与用户的访问 行为特征,进行相应的推荐呢?
2021-08-08 09:09:27 3.35MB 数据挖掘 数据分析 数据模型 关联规则
应用系统是由服务器、数据库、中间件、存储设备等组成。它在日常运行时,会对底层软硬件造成负荷。 其中任何一种资源负载过大,都可能会引起应用系统性能 下降甚至瘫痪。及时了解当前应用系统的负载情况,以便 提前预防,确保系统安全稳定运行。 应用系统的负载率 通过对一段时间内软硬件性能的运行 状况进行综合评分而获得。 负载率趋势 通过系统的当前负载率与历史平均负载率进 行比较。 应用系统的负载高或者负载趋势大的现象,代表系统目前 处于高危工作环境中。如果系统管理员不及时进行相应的 处理,系统很容易出现故障。 本例重点分析磁盘容量,如果应用系统出现存储容量耗尽 的情况,会导致应用系统负载率过高,最终引发故障。 应用系统的负载率 通过对一段时间内软硬件性能的运行 状况进行综合评分而获得。 负载率趋势 通过系统的当前负载率与历史平均负载率进 行比较。 应用系统的负载高或者负载趋势大的现象,代表系统目前 处于高危工作环境中。如果系统管理员不及时进行相应的 处理,系统很容易出现故障。 本例重点分析磁盘容量,如果应用系统出现存储容量耗尽 的情况,会导致应用系统负载率过高,最终引发故障。
2021-08-08 09:09:27 1.83MB 数据挖掘 数据分析 数据模型 负载分析
电能的大容量、长距离输送,主要 依靠架空线路,它们长期暴露于大气环 境之中,易受雷电、台风、暴雨、覆冰、山火等气象灾害的影响而导致故障。 台风、雷电等极端自然灾害在短时间内 会造成电网的多个设备故障,加上潮流 的转移、保护装置拒、误动的推波助澜,进—步加剧相继开断,甚至造成大面 积停电。 1)台风 广东平均每年有4~5个台风经过,是受台风灾害较严重的地区之—。台风 通过极大的风压和暴雨直接摧毁输电杆塔、输电线和风电场,或引发输电线不 规则舞动,或刮倒树木,刮起异物造成断线或短路,其影响与台风强度、路径 、输电线走向及地形等因素有关。 2)雷电 雷电是造成输电线路跳闸的主要原因。雷电通过机械、热力和电磁效应影 响电力系统:机械效应劈裂或倒塌建筑架构;热力效应熔化导体或热爆避雷针 ;电磁效应通过冲击过电压引起绝缘闪络或击穿,干扰电力通信。落雷密度与 雷电强度、潮热程度及地形环境有关。 3)风偏放电 在强风或跑线风的作用下,绝缘子串向杆塔方向倾斜,减小了导线与杆塔 的空气间隙,当距离不能满足绝缘强度要求时就会发生放电,称为风偏放电。 输电线路风偏跳闸是影响输电线路安全稳定运行的主要原因之—。 4)暴雨 暴雨会影响电气设备绝缘,导致盗套管发生雨闪。其闪络电压与降雨强度 、雨水电阻率及降雨间歇性有关。高盐分的暴雨破坏性更大,而强风进—步增 加对电气设备密封的威胁,雨洪、泥石流和城市内滂会损害低洼处的电力设施 ,特别是跨河沟及滑坡体上的杆塔。 5)……
2021-08-08 09:09:25 2.21MB 数据分析 数据挖掘 关联分析 数据建模
MATLAB的数据挖掘功能 MATLAB(Mattrix Laboratory,矩阵实验室)是美国 Mathworks公司开发的应用软件,具备强大的科学及工程 计算能力,它不但具有以矩阵计算为基础的强大数学计算 能力和分析功能,而且还具有丰富的可视化图形表现功能 和方便的程序设计能力。它的应用领域十分广泛,主要包 括:数学计算和分析、自动控制、系统仿真、数学信号处 理、图形图像分析、数理统计、人功智能、虚拟现实技术、金融系统等。 MATLAB的数据挖掘功能 MATLAB用来做数据挖掘,特别是利用其简单的矩阵语言 加工具箱函数来实现数据挖掘算法,非常合适。 Statistics Toolbox和Neural Networks Toolbox可以用来 实现回归和分类;Optimization Toolbox和Genetic Algorithm and Direct Search Toolbox可以帮助 聚类算法进行最优化运算;Fuzzy Logic Toolbox可以进行 规则推理。 MATLAB的数据挖掘功能 �常用函数: kmeans() k-均值聚类 treefit() 决策树回归或分类 svmclassify() 支持向星机分类 knnclassify() k-近邻分类 crossvalind() 交叉验证试验 基千MATLAB的混合编程 基于MATLAB的工具箱函数实现混合编程的方法很多, 如:基于Matlab C/C++ 数学库、基于Matlab Engine、基于ExcelLink、基于COM/Excel生成器、基于 Matlab web server、基于自动化链接、基于Matlab的 DDE功能、基于MATLAB Builder for Java,等等,都 可以实现混合编程。
2021-08-08 09:09:24 1.45MB 数据挖掘 数据分析 MATLAB 数据模型
上机实验源数据-Hadoop大数据分析与挖掘实战 数据源 共16个章节 大数据的出现催生出产业人才缺口瓶颈,在大数据挖掘项目的实施方面,被调查公司普遍缺乏相关的技术能力。 75% 以上的公司表示在人员和培训方面存在障碍,会大数据挖掘技术的人才很热门,但是比较难找而且昂贵,会 Hadoop 技术的数据挖掘人才更是奇缺。 虽然大数据目前在国内还处于初级阶段,但是其商业价值已经显现出来,特别是有实践经验的大数据分析人才更是各企业争夺的热门。为了满足日益增长的大数据分析人才需求,很多大学开始尝试开设不同程度的大数据分析课程。“大数据分析”作为大 数据时代的核心技术,必将成为高校数学与统计学专业的重要课程之一。
2021-08-08 09:09:13 291.73MB Hadoop 大数据 数据挖掘 数据分析
SPSS Modeler简介 SPSS Modeler 原名 Clementine,定-^久享盛誉的数据挖掘平乙 软件。它提供完全可视化的图形化界面,主要通过数据流的形式实现 数据挖掘整^过程,具有如下功能: 易学/直观的可视化用户界面:可视化的操作方法,无需在编写代码上 耗费精力和时间、广泛的数据挖掘功能、灵活多样的部署选项。 强劲的自动化建模能力:自动化的数据准备、丰富的模型算法和评估 手段。 开发且可扩展的体系结构:支持SQL推送,在标准数据库内的数据挖 掘。 SPSS Modeler简介 它包括6^节点区:源数据节点(Sources)、记录处理节点(Record Ops)、字段(变量)处理节点(Field Ops)、图形节点(Graphs)、建立模 型节点(Modeling)和输出节点(Output),用户建立模型的过程就 定把各^节点区的节点以连线的方式连在-起。 SPSS Modeler软件从以下=^方面提供对中文的全方位支持:可以 读取和写入中文值和中文字段名;完全的中文操作界面和中文结果显 示;全面的中文帮助和中文使用手册,这在国外软件中定很少见的。 SPSS Modeler简介 它包括6^节点区:源数据节点(Sources)、记录处理节点(Record Ops)、字段(变量)处理节点(Field Ops)、图形节点(Graphs)、建立模 型节点(Modeling)和输出节点(Output),用户建立模型的过程就 定把各^节点区的节点以连线的方式连在-起。 SPSS Modeler软件从以下=^方面提供对中文的全方位支持:可以 读取和写入中文值和中文字段名;完全的中文操作界面和中文结果显 示;全面的中文帮助和中文使用手册,这在国外软件中定很少见的。 SPSS Modeler安装 这里使用的版本为SPSS Modeler 14.1。可从官网或者网站 http://www.tipdm.org/jmgj/568.jhtml下载,双击安装盘根目录下 的setup.exe文件即可安装(注意:安装版本位数需与系统位数相匹配)。 安装过程默认点击下-步即可完成安装,点击安装目录bin目录下的 modelerclient.exe启动SPSS Modeler,或者通过开始菜单中快捷方 式启动SPSS Modeler 。
2021-08-07 18:12:01 3.49MB SPSS 数据挖掘 数据分析 统计分析