大数据之数据挖掘技术.ppt该文档详细且完整,值得借鉴下载使用,欢迎下载使用,有问题可以第一时间联系作者~
2022-06-21 17:05:28 1.18MB 文档资料
随着软件系统的规模和复杂性日益增长,软件开发已经演变成一项复杂的系统工程。软件工程中的对象、活动和过程更加难以控制和管理,因此该领域原有的经验直觉型的处理模式已经不能适应新的需求,而数据挖掘技术的引入为实现知识智能型软件工程提供了重要契机。本文以软件工程领域中的数据对象为主线,对在程序代码分析、故障检测、软件项目管理、开源软件开发等软件活动中所运用到的数据挖掘技术进行了系统地介绍和归纳,并在每一环节作了方法间的优劣性对比分析。最后还指出了若干值得进一步研究的方向。
1
量化投资 数据挖掘技术与实践 MATLAB
2022-05-25 20:17:57 102.28MB java
1
数据挖掘技术与分类算法研究 数据挖掘技术与分类算法研究
2022-05-22 12:20:25 6.19MB 数据挖掘 分类算法
1
数据仓库与数据挖掘技术
数据挖掘技术在电子商务网站中的应用.doc
2022-05-19 09:03:39 22KB 电子资料
CHAMELEON算法 CHAMELEON算法是由G. Karypis, E.H. Han 和 V. Kumar在1999年提出的一种动态层次聚类方法。 基于动态模型计算相似性 只有当两个类之间的相似性高于类内对象的相似性时合并两个类。 本质上,是一个两阶段算法 1.首先,使用图分割算法将数据集合划分为多个子集; 2.然后,使用层次聚类中的凝聚方法将这些子集进行反复的合并,直至获得最终的聚类结果。
2022-05-14 14:34:34 9.28MB 数据挖掘
1
基于关联规则的数据挖掘技术在中医医学辅助诊疗系统的应用研究
2022-05-13 20:57:32 61KB 卫生 医疗
1
安全技术-网络信息-文本挖掘技术研究及其在综合风险信息网络中的应用.pdf
2022-04-30 17:01:14 5.13MB 文档资料 安全 网络
随着医疗行业信息技术的引入,该行业的信息化和自动化水准不断提高。医学 文本信息处理技术正逐渐成为一个新的研究热点。医疗文本,以电子病历为代表, 包含了大量丰富的医疗信息,是进行疾病预测、个性化信息推荐、临床决策支持、 用药模式挖掘等的重要资源,并且可以以此为基础进行医院机构服务价值的衡量。 医学文本中尽管蕴藏着丰富的医疗知识,但处理起来也更加困难。由于以电子病历 为主的医疗文本中包括大量非结构化的自由文本以及图像影像信息,且医生自行 录入可能导致文本的拼写错误、医学名词简写以及不同医生不同地区的惯用语,电 子病历中所包含的医疗信息还不能被计算机有效利用。因此,机器学习和自然语言 处理相关技术将在医学文本的分析和挖掘中发挥重要作用。 为了更好地探索和利用医学文本,特别是电子病历的半结构化和非结构化信 息,对其中非结构化自由文本进行标准化和结构化非常的重要,而医疗信息对时间 特征具有较高的敏感性,使得时间信息也成为了更好分析医疗文本必不可少的因 素。传统的文本分类需要先进行一系列预处理和特征工程的建模,在医疗文本中存 在大量的专业术语和知识、不准确的分词或难以理解的语义特征会影响分类的正
2022-04-27 16:05:42 11.89MB 文档资料 机器学习 人工智能