此案例使用的是IDEA开发工具,项目属于maven项目 该词频统计案例中,数据源是自动产生的(java程序自定义生成的),针对自定义生成的数据完成词频统计,完成后打包上传到storm程序中执行
2022-05-30 19:07:53 4.72MB storm 源码软件 java 大数据
1
距离选择的原则 (1)要考虑所选择的距离公式在实际应用中有明确的意义。如欧氏距离就有非常明确的空间距离概念。马氏距离有消除量纲影响的作用。 (2)要综合考虑对样本观测数据的预处理和将要采用的聚类分析方法。如在进行聚类分析之前已经对变量作了标准化处理,则通常就可采用欧氏距离。 (3)要考虑研究对象的特点和计算量的大小。样品间距离公式的选择是一个比较复杂且带有一定主观性的问题,我们应根据研究对象的特点不同做出具体分折。实际中,聚类分析前不妨试探性地多选择几个距离公式分别进行聚类,然后对聚类分析的结果进行对比分析,以确定最合适的距离测度方法。
2022-05-30 17:59:57 605KB 聚类分析
1
数学建模时用的参考教材,理论严密。是扩展自己的最好途径~~
2022-05-30 16:15:56 10.67MB 多元统计 数学建模 统计分析
1
大学生毕业情况统计报表! 值得下载看看!资源免费,大家分享!! 更多免费资源 http://ynsky.download.csdn.net/
2022-05-30 13:59:02 30KB asp.net
1
此ppt由专业人员编写,内容条例清晰,重点突出,结合了简单易懂的实例,深入浅出的介绍了隐马尔可夫模型。
2022-05-30 10:46:19 7.81MB 统计学习方法 HMM
1
医疗期计算周期(统计周期)的算法.docx
2022-05-30 09:07:38 16KB 文档资料
华为话务统计分析与算法讲义.ppt
2022-05-30 09:07:36 6.87MB 华为 算法 文档资料
Java世界杯足球赛成绩统计,第18届世界杯足球赛 小组赛记录表(赛程安排及战况记录),包括了小组赛记录表、小组赛积分榜、完整成绩统计显示等。   在Java代码实现方面,结合了SQLSERVER数据库,编写了数据库操作类,连接指定数据库并获得数据库属性信息,按省份分类浏览student数据库中的stuinfo表。输入并分类浏览参赛队信息,实际上这是一个数据库应用范例,成绩统计基本全是对数据库的各种操作,代码中增加了丰富的注释,便于Java学习者参考。   这是之前世界杯的Java成绩统计,非本届世界杯,不过若写同类程序,是个不错的参考。
2022-05-30 08:22:45 220KB Java源码-数据库实例
1
10.3 统计机器学习 机器学习是近年来得到快速发展和广泛应用的研究领域,它研究的是用数据或先验知 识优化计算机算法的效果。从机器学习的方法可以分为统计方法和非统计方法。非统计的 方法种类很多,并且往往最后都归结于一个具体的优化问题,可以通过深入掌握优化理论 和算法,比较有效地把握各种非统计类方法。而统计类机器学习方法,虽然也用到最优化 方法,但是还有一些在概率框架下系统性的思路。下面我们把统计方法的脉络稍加整理, 供大家参考。 10.3.1 最大熵与指数族分布 统计机器学习中,指数族形式[9]的分布由于求解的方便性,有非常重要的工程地位, 我们先来看一下这一族分布形式产生的原因。要了解指数族形式产生的原因,需要先了解 最大熵(Maximum Entropy,ME)原理[6]。最大熵原理告诉我们,当在某些约束条件下选 择统计模型时,需要尽可能选择满足这些条件的模型中不确定性最大的那个。如果采用熵 作为统计不确定性的度量,这个问题就变成一个在这些约束下优化熵的问题。在最大熵的 准则下,估计一个概率的优化问题可以表示成:
2022-05-29 22:23:13 12.82MB 计算广告 互联网商业 变现 刘鹏
1
依据东莞市普通住宅项目交易均价数据,利用地统计学中的趋势分析方法对东莞市房价空间变化趋势进行了分析;采用普通克里格空间插值方法进行了空间局部估计,并借助ArcGIS软件和Surfer软件绘制了东莞市房价空间分布专题图,进而对东莞市房地产价格空间分布特征和差异及其成因进行了分析.
2022-05-29 17:13:53 1.94MB 自然科学 论文
1