上传者: 26763955
|
上传时间: 2022-08-21 23:41:47
|
文件大小: 12.77MB
|
文件类型: PDF
10.2.2 聚类分析
聚类是将物理或抽象对象的集合分成若干由类似的对象组成的多个类
的过程。由聚类生成的簇是一组数据对象的集合,这些对象与同一个簇中的
对象彼此相似,与其他簇中的对象相异。现在聚类分析广泛应用于生物、经
济、社会、人口等领域的大量量化分类问题的研究中,也是数据处理、数据挖
掘中最主要的内容之一。聚类分析内容非常丰富,有系统聚类法、动态聚类
(K均值聚类)法、有序样品聚类法和模糊聚类法等。
在实际应用中,有时样品之间有先后次序且不能变动,在同一类中的样
品要求次序相邻的,这类问题称为有序样品的聚类分析。例如对动植物按生
长的年龄段进行分类,年龄的顺序是不能改变的,否则就没有实际意义了;在
地质勘探中,需要通过岩心了解地层结构,此时按深度顺序取样,样品的次序
也不能打乱;在证券交易中,对行情的研判必须与交易时间相对应,今天赚钱
的品种在昨天或者明天都可能严重亏损。
10.2.3 上证综指的聚类
表10-1是2010年7月16日到2011年7月15日整一年共243个交易日
的上证综指收盘价(来自同花顺交易软件),图10-1是相应的散点折线图。
·781·