ts_cluster 使用 R 的时间序列聚类 这个 repo 只是一个示例 repo,用于学习如何对时间序列数据进行聚类。 为了处理时间序列数据,我们必须考虑并选择适合的方法。 在这个存储库中,我们使用 DTW(动态时间包装)代替欧几里得来计算一个信号到另一个信号之间的距离。 对于聚类方法,我们使用层次聚类和 DBSCAN。 我们使用的数据是来自 UCI 的 Synthetic Control Chart Time Series,更多详细信息您可以访问
2022-03-22 08:54:30 1.72MB R
1
本文采用时间序列分析,地理信息,聚类分析,因果关系检验等技术手段对近十年来中国大陆的房价进行了分析。 在比较各省与邻近省之间的房价后,Kmeans集群将连续分布在地图上; 时间序列上的最高价区域和最低价区域也在地图上连续分布; 基于时间序列的因果关系检验发现,六个省的房价增长率受周围省份的影响,而一个省的房价增长率则影响了邻近省份的房价增长率。
2022-03-08 16:43:07 939KB 房屋价格 时间序列 聚类分析 邻省
1
颜色分类leetcode 时间序列聚类 时间序列聚类是一项无监督学习任务,旨在将未标记的时间序列对象划分为同质的组/集群。 与其他集群中的时间序列相比,同一集群中的时间序列彼此更相似 该算法能够: 识别跨序列的联合动态 消除序列间的滞后(时移)(通常称为滞后不变性) 生成可解释的特征。 一般来说,时间序列聚类算法有两种类型: 基于特征- 使用特征提取转换原始数据,在生成的特征之上运行聚类 基于原始数据- 直接应用于时间序列向量,无需任何空间变换 变分循环自动编码器 (VRAE) VRAE 是一种基于特征的时间序列聚类算法,因为基于原始数据的方法受到维数灾难的影响,并且对嘈杂的输入数据很敏感。 中间的瓶颈层将作为整个输入时间序列的特征表示。 建筑学 网络 从这里开始,RNN 指的是循环神经网络架构,即 LSTM/GRU 块。 我们的模型主要由四个块组成 编码器:输入向量序列被馈送到 RNN,最后一个隐藏层h_end从 RNN 中提取并传递到下一层 编码器到潜在层: h_end通过使用线性层映射到均值和标准差 给定均值和标准差。 偏差,在训练期间执行重新参数化。 这实质上意味着从由其均值和
2022-02-23 15:46:38 4.5MB 系统开源
1
时间序列聚类以及动态时间规整(DTW)距离的优化 具有各种策略的时间序列聚类以及针对动态时间规整(DTW)距离及其对应的下限(LB)的一系列优化。 既有传统聚类算法的实现,也有更新的过程,例如k-Shape和TADPole聚类。 使用自定义距离度量和质心定义可以轻松扩展功能。 此软件包中实现的许多算法都是专门为DTW量身定制的,因此得名。 但是,主要的聚类功能很灵活,因此可以直接使用时间序列或通过应用适当的转换,然后在结果空间中进行聚类,来测试许多不同的聚类方法。 软件包中包含的其他实现为DTW提供了一些替代方案。 想要查询更多的信息: (附录中带有示例) 实作 分区,层次和模糊聚类 k形聚类 基于形状的距离 时间序列的形状提取 TADPole聚类 DTW的优化版本 Keogh和Lemire的DTW下限 全局对齐内核(GAK)距离 DTW重心平均 软DTW(距离和质心) 一些多变量支
2022-01-11 22:59:03 6.99MB time-series clustering dtw R
1
一种新的基于隐Markov模型的分层时间序列聚类算法.pdf
2021-08-21 13:03:21 337KB 聚类 算法 数据结构 参考文献
多元时间序列聚类算法分析.pdf
2021-08-21 09:37:17 275KB 聚类 算法 数据结构 参考文献
面向临床检验指标的非同步时间序列聚类算法研究.pdf
2021-08-20 01:23:57 411KB 聚类 算法 数据结构 参考文献
提出了一种基于DTW的符号化时间序列聚类算法,对降维后得到的不等长符号时间序列进行聚类。该算法首先对时间序列进行降维处理,提取时间序列的关键点,并对其进行符号化;其次利用DTW方法进行相似度计算;最后利用Normal矩阵和FCM方法进行聚类分析。实验结果表明,将DTW方法应用在关键点提取之后的符号化时间序列上,聚类结果的准确率有较好大提高。
2021-06-02 15:41:55 227KB 软件
1
时间序列聚类综述
2021-03-13 22:05:06 84KB 时间序列聚类综述
1
可靠的方法去判断两个时间序列是否相似,截下来便可以使用k-NN算法进行分类。根据经验,最优解一般出现在k=1的时候。下面就利用DTW欧氏距离的1-NN算法。在该算法中,train是时间序列示例的训练集,其中时间序列所属的类被附加到时间序列的末尾。test是相应的测试集,它所属于的类别就是我们想要预测的结果。在该算法中,对于测试集中的每一个时间序列,每一遍搜索必须遍历训练集中的所有点,从而可以找到最多的相似点。考虑到DTW算法是二次方的,计算过程会耗费非常长时间。我们可以通过LB Keogh下界方法来提高分类算法的计算速度。计算机运行LB Keogh的速度会比运行DTW的速度快很多。另外,当LB
2021-03-12 19:00:24 3.18MB 时间序列 聚类 分类
1