|国家科技期刊平台
首页|期刊导航|计算机科学与探索|面向Shapelet空间的多变量时间序列密度聚类算法

面向Shapelet空间的多变量时间序列密度聚类算法OA北大核心CSTPCD

中文摘要

多变量时间序列聚类问题已经成为时间序列分析任务中重要的研究课题,相较于单变量时间序列,多变量时间序列的研究复杂性更高,难度更大。尽管当前已经提出了许多针对多变量时间序列的聚类算法,但是这些算法在精度和解释性方面仍旧不足。其一,当前大部分工作并未考虑多变量时间序列的长度冗余性和变量相关性等问题,导致最终得到的相似性矩阵具有较大误差;其二,数据在聚类过程中普遍采用划分范式,当数值空间呈现复杂分布时该思想表现不佳,并且不具备对各个变量及空间的解释力。针对上述问题,提出了一种面向Shapelet(富有高信息量的连续子序列)空间的多变量时间序列自适应权重密度聚类算法(MDCS)。算法首先对各个变量进行Shapelet搜索,通过自适应策略获取到各自的Shapelet空间,接着对各个变量产生的数值分布进行组合加权,得到了更符合数据分布特征的相似度矩阵,最后利用改进密度计算和二次分配的共享最近邻密度峰值聚类算法对数据进行最终分配。在真实数据集上的实验结果证明,与目前先进的聚类算法相比,MDCS拥有更好的聚类结果,在标准化互信息和兰德系数指标上平均提高了0.344与0.09,兼顾了性能与可解释性。

盛锦超;杜明晶;孙嘉睿;李宇蕊;

江苏师范大学计算机科学与技术学院,江苏徐州221100

计算机与自动化

多变量时间序列子序列Shapelet空间密度峰值聚类数据挖掘

《计算机科学与探索》 2024 (002)

P.387-402 / 16

国家自然科学基金(62006104,61872168);江苏省高校自然科学基金(20KJB520012)。

10.3778/j.issn.1673-9418.2211099

评论