摘要:因集中供热建筑结构、住户行为习惯等差异,末端住户供暖数据具有特征差异大、非线性强、数据量大、响应时间长等特 征,在原数据空间中利用聚类分析进行异常检测造成类间数据交叉,精确性无法保证。 本文提出高维高斯混合聚类算法,将数 据集映射到高维空间进行聚类,利用核函数映射、内积运算与高维特征空间分解等计算方法,提高精确度,规避维数灾难。 搭建 工业大数据分析平台,对比 K-Means、高斯混合、恒虚警率、高维高斯混合算法聚类结果与异常检测精确度,本文所提算法将准 确性提高到 90. 72% ,误报率降低到 5. 92% ,结合该算法完成 4 类异常用热数据集的解释与辨识。 高维高斯混合聚类可以有效 分析用户用热特征、检测异常数据,辅助降低采暖能耗,实现建筑节能。