摘要: 空气质量问题近年来受到广泛关注。由于空气质量数据具有在时间上连续、空间上相关的特点,所以提高了异常点识别难度。本文提出在时间维度上运用移动平均法,而在空间维度上运用反距离加权法对观测值进行预测并求残差,从而将时空数据的异常点识别问题转化为二维残差值的异常点检测问题。在残差值的二维空间中,通过最近邻算法计算每个点相对于多个邻近点的异常程度。当异常程度大于阈值的概率超过预定值时判定为异常点。通过仿真验证表明新方法具有良好的检出力。最后将新方法应用于北京市实际观测数据,取得了满意的识别效果。
聂斌等. 基于最近邻分析的空气质量时空数据异常点识别[J]. 统计研究, 2017, 34(8): 61-70.
Nie Bin et al.. Outlier Detection from Air Quality Spatio-temporal Data Based on Nearest Neighbor Analysis[J]. Statistical Research, 2017, 34(8): 61-70.