摘要: 本文提出了基于聚类和关联规则的缺失数据处理新方法,通过聚类方法将含有缺失数据的数据集相近的记录归到一类,然后利用改进后的关联规则方法对各子数据集挖掘变量间的关联性,并利用这种关联性来填补缺失数据。通过实例分析,发现该方法对缺失数据处理,尤其是海量数据集具有较好的效果。
方匡南 谢邦昌. 基于聚类关联规则的缺失数据处理研究[J]. 统计研究, 2011, 28(2): 87-92.
FANG Kuang-南, XIE Bang-Chang. Research on Dealing with Missing Data Based on Clustering and Association Rule[J]. , 2011, 28(2): 87-92.