摘要: 非平衡数据集的不均衡学习特点通常表现为负类的分类效果不理想。改进SMOTE再抽样算法,将过抽样和欠抽样方式有机结合,有针对性地选择近邻并采用不同策略合成样本。实验表明,分类器在经此算法处理后的非平衡数据集的正负两类上,均可获得较理想的分类效果。
薛薇. 非平衡数据集的改进SMOTE再抽样算法[J]. 统计研究, 2012, 29(6): 95-98.
Xue Wei. An Improved SMOTE Algorithm for Re-Sampling Imbalanced Data Sets[J]. , 2012, 29(6): 95-98.