统计研究 ›› 2021, Vol. 38 ›› Issue (7): 140-152.doi: 10.19343/j.cnki.11-1302/c.2021.07.011
王小燕 张中艳
Wang Xiaoyan Zhang Zhongyan
摘要: 信用风险管理关乎信贷行业的生存,风险指标筛选是其中的核心内容,已有研究发现指标间的关联信息有利于改进指标选择。为此,本文基于复杂网络理论建立了指标的图结构以体现其相关性信息,并将图结构与L0 惩罚方法相结合,建立一个线性判别分析(GR-LDA)模型实现指标筛选。理论上证明了模型的损失函数可转化为最小二乘函数,因而求解十分便利。模拟分析显示,对比Lasso-LDA 方法、L0-LDA 方法、弹性网Logistic 和Lasso-SVM,模型在变量选择方面和分类精度上具有一定的优势。图结构能够显著改进模型分类预测和指标选择能力,且随着指标间相关性增强,图结构的优势更加明显。最后将模型应用于P2P 网贷数据分析,发现GR-LDA 方法的预测评价表现良好,同时模型识别到了网络图中的重要指标。