统计研究 ›› 2024, Vol. 41 ›› Issue (2): 139-148.doi: 10.19343/j.cnki.11–1302/c.2024.02.012
荣耀华 王江慧 程维虎 曹美雅
Rong Yaohua Wang Jianghui Cheng Weihu Cao Meiya
摘要: 加速失效时间模型是一种应用广泛的生存分析模型。本文借助LASSO惩罚剔除冗余预测变量,构建基于核机器的加速失效时间模型,用以刻画预测变量与生存期间的复杂关系。此外,提出一种新的正则化Garrotized核机器估计方法,可以较好地刻画预测变量与生存期潜在的非线性关系,实现非参数分量中预测变量间交互作用的自动建模,提升模型预测精度。模拟研究表明,与已有的代表性方法相比,本文提出的方法对生存期的预测精度更高,特别是在复杂关系情形下优势更为显著。最后,将该方法应用于胃癌数据分析,利用临床信息和基因表达预测生存期和风险评分。实证结果显示,该方法能为病例基于风险分层的临床精准诊疗方案设计提供有益的参考。