%A 刘展 潘莹丽 %T 大数据背景下网络调查样本的建模推断问题研究——以广义Boosted模型的倾向得分推断为例 %0 Journal Article %D 2019 %J 统计研究 %R 10.19343/j.cnki.11-1302/c.2019.09.008 %P 93- %V 36 %N 9 %U {https://tjyj.stats.gov.cn/CN/abstract/article_5259.shtml} %8 2019-09-25 %X 随着大数据和网络的不断发展,网络调查越来越广泛,大部分网络调查样本属于非概率样本,难以采用传统的抽样推断理论进行推断,如何解决网络调查样本的推断问题是大数据背景下网络调查发展的迫切需求。本文首次从建模的角度提出了解决该问题的基本思路:一是入样概率的建模推断,可以考虑构建基于机器学习与变量选择的倾向得分模型来估计入样概率推断总体;二是目标变量的建模推断,可以考虑直接对目标变量建立参数、非参数或半参数超总体模型进行估计;三是入样概率与目标变量的双重建模推断,可以考虑进行倾向得分模型与超总体模型的加权估计与混合推断。最后,以基于广义Boosted模型的入样概率建模推断为例演示了具体解决方法。