摘要: 海量化的数据规模作为大数据的第一个特征,带来计算方面的首要挑战。大规模样本不一定可以完全替代总体,因此大数据分析的算法设计不仅要考虑精简计算成本,还要考虑如何刻画估计结果的不确定性。本文以分治自助算法和子集双重自助算法为例讨论兼具计算效率提升和不确定性评价的可并行计算的大数据统计算法设计,通过比较分析探讨设计思想与未来研究方向。
李扬等. 融合统计思想的大数据算法[J]. 统计研究, 2018, 35(7): 125-128.
Li Yang et al.. Statistical Algorithms for Big Data[J]. Statistical Research, 2018, 35(7): 125-128.