随着数据收集能力的提升和控制手段的复杂化,在实际业务中,常常会遇到对多维、异质化的处置效应(treatment effect)的估计问题。近年来,学界在这个方向上提出了一些新的方法和工具;其中一个较为知名的工作是Susan Athey等人提出的generalized random forest(grf)。不过,这些工具与当前业界常用的工具(例如XGBoost,下称为xgb)存在一定差距:
- 未针对大规模数据场景进行计算效率优化,训练和推断时间较长;
- 功能局限于少数几种场景,无法支持多样化的建模需求;
- 设计时主要考虑离线分析场景,缺乏对线上部署等工程应用场景的原生支持。
考虑到这些痛点,在这一篇文章中,我将基于对这些新估计方法的认识和对xgb等常用工具的理解,提出(或者是重新发现)数种处置效应估计方法,以尝试结合xgb的计算效率和新方法的估计准确性。然后,我将通过一系列简单的数值实验,对这些方法在估计准确性、计算效率和开发效率等各方面的优劣进行评估。最后,我将根据这些实验结果和个人经验,对这些方法的实际使用给出一些个人建议。