Сравнительный анализ методов оценки среднего причинного эффекта в регрессионном моделировании на основе синтетических выборок
УДК 519.6; 004.67
Аннотация
В работе рассматриваются результаты сравнительного анализа методов оценки причинного эффекта (АТЕ) на основе t-теста, линейной регрессии и техники матчинга данных (ближайший сосед, полное соответствие и подклассификация). Выполнена генерация синтетических выборок варьируемого объема от 250 до 1000, различных пропорций в распределении данных на экспериментальную и контрольную группы (50/50, 70/20, 90/10). Генерация данных осуществлена при предположении о нормальном, экспоненциальном и логарифмическом распределении предикторов. Для оценки точности метода используется метрика погрешности МАРЕ. Результаты численного эксперимента показали, что методы сравнения средних и линейной регрессии приводят к недооценке или переоценке АТЕ, а метод полного матчинга (Full Matching) обеспечивает более точные результаты независимо от формы распределения данных. Выявлено, что сбалансированность и больший объем выборок позволяют получить более точные оценки АТЕ. Полученные результаты могут использоваться для подбора и обоснования метода оценки причинных эффектов в случае наличия прямого вмешательства бинарного характера и с учетом нелинейности действия одного из влияющих факторов.
Скачивания
Литература
Rubin D.B. Teaching statistical Inference for causal effects in experiments and Observational studies // Journal of Educational and Behavioral Statistics. 2004. № 29 (3). Р. 343-367.
King G., Lucas C, Nielsen R.A. The Balance-Sample Size Frontier in Matching Metho ds for Causal Inference // American journal of political science. 2016. № 61 (2). P. 1-17.
Rubin D.B. Causal Inference Using Potential Outcomes // Journal of the American Statistical Association. 2011. Vol. 469. No 100. P. 322-331.
Holland PW. Statistics and Causal Inference // Journal of the American Statistical Association. 1986. Т. 81. № 396. P. 945-960.
Френкель А.А., Сурков А.А. Определение весовых коэффициентов при объединении прогнозов // Вопросы статистики. 2017. № 12.С. 3-15.
Rosenbaum PR. The Central Role of the Propensity Score in Observational Studies for Causal Effects // Biometrika. 1983. Vol. 70. № 1. P 41-55.
Rubin D.B. Matching to Remove Bias in Observational Studies // Biometrics. 1967. № 29. P 159-184.
Ming K., Rosenbaum PR. Substantial Gains in Bias Reduction from Matching with a Variable Number of Controls // Biometrics. 2000. № 56. Р 118-124.
Rosenbaum PR., Rubin D.B. Reducing Bias in Observational Studies Using Subclassification on the Propensity Score // Journal of the American Statistical Association. 1984. № 79. P 516-524.
Abdi M.A. Novel Approach for Off-Line Arabic Writer Identification Based on Stroke Feature Combination // 24th International Symposium on Computer Information Science, IEEE. 2009. P. 597-600.
Diamond A. Genetic Matching for Estimating Causal Effects: A General Multivariate Matching Method for Achieving Balance in Observational Studies // Review of Economics and Statistics. 2013. Vol. 95. № 3. P. 932-945.
Ho D.E., Imai K., King G., Stuart E.A. Matchit: Non-parametric Preprocessing for Parametric Causal Inference. Software for Using Matching Methods in R // Journal of Statistical Software. 2011. № 42 (8) P 1-28.
Copyright (c) 2026 Анастасия Павловна Боронкина, Елена Владимировна Понькина, Салтанат Сайларбековна Адиканова

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.



