Estimación de datos perdidos por máxima verosimilitud en patrones "missing" aleatorios (mar) y completamente aleatorios (mcar) en modelos estructurales
- Hernández Cabrera, Juan Andrés
- Ramírez Santana, Gustavo Mario
- San Luis Costas, Concepción
ISSN: 0214-9915
Year of publication: 1997
Volume: 9
Issue: 1
Pages: 187-197
Type: Article
More publications in: Psicothema
Abstract
En las investigaciones del campo aplicado con técnicas multivariadas es muy frecuente encontrar matrices de datos con valores perdidos. Las estrategias más comúnmente utilizadas para reconducir este problema, utilizan los métodos listwise, pairwise y los de estimación de máxima verosimilitud. En este articulo se demuestra mediante las técnicas de simulación de Monte Carlo en el ámbito de los modelos estructurales, que independientemente del patrón de missing simulado (missing completamente aleatorio, monotónico o condicional) la estimación mediante el algoritmo de máxima verosimilitud EM arroja los mejores resultados, en cuanto a la precisión de la estimación de los parámetros de los modelos, disminución de los errores típicos, y la posibilidad de encontrar soluciones adecuadas y convergentes en aquellos patrones de missing donde las estrategias MCAR (listwise y pairwise) son imposibles de utilizar.
Bibliographic References
- Allison, P.D. (1987). Estimation of linear models with incomplete data. In C.C. Clogg, ed., Sociological Methodology, 1987. Washington, D.C.: American Sociological Association, (pp. 71-103).
- Aptech Systems, Inc (1995). Gauss. The Gauss System Version 3.2. Washington.
- Baker, L.A. and Fulker, D.W. (1983). Incomplete covariance matrices and LISREL. Data Lanalyst, 1, 3-5.
- Browne, M.W. (1984). Asymptotically distribution-free methods for the analysis of covariance structures. British Journal of Mathematical and Statistical Psychology, 7, 62-83.
- Dempsted, A.P, Laird, N.M. and Rubin, D.B. (1977). Maximun likelihood from incomplete data via the EM algorithm. Journal of the American Statistical Association, 81, 29-41
- Dixon, W.J., ed. (1988). BMDP Statistical Software, Los Angeles: University of California Press.
- Fleishman, A.(1978). A method for simulating non-normal distributions. Psychometrika, 43, 4, 521-531.
- Hernández, J.; San Luis, C. y Sanchez, J. (1995). Un programa GAUSS para simular distribuciones no normales multivariadas. Psicothema, 7, 427-434.
- Hernández, J. Ramírez, G. & Sánchez, A, (1995). A High-level language program to obtain the Bootstrap corrected Adf test statistic. Behavior Research Methods Instruments, & Computer. (En prensa).
- Lee, S.Y, (1986). Estimation for structural equation models with missing data. Psychometrika, 51, 93-99.
- Little, R.J.A. and Rubin, D.B. (1987). Statistical Analysis with Missing Data, New York: Wiley.
- Little, R.J.A. and Schenker, N. (1995). Missing Data. Handbook of Statistical Modeling for the Social and Behavioral Sciences (pp 39-75), New York: Arminger, Clifford, Clogg and Sobel. Plenum Press.
- Little, R.J.A. and Smith, P.J. (1987). Editing and imputation for quantitative survey data. Journal of the American Statistical Association, 82, 58-68.
- Orchad, T. and Woodbury, M.A.(1972). A missing information principle: theory and applications, Proceedings of the Sixth Berkeley Symposium on Mathematical Statistics and Probability, 1, 697-715.
- Rubin, (1976). Inference and missing data. Biometrika, 70, 41-55.
- Rubin, D.B. and Schenker, N. (1986). Multiple imputation for interval estimation from simple random samples with ignorable nonresponse. Journal of the American Statistical Association, 81, 366-374.
- Rubin, D.B. and Schenker, N. (1987). Interval estimation from multiply-imputed data: A case study using census agriculture industry codes. Journal of Official Statistics, 3, 375-387.
- Schoenberg, R. (1988), MISS: A Program for Missing Data, in GAUSS Programming Language, Aptech Systems Inc., P.O. Box 6487, Kent, WA 98064.
- Vale, D., & Maurelli, V. (1983). Simulating multivariate nonnormal distributions. Psychometrika, 48, 3, 465-471.