Biologie, médecine et santé > Accueil > Biostatistiques et sciences de la santé > Numéro 1 > Article
Van Trinh Nguyen
INSA Rennes
Jean-François Dupuy
INSA Rennes
Publié le 29 mai 2019 DOI : 10.21494/ISTE.OP.2019.0393
Les modèles de régression à inflation de zéro ont été peu étudiés dans le cas où la variable réponse est censurée. Dans cet article, nous nous intéressons aux propriétés de l’estimateur du maximum de vraisemblance dans les modèles de régression à inflation de zéro de Poisson et négatif binomial, lorsque le comptage d’intérêt est censuré à droite. Ces propriétés sont évaluées au moyen de simulations. Nous discutons également la question de la sélection de variables dans ces modèles. Enfin, nous décrivons une application à un jeu de données relatif à la consommation de soins de santé.
Zero-inflated models for censored and overdispersed count data have received little attention so far, except for the zero-inflated Poisson (ZIP) model which assumes that overdispersion is entirely caused by zero-inflation. When additional overdispersion is present, useful alternatives to ZIP are given by the zero-inflated generalized Poisson (ZIGP) and zero-inflated negative binomial (ZINB) models. This paper investigates properties of the maximum likelihood estimator (MLE) in ZIGP and ZINB regression models when the count response is subject to right-censoring. Simulations are used to examine performance (bias, mean square error, coverage probabilities and standard error calculations) of the MLE. Results suggest that maximum likelihood yields accurate inference. A simple, efficient and easy-to-implement methodology for variable selection is also proposed. It is applicable even when the number of predictors is very large and yields interpretable and sound results. The proposed methods are applied to a dataset of healthcare demand.