exit

Biology, Medicine and Health   > Home   > Biostatistics and Health Sciences   > Issue 1   > Article

Zero-inflated regression models for right-censored counts, with an application to healthcare utilization

Modèles de régression à inflation de zéro et données censurées - application au recours aux soins de santé


Van Trinh Nguyen
INSA Rennes

Jean-François Dupuy
INSA Rennes



Published on 29 May 2019   DOI : 10.21494/ISTE.OP.2019.0393

Abstract

Résumé

Keywords

Mots-clés

Zero-inflated models for censored and overdispersed count data have received little attention so far, except for the zero-inflated Poisson (ZIP) model which assumes that overdispersion is entirely caused by zero-inflation. When additional overdispersion is present, useful alternatives to ZIP are given by the zero-inflated generalized Poisson (ZIGP) and zero-inflated negative binomial (ZINB) models. This paper investigates properties of the maximum likelihood estimator (MLE) in ZIGP and ZINB regression models when the count response is subject to right-censoring. Simulations are used to examine performance (bias, mean square error, coverage probabilities and standard error calculations) of the MLE. Results suggest that maximum likelihood yields accurate inference. A simple, efficient and easy-to-implement methodology for variable selection is also proposed. It is applicable even when the number of predictors is very large and yields interpretable and sound results. The proposed methods are applied to a dataset of healthcare demand.

Les modèles de régression à inflation de zéro ont été peu étudiés dans le cas où la variable réponse est censurée. Dans cet article, nous nous intéressons aux propriétés de l’estimateur du maximum de vraisemblance dans les modèles de régression à inflation de zéro de Poisson et négatif binomial, lorsque le comptage d’intérêt est censuré à droite. Ces propriétés sont évaluées au moyen de simulations. Nous discutons également la question de la sélection de variables dans ces modèles. Enfin, nous décrivons une application à un jeu de données relatif à la consommation de soins de santé.

Excess of zeros maximum likelihood simulations

Excès de zéros maximum de vraisemblance simulations