exit

Biologie, médecine et santé   > Accueil   > Biostatistiques et sciences de la santé   > Numéro 1   > Article

Modèles de régression à inflation de zéro et données censurées - application au recours aux soins de santé

Zero-inflated regression models for right-censored counts, with an application to healthcare utilization


Van Trinh Nguyen
INSA Rennes

Jean-François Dupuy
INSA Rennes



Publié le 29 mai 2019   DOI : 10.21494/ISTE.OP.2019.0393

Résumé

Abstract

Mots-clés

Keywords

Les modèles de régression à inflation de zéro ont été peu étudiés dans le cas où la variable réponse est censurée. Dans cet article, nous nous intéressons aux propriétés de l’estimateur du maximum de vraisemblance dans les modèles de régression à inflation de zéro de Poisson et négatif binomial, lorsque le comptage d’intérêt est censuré à droite. Ces propriétés sont évaluées au moyen de simulations. Nous discutons également la question de la sélection de variables dans ces modèles. Enfin, nous décrivons une application à un jeu de données relatif à la consommation de soins de santé.

Zero-inflated models for censored and overdispersed count data have received little attention so far, except for the zero-inflated Poisson (ZIP) model which assumes that overdispersion is entirely caused by zero-inflation. When additional overdispersion is present, useful alternatives to ZIP are given by the zero-inflated generalized Poisson (ZIGP) and zero-inflated negative binomial (ZINB) models. This paper investigates properties of the maximum likelihood estimator (MLE) in ZIGP and ZINB regression models when the count response is subject to right-censoring. Simulations are used to examine performance (bias, mean square error, coverage probabilities and standard error calculations) of the MLE. Results suggest that maximum likelihood yields accurate inference. A simple, efficient and easy-to-implement methodology for variable selection is also proposed. It is applicable even when the number of predictors is very large and yields interpretable and sound results. The proposed methods are applied to a dataset of healthcare demand.

Excès de zéros maximum de vraisemblance simulations

Excess of zeros maximum likelihood simulations