Abstract Cluster-Weighted Models are a wide family of mixture distributions for modeling the joint probability of data coming from a heterogeneous population, and includes mixtures of distributions and mixtures of regressions as special cases. Unfortunately, they suffer from non-regular maximum likelihood issues, due to possible spikes and unboundedness in the target function. We propose an improved version of the Gaussian Cluster-Weighted estimation methodology, by trimming a portion α of the data and imposing constraints to the estimated variances. Trimming provides robustness properties to the estimators and constraints move the maximization problem to a well-posed setting and allow to avoid spurious solutions, i.e. fitting a small localized random pattern in the data rather than a proper underlying cluster structure. Theoretical results are illustrated using a few empirical studies

I modelli Cluster Weighted sono una ampia famiglia di misture che comprendono, come casi particolari, le misture di distribuzioni e di regressione e consentono di modellizzare dati eterogenei. Per questi modelli si osservano problemi di non regolarità della funzione di verosimiglianza, che può essere illimitata e avere spikes. In questo lavoro si introduce un nuovo metodo di stima del Cluster Weighted Gaussiano, che consente di eliminare una porzione α di dati contaminati e di imporre vincoli alla stima delle matrici di covarianza. Le proprietà di robustezza degli stimatori sono assicurate dall’eliminazione degli outliers, e la stima vincolata fa sì che il problema di massimizzazione sia ben posto e riduce le soluzioni spurie, ovvero l’adattarsi del modello ad un piccolo raggruppamento casuale di dati invece che ad una vera e propria componente della mistura. I risultati teorici sono illustrati anche mediante alcune analisi empiriche

Garcìa-Escudero, L., Greselin, F., Gordaliza, A., Mayo-Iscar, A., Ingrassia, S. (2015). An adaptive method to robustify ML estimation in Cluster Weighted Modeling. In S. Cabras, T. Di Battista, W. Racugno (a cura di), Proceedings of the 47th SIS Scientific Meeting of the Italian Statistica Society (pp. 1-6). Cagliari : CUEC Cooperativa Universitaria Editrice Cagliaritana.

An adaptive method to robustify ML estimation in Cluster Weighted Modeling

Greselin, F;
2015

Abstract

Abstract Cluster-Weighted Models are a wide family of mixture distributions for modeling the joint probability of data coming from a heterogeneous population, and includes mixtures of distributions and mixtures of regressions as special cases. Unfortunately, they suffer from non-regular maximum likelihood issues, due to possible spikes and unboundedness in the target function. We propose an improved version of the Gaussian Cluster-Weighted estimation methodology, by trimming a portion α of the data and imposing constraints to the estimated variances. Trimming provides robustness properties to the estimators and constraints move the maximization problem to a well-posed setting and allow to avoid spurious solutions, i.e. fitting a small localized random pattern in the data rather than a proper underlying cluster structure. Theoretical results are illustrated using a few empirical studies
Capitolo o saggio
Cluster-Weighted Models; mixtures of regression; trimming; Robust estimation; concentration steps; constrained estimation
English
Proceedings of the 47th SIS Scientific Meeting of the Italian Statistica Society
Cabras, S; Di Battista, T; Racugno, W
2015
978-88-8467-874-4
CUEC Cooperativa Universitaria Editrice Cagliaritana
1
6
Garcìa-Escudero, L., Greselin, F., Gordaliza, A., Mayo-Iscar, A., Ingrassia, S. (2015). An adaptive method to robustify ML estimation in Cluster Weighted Modeling. In S. Cabras, T. Di Battista, W. Racugno (a cura di), Proceedings of the 47th SIS Scientific Meeting of the Italian Statistica Society (pp. 1-6). Cagliari : CUEC Cooperativa Universitaria Editrice Cagliaritana.
open
File in questo prodotto:
File Dimensione Formato  
GGGIM SIS 2014 An adaptive method to robustify ML estimation in Cluster Weighted Modeling.pdf

accesso aperto

Dimensione 902.19 kB
Formato Adobe PDF
902.19 kB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10281/52376
Citazioni
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
Social impact