Utilizza questo identificativo per citare o creare un link a questo documento: http://elea.unisa.it/xmlui/handle/10556/3016
Titolo: High-dimensional statistics for complex data
Autore: Destefanis, Sergio Pietro
Giordano, Francesco
Pacella, Massimo
Parole chiave: High-dimensional data;Variable selection;Spatio-temporal models
Data: 29-mag-2018
Abstract: L'analisi dei dati ad alta dimensione è diventata negli ultimi anni un argomento di ricerca popolare, a causa dell'emergere di svariate applicazioni in diversi campi scientifici in cui si rende necessario lavorare con enormi set di dati. Una delle sfide principali nell'analisi dei dati ad alta dimensione riguarda l'interpretabilità dei modelli stimati e l'efficienza computazionale delle procedure adottate. Tale scopo può essere raggiunto attraverso l'identificazione di variabili rilevanti che influenzano realmente il fenomeno di interesse, in tal modo è possibile costruire modelli di facile interpretabilità ed utilità nel risolvere problemi pratici. I primi tre capitoli della tesi sono dedicati allo studio della selezione di variabili in contesti di dati ad alta dimensionalità. Nella prima parte è riportata una breve ed esauriente rassegna sulle principali tecniche di selezione per modelli non parametrici. Infine, nel capitolo 3 viene presentata una proposta di ricerca riguardante un approccio di screening per modelli non additivi sviluppato utilizzando informazione condizionata nella procedura di selezione. Diversamente, la seconda parte della tesi tratta dei modelli spazio-temporali sempre in contesto di dati ad alta dimensione. Nell'ultimo decennio, una particolare classe di tali modelli ha subito un rapido sviluppo, essi sono definiti Spatial Dynamic Panel Data models (SDPD). Sono state proposte diverse versioni dei modelli SDPD, basate su diverse ipotesi dei parametri del modello e sulle diverse proprietà degli stimatori. La versione standard ha i parametri di regressione costanti rispetto alle unità spaziali, mentre di recente, ne è stata proposta una generalizzazione in cui i parametri risultano adattativi rispetto alle unità spaziali. Tale assunzione è motivata da evidenze pratiche ed empiriche, da cui risulta chiaro che, considerare una parametrizzazione costante rispetto alle singole unità può risultare limitante. Il capitolo 4 è dedicato alla rassegna sulle caratteristiche principali di tale classe di modelli, mentre nel capitolo 5 viene proposta una strategia di testing per identificare la struttura del modello SDPD. Tale procedura di multiple testing consente di scegliere tra la versione del modello con parametri adattativi e altre caratterizzazioni derivate imponendo particolari vincoli sui parametri. Il test multiplo viene eseguito in alta dimensionalità mediante tecnica alla Bonferroni e la distribuzione della statistica test è derivata attraverso uno schema di ricampionamento bootstrap. [a cura dell'Autore]
High dimensional data analysis has become a popular research topic in the recent years, due to the emergence of various new applications in several fields of sciences underscoring the need for analysing massive data sets. One of the main challenge in analysing high dimensional data regards the interpretability of estimated models as well as the computational efficiency of procedures adopted. Such a purpose can be achieved through the identification of relevant variables that really affect the phenomenon of interest, so that effective models can be subsequently constructed and applied to solve practical problems. The first two chapters of the thesis are devoted in studying high dimensional statistics for variable selection. We firstly introduce a short but exhaustive review on the main developed techniques for the general problem of variable selection using nonparametric statistics. Lastly in chapter 3 we will present our proposal regarding a feature screening approach for non additive models developed by using of conditional information in the estimation procedure. Differently, the second part of the thesis focuses on the spatio-temporal models in high dimensional contexts. Over the last decade, a particular class of spatio-temporal models has been rapidly developed, the spatial dynamic panel data models (SDPD). Several versions of the SDPD model have been proposed, based on different assumptions on the spatial parameters and different properties of the estimators. The standard version of the model assumes the spatial parameters constant over location, meanwhile another recently proposed version assumes the spatial parameters are adaptive over location. The assumption of different scalar coefficients is motivated by practical situations, in which empirical evidence shows how considering constant effect for each location can be limiting. While chapter 4 is devoted to introduce principal elements of spatio-temporal models in statistical and econometric frameworks, in chapter 5 we propose a strategy for testing the particular structure of SDPD model, by means of a multiple testing procedure that allows choosing between the version of the model with adaptive spatial parameters and some specific versions derived from the general one by imposing particular constraints on the parameters. The multiple test is made in high dimensional setting by the Bonferroni technique and the distribution of the multiple test statistic is derived by a residual bootstrap resampling scheme. [edited by Author]
Descrizione: 2016 - 2017
URI: http://hdl.handle.net/10556/3016
http://dx.doi.org/10.14273/unisa-1306
È visualizzato nelle collezioni:Economia e politiche dei mercati e delle imprese

File in questo documento:
File Descrizione DimensioniFormato 
tesi_di_dottorato_M_Pacella.pdftesi di dottorato819,56 kBAdobe PDFVisualizza/apri
abstract in inglese M. Pacella.pdfabstract in inglese a cura dell'autore32,08 kBAdobe PDFVisualizza/apri
abstract in italiano M. Pacella.pdfabstract in italiano a cura dell'autore38,16 kBAdobe PDFVisualizza/apri


Tutti i documenti archiviati in DSpace sono protetti da copyright. Tutti i diritti riservati.