Utilizza questo identificativo per citare o creare un link a questo documento:
http://elea.unisa.it/xmlui/handle/10556/3016
Titolo: | High-dimensional statistics for complex data |
Autore: | Destefanis, Sergio Pietro Giordano, Francesco Pacella, Massimo |
Parole chiave: | High-dimensional data;Variable selection;Spatio-temporal models |
Data: | 29-mag-2018 |
Abstract: | L'analisi dei dati ad alta dimensione è diventata negli ultimi anni un argomento di ricerca popolare,
a causa dell'emergere di svariate applicazioni in diversi campi scientifici in cui si rende necessario
lavorare con enormi set di dati. Una delle sfide principali nell'analisi dei dati ad alta dimensione
riguarda l'interpretabilità dei modelli stimati e l'efficienza computazionale delle procedure adottate.
Tale scopo può essere raggiunto attraverso l'identificazione di variabili rilevanti che influenzano
realmente il fenomeno di interesse, in tal modo è possibile costruire modelli di facile interpretabilità
ed utilità nel risolvere problemi pratici.
I primi tre capitoli della tesi sono dedicati allo studio della selezione di variabili in contesti di dati
ad alta dimensionalità. Nella prima parte è riportata una breve ed esauriente rassegna sulle
principali tecniche di selezione per modelli non parametrici. Infine, nel capitolo 3 viene presentata
una proposta di ricerca riguardante un approccio di screening per modelli non additivi sviluppato
utilizzando informazione condizionata nella procedura di selezione.
Diversamente, la seconda parte della tesi tratta dei modelli spazio-temporali sempre in contesto di
dati ad alta dimensione. Nell'ultimo decennio, una particolare classe di tali modelli ha subito un
rapido sviluppo, essi sono definiti Spatial Dynamic Panel Data models (SDPD). Sono state
proposte diverse versioni dei modelli SDPD, basate su diverse ipotesi dei parametri del modello e
sulle diverse proprietà degli stimatori. La versione standard ha i parametri di regressione costanti
rispetto alle unità spaziali, mentre di recente, ne è stata proposta una generalizzazione in cui i
parametri risultano adattativi rispetto alle unità spaziali. Tale assunzione è motivata da evidenze
pratiche ed empiriche, da cui risulta chiaro che, considerare una parametrizzazione costante rispetto
alle singole unità può risultare limitante. Il capitolo 4 è dedicato alla rassegna sulle caratteristiche
principali di tale classe di modelli, mentre nel capitolo 5 viene proposta una strategia di testing per
identificare la struttura del modello SDPD. Tale procedura di multiple testing consente di scegliere
tra la versione del modello con parametri adattativi e altre caratterizzazioni derivate imponendo
particolari vincoli sui parametri. Il test multiplo viene eseguito in alta dimensionalità mediante
tecnica alla Bonferroni e la distribuzione della statistica test è derivata attraverso uno schema di
ricampionamento bootstrap. [a cura dell'Autore] High dimensional data analysis has become a popular research topic in the recent years, due to the emergence of various new applications in several fields of sciences underscoring the need for analysing massive data sets. One of the main challenge in analysing high dimensional data regards the interpretability of estimated models as well as the computational efficiency of procedures adopted. Such a purpose can be achieved through the identification of relevant variables that really affect the phenomenon of interest, so that effective models can be subsequently constructed and applied to solve practical problems. The first two chapters of the thesis are devoted in studying high dimensional statistics for variable selection. We firstly introduce a short but exhaustive review on the main developed techniques for the general problem of variable selection using nonparametric statistics. Lastly in chapter 3 we will present our proposal regarding a feature screening approach for non additive models developed by using of conditional information in the estimation procedure. Differently, the second part of the thesis focuses on the spatio-temporal models in high dimensional contexts. Over the last decade, a particular class of spatio-temporal models has been rapidly developed, the spatial dynamic panel data models (SDPD). Several versions of the SDPD model have been proposed, based on different assumptions on the spatial parameters and different properties of the estimators. The standard version of the model assumes the spatial parameters constant over location, meanwhile another recently proposed version assumes the spatial parameters are adaptive over location. The assumption of different scalar coefficients is motivated by practical situations, in which empirical evidence shows how considering constant effect for each location can be limiting. While chapter 4 is devoted to introduce principal elements of spatio-temporal models in statistical and econometric frameworks, in chapter 5 we propose a strategy for testing the particular structure of SDPD model, by means of a multiple testing procedure that allows choosing between the version of the model with adaptive spatial parameters and some specific versions derived from the general one by imposing particular constraints on the parameters. The multiple test is made in high dimensional setting by the Bonferroni technique and the distribution of the multiple test statistic is derived by a residual bootstrap resampling scheme. [edited by Author] |
Descrizione: | 2016 - 2017 |
URI: | http://hdl.handle.net/10556/3016 http://dx.doi.org/10.14273/unisa-1306 |
È visualizzato nelle collezioni: | Economia e politiche dei mercati e delle imprese |
File in questo documento:
File | Descrizione | Dimensioni | Formato | |
---|---|---|---|---|
tesi_di_dottorato_M_Pacella.pdf | tesi di dottorato | 819,56 kB | Adobe PDF | Visualizza/apri |
abstract in inglese M. Pacella.pdf | abstract in inglese a cura dell'autore | 32,08 kB | Adobe PDF | Visualizza/apri |
abstract in italiano M. Pacella.pdf | abstract in italiano a cura dell'autore | 38,16 kB | Adobe PDF | Visualizza/apri |
Tutti i documenti archiviati in DSpace sono protetti da copyright. Tutti i diritti riservati.