Metodi fisico matematici avanzati per l’implementazione di modelli previsionali applicabili a fenomeni acustici e di interesse ingegneristico
Abstract
In several engineering fields, it is of great interest the development of models able to produce forecasts of univariate time series; these models are based on the statistical analysis of the sequence of observed data equidistant in time. The techniques implemented in this thesis can be classified in two distinct types, different but complementary: the first method is based on the analysis of the observed time series composed by measurements under study, the other method is based on Poisson's distributions for events of exceedance of a defined threshold.
The validity of such models has been tested on a noise dataset collected in the city of Messina. The measurements are based on day and night noise levels, detected at a monitoring station set up by the local government and made public on a special web platform. From this set of data, several intervals have been extracted for the calibration of the models, in order to test the validity on real measurements (by means of comparison between the observed and predicted data) and to study the sensitivity with respect to variation of the parameters (reference threshold, frequency of events, periodicity of the series, etc.).
The first adopted techniques, used to analyse the time series, are based on deterministic decomposition methods: the observed sequences are divided in trend and seasonal components. In this field, an enhancement of the preliminary forecasting model has been obtained: in particular, a set of electricity consumption data has been studied. This time series of absorbed electricity is due to the public transport system of the city of Sofia (Bulgaria): the main enhancement achieved is the improving of the extracted information from the series thanks to the introduction of an additional coefficient of seasonality.
Later, seasonal stochastic models were adopted, of the auto-regressive moving average (SARIMA) type. Therefore, the research focused on the implementation of predictive models of stochastic type: the seasonal ARIMA was applied to the prediction of wind speed in a site where a wind farm for the production of electricity is installed. Subsequently, acoustical models have been applied for the prediction of noise produced by the turbines under certain wind speed conditions.
A detailed investigation was performed with the aim to improve the integration of linear and non-linear forecasting techniques using artificial neural networks. In particular, one of the more advanced predictive model based on time series analysis is a hybrid model that uses in cascade deterministic methods, based on the decomposition of the series into trend and seasonal components, followed by a modelling via artificial neural networks for a better prediction of the non-linear part of the series.
A predictive model, useful to study events of exceedance of noise thresholds, has also been implemented. This model is based on the assumption that the exceedance events are distributed according to a nonhomogeneous Poisson distribution. This approach can be pursued both with frequentist techniques or using Bayesian estimation of the parameters of the "Probability Density Function" (PDF). In particular, it has been studied a sound levels dataset measured near the international airport of Nice (France). The adopted model introduces the single "change-point" methodology for the estimation of the distribution parameters. These parameters have been estimated through a Markov-Chain Monte-Carlo sampling based on Bayesian statistical assumptions. [edited by author] In diversi ambiti ingegneristici risulta di grande interesse lo sviluppo di modelli atti a produrre previsioni di serie storiche univariate mediante l’analisi della successione di dati osservati equidistanti nel tempo. Le tecniche implementate nel presente lavoro di tesi possono essere classificate in due distinte tipologie, differenti ma complementari: una basata sull’analisi delle serie storiche delle misure di interesse, l’altra su distribuzioni di Poisson per gli eventi di superamento di una soglia stabilita. La validità di siffatti modelli è stata testata su un set di dati di rumore raccolti nella città di Messina. Le misurazioni si riferiscono a livelli acustici diurni e notturni, rilevati presso una stazione di monitoraggio predisposta dall’amministrazione locale e resi pubblici su apposita piattaforma web. Da questo set di dati, sono stati estratti diversi intervalli per la calibrazione dei modelli, al fine di testarne la validità su misurazioni reali (mediante confronto tra dato osservato e dato previsto) e di studiare la sensibilità rispetto alla variazione dei parametri (soglia di riferimento, frequenza degli eventi, periodicità, ecc.). Per l’analisi delle serie storiche sono state sviluppate tecniche classiche basate sulla decomposizione deterministica nelle componenti di trend e stagionali di una sequenza di dati osservata. Si è in seguito ottenuto un potenziamento del modello di previsione e analisi delle serie storiche: in particolare si è analizzato un set di dati di assorbimento di energia elettrica dovuto al sistema di trasporto pubblico della città di Sofia, migliorando l’estrazione di informazioni dalla serie e le prestazioni grazie all’introduzione di un ulteriore coefficiente di stagionalità. Successivamente sono stati adottati modelli stocastici stagionali auto-regressivi a media mobile (SARIMA); dunque ci si è concentrati sull’implementazione di modelli previsionali stocastici del tipo Seasonal ARIMA applicati alla previsione della velocità del vento in un sito dove è installato un impianto per la produzione elettrica mediante aerogeneratori. In seguito si sono applicati modelli per la previsione dell’inquinamento acustico prodotto dal parco eolico investito da vento ad una certa velocità. Si è inoltre migliorata l’integrazione di tecniche previsionali lineari e non lineari mediante reti neurali artificiali; in particolare lo stato dell’arte per i modelli previsionali basati sull’analisi di serie storiche si è raggiunto con un modello ibrido basato sull’utilizzo in cascata di metodi classici deterministici basati sulla scomposizione della serie in componenti di trend e stagionalità seguiti da modellazione tramite reti neurali artificiali per una migliore previsione della parte non lineare della serie. È stato inoltre implementato un modello di previsione per eventi di superamento di soglie di inquinamento acustico. Tale modello è basato sull’assunzione che gli eventi di superamento sono distribuiti secondo una distribuzione di Poisson non omogenea. Questo approccio può essere a sua volta perseguito con tecniche frequentiste o bayesiane per la stima dei parametri della “Probability Density Function” (PDF). In particolare è stato studiato un dataset di misurazioni fonometriche acquisite in prossimità dell’aeroporto internazionale di Nizza (Francia): il modello previsionale realizzato prevede l’introduzione della metodologia “change-point” singolo per la stima dei parametri della distribuzione. Tali parametri sono stati stimati grazie al campionamento Monte-Carlo Markov-Chain basato su assunzioni di statistica bayesiana. Infine si è studiato un potenziamento di questo modello previsionale applicandolo al set di dati di rumore acustico misurati nella città di Messina: tale serie storica è stata prima ricostruita integralmente tramite le tecniche previsionali studiate in precedenza e dopo si è applicato il modello bayesiano basato sulla distribuzione di Poisson utilizzando “change-points” multipli. [a cura dell'autore]