Due to the constantly growing interest toward environment protection, the amount of available data concerning environmental monitoring is increasing. As the size and complexity of environmental datasets continue to grow, there is a wide variety of possibility for implementation of data science in the environmental sciences field. The focus of the present PhD work is the resolution different hydrogeological issues by means of data science. More specifically, the present PhD project aims at identifying and applying data-driven techniques suitable for hydrogeological datasets, based on the structure of the problem and the available data and on site-specific conditions. In the scope of this PhD work two main hydrological problems were addressed parallelly, concerning the two main aspects of groundwater resource management: a) groundwater quality and b) groundwater quantity. Each task was tackled in two successive phases. The first phase consisted in an exploratory analysis of the available data, aimed at reaching a better understanding of the system, the problem and the available information. The second phase involved the application of specific data driven techniques to investigate their effectiveness in the hydrogeological field. The groundwater quality data analysis involves the application of multivariate techniques, normally used for the source apportionment, to a dataset concerning chemical data of surface water and groundwater aiming at determining their effectiveness in identifying the phenomena that contribute to the concentration of several compounds in a sample. In this task Factor Analysis, Cluster Analysis and Positive Matrix Factorization were implemented. As regards the groundwater quantity, the analysis of groundwater level time series uses models able to reconstruct historical data and applicable to forecast scenarios; in this task autocorrelation, partial autocorrelation and impulse response were used and linear and nonlinear neural networks models
A causa del crescente interesse per la protezione dell’ambiente, sta aumentando la quantità di dati disponibili relativi al monitoraggio ambientale. Man mano che le dimensioni e la complessità dei data set ambientali continuano a crescere, si apre un sempre più ampio ventaglio di possibilità per l'implementazione di data science nel campo delle scienze ambientali. Il focus del presente progetto di dottorato è la risoluzione di diverse problematiche idrogeologiche tramite tecniche data-driven. Più specificatamente, il presente progetto di dottorato mira a identificare e applicare tecniche data-driven adatte a dataset idrogeologici, in base alla struttura del problema e dei dati disponibili e alle condizioni sito specifiche. Nell'ambito del presente progetto di dottorato due problemi idrologici principali sono stati affrontati parallelamente, riguardanti i due aspetti principali della gestione delle risorse sotterranee: a) la qualità delle acque sotterranee e b) la quantità delle acque sotterranee. Ognuno di questi due task è stato affrontato in due fasi successive. La prima fase consiste in un'analisi esplorativa dei dati disponibili, volta a raggiungere una migliore comprensione del sistema, del problema e delle informazioni disponibili. La seconda fase consiste nell’uso di tecniche data - driven per indagare sulla loro efficacia in campo idrogeologico. L'analisi dei dati sulla qualità delle acque sotterranee comporta l'applicazione di tecniche di analisi statistica multivariata, normalmente utilizzate per l’identificazione delle sorgenti, a un dataset relativo ai dati chimici di acque superficiali e sotterranee. Lo scopo di questo task è determinare l’efficacia di queste tecniche nell'identificare i fenomeni che contribuiscono alla concentrazione di diversi composti in un campione. Nell’ambito di questo task sono state implementate Factor Analysis, Cluster Analysis e Positive Matrix Factorization. Per quanto riguarda la quantità delle risorse idriche sotterranee, l'analisi delle serie temporali di livelli piezometrici si basa su modelli in grado di ricostruire dati storici ed elaborare scenari futuri; in questo task sono state utilizzate autocorrelazione, autocorrelazione parziale e impulse response e sono stati sviluppati modelli lineari e non lineari (reti neurali). Questo lavoro ha evidenziato che le tecniche data-driven possono essere considerate uno strumento utile a supporto della gestione delle risorse idriche sotterranee.
(2020). DATA DRIVEN APPROACH TO DEAL WITH DIFFERENT HYDROGEOLOGICAL ISSUES. (Tesi di dottorato, Università degli Studi di Milano-Bicocca, 2020).
DATA DRIVEN APPROACH TO DEAL WITH DIFFERENT HYDROGEOLOGICAL ISSUES
ZANOTTI, CHIARA
2020
Abstract
Due to the constantly growing interest toward environment protection, the amount of available data concerning environmental monitoring is increasing. As the size and complexity of environmental datasets continue to grow, there is a wide variety of possibility for implementation of data science in the environmental sciences field. The focus of the present PhD work is the resolution different hydrogeological issues by means of data science. More specifically, the present PhD project aims at identifying and applying data-driven techniques suitable for hydrogeological datasets, based on the structure of the problem and the available data and on site-specific conditions. In the scope of this PhD work two main hydrological problems were addressed parallelly, concerning the two main aspects of groundwater resource management: a) groundwater quality and b) groundwater quantity. Each task was tackled in two successive phases. The first phase consisted in an exploratory analysis of the available data, aimed at reaching a better understanding of the system, the problem and the available information. The second phase involved the application of specific data driven techniques to investigate their effectiveness in the hydrogeological field. The groundwater quality data analysis involves the application of multivariate techniques, normally used for the source apportionment, to a dataset concerning chemical data of surface water and groundwater aiming at determining their effectiveness in identifying the phenomena that contribute to the concentration of several compounds in a sample. In this task Factor Analysis, Cluster Analysis and Positive Matrix Factorization were implemented. As regards the groundwater quantity, the analysis of groundwater level time series uses models able to reconstruct historical data and applicable to forecast scenarios; in this task autocorrelation, partial autocorrelation and impulse response were used and linear and nonlinear neural networks modelsFile | Dimensione | Formato | |
---|---|---|---|
phd_unimib_717614.pdf
accesso aperto
Descrizione: tesi di dottorato
Dimensione
4.24 MB
Formato
Adobe PDF
|
4.24 MB | Adobe PDF | Visualizza/Apri |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.