Metagenomic approaches have changed the way to study biology and biodiversity in several fields. In particular, technology advancement enables us to determine taxa composition and to study complex biodiversity patterns in very different environments. Nowadays, DNA metabarcoding is a standard procedure, applied on a wide range of fields, from human health to ecology, to industry applications. In the last few years, 16S rRNA metabarcoding was widely used to study the bacterial community, leading to routine analysis which created huge amounts of data, bringing researchers to develop data mining strategies in order to answer complex biological questions. On the other hand, DNA metabarcoding can be applied also to study Plants, Animals or Fungi, as very different molecular markers have been identified. In both cases, considering the huge amount of data produced by researchers and available in repositories, a data-driven perspective in managing and exploring DNA metabarcoding data could be useful to collect hidden information and potentially determine undiscovered aspects. In this PhD dissertation, I focused the attention on a data-centered perspective of DNA metabarcoding data, touching four main points that can enhance and ameliorate the current strategies: i) consider the molecular information obtained from high-throughput DNA sequencing (HTS) and available in public repositories, ii) enhance taxonomy assignment step, iii) investigate new methods for pattern reconstruction and iv) use data as a valuable resource for research. These four steps can enhance at different levels the potentials of DNA metabarcoding applications, paving the way for standardization procedures for uncommon markers and the integration of new data mining and data reuse strategies of metabarcoding data.

Gli approcci metagenomici hanno cambiato il modo di studiare la biologia e la biodiversità in diversi campi. In particolare, il progresso tecnologico ci consente di determinare la composizione tassonomica dei campioni e di studiare la biodiversità in ambienti molto diversi. Al giorno d'oggi, il DNA metabarcoding è una procedura standard, applicata in un'ampia gamma di settori, dalla salute umana all'ecologia, alle applicazioni industriali. Negli ultimi anni, il DNA metabarcoding applicato al 16S rRNA è stato ampiamente utilizzato per studiare la comunità batterica, portando ad analisi di routine che hanno creato enormi quantità di dati, consentendo ai ricercatori di sviluppare strategie data-driven per rispondere a domande biologiche complesse. Inoltre, il DNA metabarcoding può essere utilizzato anche per studiare Piante, Animali o Funghi, grazie allo sviluppo di diversi marcatori molecolari. In entrambi i casi, considerando l'enorme quantità di dati prodotti dai ricercatori e disponibili nelle banche dati, una prospettiva di ‘data mining’ nella gestione e nell'esplorazione dei dati di DNA metabarcoding potrebbe essere utile per identificare nuovi pattern ed estrarre maggiori informazioni dai dati. Nella mia tesi di dottorato, mi sono focalizzata su una prospettiva incentrata sui dati di DNA metabarcoding, toccando quattro punti principali che possono potenziare e migliorare le strategie attuali: i) considerare le informazioni molecolari ottenute dal sequenziamento high-throughput del DNA (HTS) e disponibili in archivi pubblici, ii ) migliorare la fase di assegnazione della tassonomia, iii) studiare nuovi metodi per la ricostruzione di pattern di biodiversità e iv) utilizzare dati già prodotti come risorsa preziosa per la ricerca. Questi quattro punti possono migliorare a diversi livelli le potenzialità delle applicazioni di tecniche fondate sul DNA metabarcoding, aprendo la strada a procedure di standardizzazione per marcatori meno diffusi e all'integrazione di nuove strategie di data mining e riutilizzo di dati di DNA metabarcoding.

(2022). Data-driven approaches for biodiversity exploration via DNA metabarcoding data analysis. (Tesi di dottorato, Università degli Studi di Milano-Bicocca, 2022).

Data-driven approaches for biodiversity exploration via DNA metabarcoding data analysis

AGOSTINETTO, GIULIA
2022

Abstract

Metagenomic approaches have changed the way to study biology and biodiversity in several fields. In particular, technology advancement enables us to determine taxa composition and to study complex biodiversity patterns in very different environments. Nowadays, DNA metabarcoding is a standard procedure, applied on a wide range of fields, from human health to ecology, to industry applications. In the last few years, 16S rRNA metabarcoding was widely used to study the bacterial community, leading to routine analysis which created huge amounts of data, bringing researchers to develop data mining strategies in order to answer complex biological questions. On the other hand, DNA metabarcoding can be applied also to study Plants, Animals or Fungi, as very different molecular markers have been identified. In both cases, considering the huge amount of data produced by researchers and available in repositories, a data-driven perspective in managing and exploring DNA metabarcoding data could be useful to collect hidden information and potentially determine undiscovered aspects. In this PhD dissertation, I focused the attention on a data-centered perspective of DNA metabarcoding data, touching four main points that can enhance and ameliorate the current strategies: i) consider the molecular information obtained from high-throughput DNA sequencing (HTS) and available in public repositories, ii) enhance taxonomy assignment step, iii) investigate new methods for pattern reconstruction and iv) use data as a valuable resource for research. These four steps can enhance at different levels the potentials of DNA metabarcoding applications, paving the way for standardization procedures for uncommon markers and the integration of new data mining and data reuse strategies of metabarcoding data.
CASIRAGHI, MAURIZIO
PESCINI, DARIO
DNA metabarcoding; biodiversità; bioinformatica; sequenziamento HTS; analisi dati
DNA metabarcoding; biodiversity; bioinformatics; HTS sequencing; analisi dati
BIO/05 - ZOOLOGIA
English
28-gen-2022
TECNOLOGIE CONVERGENTI PER I SISTEMI BIOMOLECOLARI (TeCSBi)
34
2020/2021
open
(2022). Data-driven approaches for biodiversity exploration via DNA metabarcoding data analysis. (Tesi di dottorato, Università degli Studi di Milano-Bicocca, 2022).
File in questo prodotto:
File Dimensione Formato  
phd_unimib_781510.pdf

Accesso Aperto

Descrizione: Data-driven approaches for biodiversity exploration via DNA metabarcoding data analysis
Tipologia di allegato: Doctoral thesis
Dimensione 14.32 MB
Formato Adobe PDF
14.32 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10281/365346
Citazioni
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
Social impact