After the completion of the human genome project in April 2003, the continuous flow of sequencing data and the development of new databases began to transform the field of genomics into data-driven science. Bioinformatics analyses raw experimental data with the aim to obtain information describing biological processes, thus providing a powerful tool to investigate specific molecular and genetic mechanisms. This domain knowledge in combination with genomics allows to decipher the interrelationships between genes, regulatory elements, metabolic pathways, and protein interactions. Deep learning, a subdiscipline of machine learning, has been recently applied to the field of genomics, leading to remarkable results. The two main objectives of this study were: the development and application of bioinformatic tools for the study of the genetic basis of acute lymphoblastic leukaemia, and the usage of deep learning techniques for the identification of small non-coding RNA elements in the human genome. This dissertation provides a comprehensive overview of the recent evolution of genomics as an interdisciplinary field of research strongly associated with computer science and data analysis.

Dopo che il progetto sul genoma umano è stato completato nell'aprile del 2003, il flusso continuo di nuovi database e dati di sequenziamento ha iniziato a trasformare il campo della genomica in scienza basata sui dati. La bioinformatica analizza i dati sperimentali grezzi con l'obiettivo di ottenere informazioni che descrivono le condizioni biologiche misurate, fornendo così un potente strumento per studiare specifici meccanismi molecolari e genetici. Questa conoscenza deve essere combinata con la genomica per decifrare le interrelazioni tra geni, elementi regolatori, vie metaboliche e interazioni proteiche. L'apprendimento profondo, conosciuto come Deep Learning, e’ una sottodisciplina dell'apprendimento automatico, è stato recentemente applicato al campo della genomica, portando a risultati notevoli. I due obiettivi principali di questo lavoro sono: lo sviluppo e le applicazioni di strumenti bioinformatici che consentano lo studio delle basi genetiche della leucemia linfoblastica acuta e l'uso di tecniche di apprendimento profondo per l'identificazione di piccoli elementi di RNA non codificanti del genoma umano. Questa tesi fornisce al lettore una panoramica completa della recente evoluzione della genomica come campo interdisciplinare di ricerca strettamente connesso con l'informatica e l'analisi dei dati.

(2020). Application of modern data science to genomics and clinical research. (Tesi di dottorato, Università degli Studi di Milano-Bicocca, 2020).

Application of modern data science to genomics and clinical research

GRIONI, ANDREA
2020

Abstract

After the completion of the human genome project in April 2003, the continuous flow of sequencing data and the development of new databases began to transform the field of genomics into data-driven science. Bioinformatics analyses raw experimental data with the aim to obtain information describing biological processes, thus providing a powerful tool to investigate specific molecular and genetic mechanisms. This domain knowledge in combination with genomics allows to decipher the interrelationships between genes, regulatory elements, metabolic pathways, and protein interactions. Deep learning, a subdiscipline of machine learning, has been recently applied to the field of genomics, leading to remarkable results. The two main objectives of this study were: the development and application of bioinformatic tools for the study of the genetic basis of acute lymphoblastic leukaemia, and the usage of deep learning techniques for the identification of small non-coding RNA elements in the human genome. This dissertation provides a comprehensive overview of the recent evolution of genomics as an interdisciplinary field of research strongly associated with computer science and data analysis.
BIONDI, ANDREA
BYSTRY, VOJTECH
genomica; cancro; bioinformatica; biologia molecolare; diagnosi clinica
genomics; bioinformatics; cancer; molecular biology; diagnosi clinica
MED/38 - PEDIATRIA GENERALE E SPECIALISTICA
7-lug-2020
MEDICINA TRASLAZIONALE E MOLECOLARE - DIMET
33
2019/2020
MASARYK UNIVERSITY - MASARYKOVA UNIVERZITA
open
(2020). Application of modern data science to genomics and clinical research. (Tesi di dottorato, Università degli Studi di Milano-Bicocca, 2020).
File in questo prodotto:
File Dimensione Formato  
phd_unimib_718282.pdf

accesso aperto

Descrizione: Tesi
Tipologia di allegato: Doctoral thesis
Dimensione 12.87 MB
Formato Adobe PDF
12.87 MB Adobe PDF Visualizza/Apri

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10281/279991
Citazioni
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
Social impact