Attenzione: i dati modificati non sono ancora stati salvati. Per confermare inserimenti o cancellazioni di voci è necessario confermare con il tasto SALVA LE MODIFICHE in fondo alla pagina
Bicocca Open Archive
The discovery of driver mutations is one of the key motivations for cancer genome sequencing. Here, as part of the ICGC/TCGA Pan-Cancer Analysis of Whole Genomes (PCAWG) Consortium, which aggregated whole genome sequencing data from 2658 cancers across 38 tumour types, we describe DriverPower, a software package that uses mutational burden and functional impact evidence to identify driver mutations in coding and non-coding sites within cancer whole genomes. Using a total of 1373 genomic features derived from public sources, DriverPower’s background mutation model explains up to 93% of the regional variance in the mutation rate across multiple tumour types. By incorporating functional impact scores, we are able to further increase the accuracy of driver discovery. Testing across a collection of 2583 cancer genomes from the PCAWG project, DriverPower identifies 217 coding and 95 non-coding driver candidates. Comparing to six published methods used by the PCAWG Drivers and Functional Interpretation Working Group, DriverPower has the highest F1 score for both coding and non-coding driver discovery. This demonstrates that DriverPower is an effective framework for computational driver discovery.
Shuai, S., Abascal, F., Amin, S., Bader, G., Bandopadhayay, P., Barenboim, J., et al. (2020). Combined burden and functional impact tests for cancer driver discovery using DriverPower. NATURE COMMUNICATIONS, 11(1) [10.1038/s41467-019-13929-1].
Combined burden and functional impact tests for cancer driver discovery using DriverPower
Shuai S.
;Abascal F.;Amin S. B.;Bader G. D.;Bandopadhayay P.;Barenboim J.;Beroukhim R.;Bertl J.;Boroevich K. A.;Brunak S.;Campbell P. J.;Carlevaro-Fita J.;Chakravarty D.;Chan C. W. Y.;Chen K.;Choi J. K.;Deu-Pons J.;Dhingra P.;Diamanti K.;Feuerbach L.;Fink J. L.;Fonseca N. A.;Frigola J.;Gambacorti Passerini C.;Garsed D. W.;Gerstein M.;Getz G.;Guo Q.;Gut I. G.;Haan D.;Hamilton M. P.;Haradhvala N. J.;Harmanci A. O.;Helmy M.;Herrmann C.;Hess J. M.;Hobolth A.;Hodzic E.;Hong C.;Hornshoj H.;Isaev K.;Izarzugaza J. M. G.;Johnson R.;Johnson T. A.;Juul M.;Juul R. I.;Kahles A.;Kahraman A.;Kellis M.;Khurana E.;Kim J.;Kim J. K.;Kim Y.;Komorowski J.;Korbel J. O.;Kumar S.;Lanzos A.;Larsson E.;Lawrence M. S.;Lee D.;Lehmann K. -V.;Li S.;Li X.;Lin Z.;Liu E. M.;Lochovsky L.;Lou S.;Madsen T.;Marchal K.;Martincorena I.;Martinez-Fundichely A.;Maruvka Y. E.;McGillivray P. D.;Meyerson W.;Muinos F.;Mularoni L.;Nakagawa H.;Nielsen M. M.;Paczkowska M.;Park K.;Park K.;Pedersen J. S.;Pons T.;Pulido-Tamayo S.;Raphael B. J.;Reimand J.;Reyes-Salazar I.;Reyna M. A.;Rheinbay E.;Rubin M. A.;Rubio-Perez C.;Sahinalp S. C.;Saksena G.;Salichos L.;Sander C.;Schumacher S. E.;Shackleton M.;Shapira O.;Shen C.;Shrestha R.;Shuai S.;Sidiropoulos N.;Sieverling L.;Sinnott-Armstrong N.;Stein L. D.;Stuart J. M.;Tamborero D.;Tiao G.;Tsunoda T.;Umer H. M.;Uuskula-Reimand L.;Valencia A.;Vazquez M.;Verbeke L. P. C.;Wadelius C.;Wadi L.;Wang J.;Warrell J.;Waszak S. M.;Weischenfeldt J.;Wheeler D. A.;Wu G.;Yu J.;Zhang J.;Zhang X.;Zhang Y.;Zhao Z.;Zou L.;von Mering C.;Gallinger S.;Stein L.
2020
Abstract
The discovery of driver mutations is one of the key motivations for cancer genome sequencing. Here, as part of the ICGC/TCGA Pan-Cancer Analysis of Whole Genomes (PCAWG) Consortium, which aggregated whole genome sequencing data from 2658 cancers across 38 tumour types, we describe DriverPower, a software package that uses mutational burden and functional impact evidence to identify driver mutations in coding and non-coding sites within cancer whole genomes. Using a total of 1373 genomic features derived from public sources, DriverPower’s background mutation model explains up to 93% of the regional variance in the mutation rate across multiple tumour types. By incorporating functional impact scores, we are able to further increase the accuracy of driver discovery. Testing across a collection of 2583 cancer genomes from the PCAWG project, DriverPower identifies 217 coding and 95 non-coding driver candidates. Comparing to six published methods used by the PCAWG Drivers and Functional Interpretation Working Group, DriverPower has the highest F1 score for both coding and non-coding driver discovery. This demonstrates that DriverPower is an effective framework for computational driver discovery.
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10281/284695
Citazioni
25
30
Social impact
Conferma cancellazione
Sei sicuro che questo prodotto debba essere cancellato?
simulazione ASN
Il report seguente simula gli indicatori relativi alla propria produzione scientifica in relazione alle soglie ASN 2023-2025 del proprio SC/SSD. Si ricorda che il superamento dei valori soglia (almeno 2 su 3) è requisito necessario ma non sufficiente al conseguimento dell'abilitazione. La simulazione si basa sui dati IRIS e sugli indicatori bibliometrici alla data indicata e non tiene conto di eventuali periodi di congedo obbligatorio, che in sede di domanda ASN danno diritto a incrementi percentuali dei valori. La simulazione può differire dall'esito di un’eventuale domanda ASN sia per errori di catalogazione e/o dati mancanti in IRIS, sia per la variabilità dei dati bibliometrici nel tempo. Si consideri che Anvur calcola i valori degli indicatori all'ultima data utile per la presentazione delle domande.
La presente simulazione è stata realizzata sulla base delle specifiche raccolte sul tavolo ER del Focus Group IRIS coordinato dall’Università di Modena e Reggio Emilia e delle regole riportate nel DM 598/2018 e allegata Tabella A. Cineca, l’Università di Modena e Reggio Emilia e il Focus Group IRIS non si assumono alcuna responsabilità in merito all’uso che il diretto interessato o terzi faranno della simulazione. Si specifica inoltre che la simulazione contiene calcoli effettuati con dati e algoritmi di pubblico dominio e deve quindi essere considerata come un mero ausilio al calcolo svolgibile manualmente o con strumenti equivalenti.