INTRODUZIONE L'uso integrato di archivi elettronici in sanità pubblica e nella ricerca epidemiologica è di crescente interesse. In tale contesto la scelta della tecnica di record linkage (RL), ossia del processo di confronto di record provenienti da due o più archivi con l'obiettivo di determinare quali coppie si riferiscono allo stesso individuo, risulta estremamente delicata. Il metodo deterministico comporta che due record si riferiscono allo stesso individuo se tutti i campi identificativi coincidono perfettamente. Rientrano in questa categoria le procedure stepwise, caratterizzate da una sequenza di passi di linkage in cui la concordanza è valutata su sottoinsiemi di campi identificativi. Sebbene le procedure deterministiche siano intuitive e per questo ampiamente utilizzate, errori di trascrizione nei codici identificativi generano un¿incertezza sistematica di entità ignota ed eterogenea. Le procedure di linkage probabilistico consistono nella definizione a priori di un criterio di decisione basato sulla capacità discriminante e attendibilità dei singoli campi identificativi. Il vantaggio di tali tecniche è che l'entità degli errori di linkage è noto, e con esso il suo impatto sulle misure epidemiologiche, rendendo possibile il confronto non distorto tra risultati. Tuttavia, l'utilizzo di tali procedure richiede una mole di risorse di calcolo non necessariamente disponibile. Nel progetto sono state valutate le caratteristiche operative di una procedura di RL probabilistico appositamente messa a punto per l¿utilizzo in un contesto epidemiologico con lo scopo di: (i) verificarne l'utilizzabilità in base alla dotazione tecnologica mediamente disponibile in un servizio di epidemiologia; (ii) confrontarne le performance con quelle delle procedure normalmente utilizzate dai servizi partecipanti; (iii) valutarne l'impatto in più contesti epidemiologici. METODI Gli archivi considerati sono l¿anagrafica assistiti al 31 dicembre 2003 e le schede di dimissione ospedaliera (SDO) dell¿anno 2004 di competenza di quattro servizi, localizzati in diverse regioni italiane. Ogni servizio ha utilizzato la propria procedura di RL, quella deterministica e la procedura probabilistica implementata in una macro SAS. Tale procedura è costituita da due passi di linkage in parallelo definiti da differenti variabili di bloccaggio dei record. In ogni passo i livelli di errore ammessi variano al fine di valutare come cambiano i risultati. Il controllo manuale su un campione estratto casualmente dall¿archivio delle SDO ha permesso di calcolare sensibilità, specificità e predittività di ogni singola procedura e di valutarne l¿impatto sulle stime di incidenza, di prevalenza e di diverse misure di associazione. Le analisi sono state effettuate su record selezionati per patologie.

Fornari, C. (2007). Performance delle procedure di Record Linkage tra archivi per l'epidemiologia. In ISTISAN Congressi (pp.4-4). Istituto superiore di sanità.

Performance delle procedure di Record Linkage tra archivi per l'epidemiologia

Fornari, C
2007

Abstract

INTRODUZIONE L'uso integrato di archivi elettronici in sanità pubblica e nella ricerca epidemiologica è di crescente interesse. In tale contesto la scelta della tecnica di record linkage (RL), ossia del processo di confronto di record provenienti da due o più archivi con l'obiettivo di determinare quali coppie si riferiscono allo stesso individuo, risulta estremamente delicata. Il metodo deterministico comporta che due record si riferiscono allo stesso individuo se tutti i campi identificativi coincidono perfettamente. Rientrano in questa categoria le procedure stepwise, caratterizzate da una sequenza di passi di linkage in cui la concordanza è valutata su sottoinsiemi di campi identificativi. Sebbene le procedure deterministiche siano intuitive e per questo ampiamente utilizzate, errori di trascrizione nei codici identificativi generano un¿incertezza sistematica di entità ignota ed eterogenea. Le procedure di linkage probabilistico consistono nella definizione a priori di un criterio di decisione basato sulla capacità discriminante e attendibilità dei singoli campi identificativi. Il vantaggio di tali tecniche è che l'entità degli errori di linkage è noto, e con esso il suo impatto sulle misure epidemiologiche, rendendo possibile il confronto non distorto tra risultati. Tuttavia, l'utilizzo di tali procedure richiede una mole di risorse di calcolo non necessariamente disponibile. Nel progetto sono state valutate le caratteristiche operative di una procedura di RL probabilistico appositamente messa a punto per l¿utilizzo in un contesto epidemiologico con lo scopo di: (i) verificarne l'utilizzabilità in base alla dotazione tecnologica mediamente disponibile in un servizio di epidemiologia; (ii) confrontarne le performance con quelle delle procedure normalmente utilizzate dai servizi partecipanti; (iii) valutarne l'impatto in più contesti epidemiologici. METODI Gli archivi considerati sono l¿anagrafica assistiti al 31 dicembre 2003 e le schede di dimissione ospedaliera (SDO) dell¿anno 2004 di competenza di quattro servizi, localizzati in diverse regioni italiane. Ogni servizio ha utilizzato la propria procedura di RL, quella deterministica e la procedura probabilistica implementata in una macro SAS. Tale procedura è costituita da due passi di linkage in parallelo definiti da differenti variabili di bloccaggio dei record. In ogni passo i livelli di errore ammessi variano al fine di valutare come cambiano i risultati. Il controllo manuale su un campione estratto casualmente dall¿archivio delle SDO ha permesso di calcolare sensibilità, specificità e predittività di ogni singola procedura e di valutarne l¿impatto sulle stime di incidenza, di prevalenza e di diverse misure di associazione. Le analisi sono state effettuate su record selezionati per patologie.
abstract + slide
archivi elettronici sanitari, epidrmiologia
Italian
L'integrazione di archivi elettronici per l'epidemiologia e la sanità pubblica: finalità e metodi
2007
ISTISAN Congressi
2007
07/C2
4
4
https://www.epicentro.iss.it/focus/aie/aie07
none
Fornari, C. (2007). Performance delle procedure di Record Linkage tra archivi per l'epidemiologia. In ISTISAN Congressi (pp.4-4). Istituto superiore di sanità.
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/10281/207
Citazioni
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
Social impact