Misura dell’accuratezza

Measurement of accuracy

La misura dell’accuratezza di uno screening combina sensibilità, specificità, valore predittivo positivo (PPV) e valore predittivo negativo (NPV) di un “test positivo” rispetto ad un “risultato positivo” (Figura 5.5). Quando si calcola l’accuratezza bisogna considerare i seguenti fattori:

 

  • La natura di un test positivo o non positivo per ogni circostanza deve essere chiaramente definita, ed analogamente per un risultato positivo o non positivo della medesima circostanza.
  • Un test positivo e un risultato positivo sono eventi rari in un test di screening basato sulla popolazione: perciò specificità e NPV saranno alti e sensibilità e PPV potrebbero essere più rilevanti (vedi il primo esempio nella figura 5.5).
  • PPV e sensibilità potrebbero essere compromessi dalla diminuzione della prevalenza della malattia. [Link al Capitolo 7 – Usi dei test per HPV ed effettti della vaccinazione]
  • È necessario prendere in considerazione la natura e il risultato dei test negativi: nel secondo esempio sottostante possono rappresentare delle genuine anormalità di basso grado HPV positive investigate alla colposcopia.
  • Un test ad alta sensibilità e bassa specificità (come la positività per HPV ad alto rischio o una citologia ASC-US+) può essere compensato da un secondo test ad alta specificità (come una biopsia colposcopica).
  • C’è uno scambio tra la sensibilità, che dipende dai tassi di falsi negativi, e specificità, che dipende dai tassi di falsi positivi.

L’accuratezza può essere calcolata per molte condizioni, come,per esempio, l’accuratezza della citologia nelle donne sottoposte alla colposcopia (vedi il secondo esempio nella Figura 5.5), l’accuratezza dello screening rispetto al referto finale [Link al  Capitolo 14- controllo di qualità]e l’accuratezza della citologia convenzionale rispetto a quella liquid based o ai test per HPV. 

 

Stime surrogate della sensibilità

Vista la difficoltà di misurare la sensibilità senza sapere la vera prevalenza del CIN2+ nella popolazione, potrebbero essere utilizzate delle stime surrogate, come tassi di referti comparati per HSIL e tassi di riscontro comparati per il CIN2+ o tassi di test negativi a cui è preceduto un CIN2+  [Link al Capitolo 8 –Raccogliere campioni cellulati dalla cervice; Capitolo 14 –controllo di qualità].

 

Breve guida al calcolo dell’accuratezza nei test di screening

Si raccomanda la concisa review di Lalkhen & McCluskey (2008) come breve guida per il calcolo dell’accuratezza nei test di screening. Il Capitolo 3, Statistica, in RM Demay L’arte e scienza della citopatologia (citologia esfoliativa) è altrettanto fortemente consigliato.

Figura 5.5 (a-c). Esempi teorici di accuratezza di test con lo stesso  FN e FP in ambienti con una bassa e alta prevalenza di CIN2+

a) Formule per misurarel’accuratezza
(b) Accuratezza in bassa prevalenza
(c) Accuratezza in alta prevalenza

 

Learning points delCapitolo 5

  1. I principi di Wilson e Jungner per i programmi di screening(1968)dovrebbero  essere esaminati criticamente per il successo che possono avere nel prevenire un “importante problema di salute”, ma anche per i loro aspetti controversi.
  2. L’aumento della conoscenza della “storia naturale della malattia” ha fatto insorgere dei problemi (trattamento delle lesioni progressive e regressive) e fornito soluzioni alternative (vaccinazione e test per HPV).
  3. Nelle popolazioni ben monitorate, HPV ad alto rischio e le lesioni a basso e alto grado tendono ad essere diagnosticate più frequentemente in donne sotto i 30 anni.
  4. La distinzione tra HSIL e LSIL è la chiave per uno screening accurato.
  5. ASC-US e LSIL sono refertati più frequentemente rispetto ad HSIL.
  6. L’escissione di un CIN di alto grado comporta il rischio di una rottura prematuradelle membrane in gravidanzaed è correlato con la profondità della biopsia.
  7. Un rigoroso controllo di qualità èessenziale per evitare sia una sovra-diagnosi che una sotto-diagnosi.
  8. Il calcolo per l’accuratezza combina sensibilità, specificità, valore predittivo positivo e valore predittivo negativo.
    C’è uno scambio tra la sensibilità (che riflette i falsi negativi) e la specificità (che riflette i falsi positivi).
  9. In uno screening basato sulla popolazione di una condizione rara, NPV e la specificità potrebbero essere meno rilevanti per la misura dell’accuratezza che sensibilità e VPP.
  10. La diminuzione della prevalenza della malattia può compromettere PPV e sensibilità.

 

X