# Cosa ci dice la letalità apparente
Estrarre informazioni sull'andamento di una epidemia mentre l'epidemia è in corso è molto difficile, ci sono tante incertezze e tante fonti di errore che si sommano. E' dunque lecito chiedersi: se i dati sono così parziali, incompleti, eterogenei e poco affidabili, perché continuiamo a guardarli?
Il singolo dato numerico, preso singolarmente, ha in effetti un significato relativo, ma spesso da più dati guardati nel loro insieme si possono estrarre importanti informazioni. Ad esempio guardando l'andamento complessivo di serie temporali o confrontando tra loro dati eterogenei.
Qui di seguito cerchiamo di estrarre informazioni da uno degli indicatori più fluttuanti e discussi: il dato sulla letalità. Vediamo come, pur con tante cautele e approssimazioni, possiamo trarre qualche idicazione, in particolare su come questo dato rifletta le diverse strategie di tracciamento e diagnosi.
#### LETALITA' APPARENTE
La letalità di un virus misura la frazione di persone contagiate che muoiono a causa dell'infezione. Chiameremo questo numero IFR (Infection Fatality Rate). Per il coronavirus SARS-Cov-2 questo numero è stimato preliminarmente in letteratura intorno all'1-3% []. Se tentiamo si stimare la letalità in corso di epidemia facendo banalmente il rapporto tra il numero totale del decessi e quello dei casi positivi registrati ad una certa data otteniamo un numero molto diverso. Ad esempio in Italia, nel momento in cui scriviamo, questo valore si attesta attorno al 13%. Questo numero è lontano dalla letalità effettiva che cerchiamo di stimare per tanti motivi di cui sotto elenchiamo i principali, ed ha infatti il nome di letalità apparente o nCFR (naive Case Fatality Rate).
###### FONTI DI ERRORE
Per prima cosa, per valutare quante tra le persone contagiate sono decedute dovremmo rapportare il numero dei decessi al numero degli infetti al momento del loro contagio, dato molto difficile da valutare. In alternativa, se usiamo il numero totale di casi positivi rilevati al momento presente dovremmo sapere come questi casi si evolveranno. Non conosciamo infatti la sorte di tutti gli individui attualmente infetti. Al momento, il numero di casi positivi di cui non si conosce l'esito è di più di 100000 tra i circa 170000 casi registrati (quelli con esito sono risultati in guarigione nel 65% dei casi e in decesso nel 35%). Se potessimo stimare il ritardo dei decessi potremmo calcolare questo rapporto che chiameremo CFR (Case Fatality Rate). Il nCFR è sempre una sovrastima del CFR perché ottenuto dividendo il numero dei decessi attuali per il numero dei contagiati attuali, di parte dei quali non si conosce l'esito.
Una altro fattore di cui tenere conto è che, se anche riuscissimo a calcolare il CFR, staremo sovrastimando la letalità effettiva (IFR) poiché i casi di contagio accertati (al denominatore nel rapporto decessi/contagi) sono sempre, almeno in una epidemia diffusa, una sottostima dei casi di contagio reali. Questo è specialmente vero nel caso della pandemia in corso, dato che l'infezione da SARS-Cov-2 si presenta in molti casi in forma asintomatica. La sottostima del numero di individui contagiati è la sorgente principale di errore nel calcolo della letalità, ed è il motivo principale per cui osserviamo una letalità apparente così lontana e più alta di quella che si ritiene essere almeno approssimativamente la letalità effettiva. Oltre che dal numero degli individui infetti, il numero di casi rilevati dipende fortemente dalle strategie di tracciamento e diagnosi: il tracciamento può ad esempio riuscire o meno ad identificare una certa parte di pazienti asintomatici, la disponibilità di test o scelte strategiche possono influire su quali pazienti di decide di sottoporre a test.
###### ULTERIORI FONTI DI ERRORE IN FASE CRITICA
Quando l'epidemia raggiunge una fase critica e mette sotto stress il sistema sanitario, questi numeri diventano ancora meno affidabili. I criteri per eseguire i tamponi divengono necessariamente più stringenti, spesso si è costretti a decidere di somministrare i test solo ai pazienti sintomatici gravi. Inoltre le persone cominciano a morire in casa senza nemmeno raggiungere l'ospedale. Anche il numero di decessi, che in una fase iniziale più controllata è il dato più affidabile, diventa sottostimato in maniera importante. Infine, nonostante l’immenso impegno degli operatori sanitari, la saturazione dei reparti di terapia intensiva porta inevitabilmente alla impossibilità di garantire una assistenza adeguata a tutti coloro che ne hanno bisogno con un conseguente ulteriore aumento dei decessi. In questa fase ricavare informazioni dalla letalità apparente diventa ancora più difficile.
#### LETALITA' E POLICY
###### SERIE TEMPORALI
L'entità della sottostima dei contagiati dipende in modo cruciale dalle strategie di tracciamento e testing. Nella prima fase dell'epidemia in Italia si è tentato di eseguire controlli su tutta la rete di contatti dei pazienti positivi. Dal 28 Febbraio si è invece deciso di effettuare tamponi solo sui sintomatici. Di conseguenza, da quel momento, si è sottostimato tantissimo il numero dei contagiati effettivi, dando luogo ad una letalità apparente sempre più alta. Questo è ben visibile se si guarda al trend della letalità apparente che parte attorno al 3% nella fase iniziale dell'epidemia per scendere fino a circa il 2%, e comincia bruscamente a salire dopo il cambio di policy fino a raggiungere l'attuale 13% (vedi FIG 1). [https://www.ispionline.it/en/publication/covid-19-and-italys-case-fatality-rate-whats-catch-25586](https://www.ispionline.it/en/publication/covid-19-and-italys-case-fatality-rate-whats-catch-25586)
Questo è un esempio di come la strategia di diagnosi, non leggibile nei singoli numeri della letalità apparente, lascia invece una traccia molto chiara nel suo trend. La successiva variazione del trend, con un rallentamento e saturazione a partire dal periodo del 30 marzo, del tasso di letalità apparente è invece dovuto all'effetto combinato dell'aumento lineare nel tempo del numero di tamponi effettuato e del raggiungimento del picco epidemico.

###### CONFRONTO TRA PAESI E REGIONI
Malgrado questi fattori di bias della letalità apparente, possiamo comunque cercare di trarre informazione da questo dato, incluso il suo livello di incompletezza, confrontandone i valori osservati in un insieme di paesi dove sono state attuate strategie diverse di contenimento dell'epidemia. Va tuttavia sottolineato che il confronto tra paesi diversi soffre anch'esso di problematiche legate all'eterogeneità dei dati i cui principali fattori sono: fasi diverse dell'epidemia in paesi diversi, struttura demografica della popolazione e, di nuovo, eterogeneità dalle strategie scelte per la somministrazionedei test diagnostici. Per avere un'indicazione, sebbene molto approssimativa, sul tipo di strategia di diagnosi adottata da un paese possiamo considerare il tasso di positività dei test ovvero la frazione di test che sono risultati positivi. Questo numero è a sua volta solo una stima della frazione degli individui risultati positivi al test: spesso i test vengono ripetuti più volte sulla stessa persona, i test possono dar luogo a falsi negativi, i test sono fatti anche ai guariti prima di dichiararli guariti, e questi dettagli sono spesso non disponibili. In ogni caso possiamo usarlo come indicatore dello sforzo di tracciatura e quindi di contenimento della diffusione epidemica: se la frazione di test positivi è molto bassa possiamo pensare che stiamo campionando a sufficienza da circoscrivere i sospetti positivi; al contrario, quando questo numero sale vuol dire che probabilmente molti positivi stanno sfuggendo alla diagnosi. E' chiaramente molto importante anche la tempistica con cui tale sforzo viene implementato. Infatti, dato l'andamento esponenziale della dinamica epidemica nel primo stadio la diffusione, bastano poche settimane o giorni di ritardo perché l'epidemia diventi difficilmente tracciabile e circoscrivibile, malgrado un successivo aumento in assoluto del numero di test eseguiti.
Un dato interessante da questo punto di vista si ottiene guardando come cambia per vari paesi la letalità apparente in funzione di questo "indicatore di policy". Nella figura 2 vediamo come alcuni paesi europei si posizionano in questo piano cartesiano. I dati sono relativi al 14 aprile ed i paesi sono paesi europei con più di 5000 casi positivi rilevati.
Vediamo che i paesi si raggruppano sostanzialmente in due cluster abbastanza ben definiti: da una parte (quadrati verdi) i paesi che hanno mantenuto sin dall'inizio il nostro indicatore di policy molto basso (sotto 0.14), ed hanno una letalità apparente bassa (sotto 0.07), dall'altra (quadrati viola) paesi in cui per vari motivi (minor numero di tamponi eseguiti in rapportato allo stadio dell'epidemia) il tracciamento e la diagnosi dei positivi non ha raggiunto un alto numero di infetti ed in cui la letalità apparente è molto alta. E' interessante notare come il grafico sembra indicare una sorta di discontinuità tra paesi che non hanno superato la soglia emergenziale e quelli in cui invece il sistema sanitario è entrato in stress. Ciò potrebbe essere in accordo con la previsione teorica della presenza di bi-stabilità della dinamica di diffusione epidemica al variare dell'intensità dei test/tamponi eseguiti a parità delle altre proprietà dinamiche dell'epidemia (https://arxiv.org/abs/2003.08479).
Nella figura l'Italia è indicata con un pallino nero all'interno del quadrato. Oltre ai dati Europei mostriamo come benckmark il dato della Corea del Sud (quadratino arancione).

...........
Una situazione vagamente simile anche se molto meno netta si trova andando ad analizzare gli analoghi dati Italiani scorporati per regioni mostrati in FIG 3. I dati sono relativi al 14 aprile. Anche in questo caso si nota la presenza di due cluster ben distinti che separa le regioni del Nord Italia, ad eccezione del Veneto, più le Marche che hanno più sofferto gli effetti dell'epidemia a livello sociale e sanitario, dalle altre regioni in cui il contenimento sembra essere stato più efficace. Abruzzo e le province autonome di Trento e Bolzano sono in posizione intermedia e difficilmnete attribuibili ad uno dei due gruppi.

##### In funzione dei tamponi per popolazione
La figura 4 mostra la letalità apparente per gli stessi paesi europei come in FIG 2 ma al variare del numero di test per milione di abitanti. Italia e Spagna pur avendo fatto adesso un numero di test pro capite molto alto scontano probabilmente il fatto di non averne fatti a sufficienza in una fase precoce dell'epidemia e si trovano ancora in una regione con letalità alta. La Romania e la Polonia sono anche essi outlayer con bassa mortalità nonostante il basso numero di test pro capite (commentare, policy unknown ?)

La FIG 5 mostra analogo dato per le regioni Italiane. Anche qui la lettura dei dati per regione è molto meno chiara.

#### DINAMICA
E' interessante seguire l'andamento nel tempo e vedere come la posizione di un paese o una regione si muove nel piano cartesiano letalità vs rate di poitività. Per una visualizzazione a livello delle regioni italiane vedi
[https://flo.uri.sh/story/240006/embed?v3#slide-5](https://flo.uri.sh/story/240006/embed?v3#slide-5)
#### STRUTTURA DEMOGRAFICA
E' interessante notare come le quantità analizzate in FIG 2 e 3 sono a loro volta correlate con l'età media dei malati mentre non c'è correlazione significativa con con il profilo demografico, ovvero con la composizione in fasce di età dell'intera popolazione regionale. La FIG 6 mostra la letalità apparente per regioni italiane in funzione della percentuale di infetti over 65. Il grafico in FIG 7 mostra la letalità apparente in funzione della frazione di popolazione over 65. I dati sono relativi al 14 aprile. Come si vede, mentre la percentuale di over 65 nei positivi ai tamponi è fortemente correlata con la letalità apparente, mostrando di nuovo la clusterizzazione in due gruppi distinti, la percentuale di over 65 nella popolazione globale non sembra essere un indicatore epidemico importante almeno da questo punto di vista.
I successivi due grafici (FIG 8 e 9) mostrano la frazione di test risultati positivi in funzione rispettivamente della percentuale di over 65 tra i casi rilevati (FIG 8) e la percentuale di over 65 nella popolazione regionale (FIG 9). Di nuovo si osserva una forte correlazione e clusterizzazione nel nel primo caso ed una scarsa nel secondo.
Nei due grafici di sinistra (FIG 6 e 8). La correlazione tra percentuale di casi positivi over 64 e letalità apparente non è sorprendente: l'esito della malattia dipende dall'età e dallo stato di salute. La correlazione tra frazione di test positivi e percentuale di casi positivi over 65 invece include di nuovo una dipendenza dalle policy: dove si rilevano pochi positivi (si fanno tanti tamponi in relazione alla diffusione dell'epidemia) si campionano più giovani, dove invece la situazione è emergenziale e il rate di positività è alto si testano per lo più sintomatici gravi che si trovano con maggiore probabilità nella popolazione over 65. La combinazione di questi due grafici da la dipendenza osservata in FIG 3
| percentuale contagi over 65 | percentuale popolazione over 65 |
|:------------------------------------:|:------------------------------------:|
|  |  |
|  |  |