Natura capta ferum hominem cepit : coronavirus epidemies, Part I

Coronavirus epidemies, COVID-19 (2020) e SARS (2003). Part I: Covid-19

(Nature, vanquished, took the fierce man captive)

Enrico Canuto, Politecnico di Torino, Docente a riposo, Former faculty

2 Febbraio 2020 e aggiornamenti successivi

In memoriam
Wénliàng Lī,  李文亮 (1986 – 2020, see picture below).  
He  was an ophtalmologist at Wuhan Central Hospital  武汉市中心医院, Jang'An district, Wuhan 武汉市, who on 30 December 2019 warned fellow colleagues about a possible outbreak of an illness that resembled severe acute respiratory syndrome (SARS), later acknowledged as Covid-19. On 8 January he contracted the virus from an infected patient and died from the disease on 7 February 2020. Other three doctors of the same hospital, Jiang Xueqing, Mei Zhongming and Zhu Heping, succumbed to the disease, according to the online newspaper Caixin (财新), March 12. (photo, credits to AsiaNews.it)


Wuhan Central Hospital was established in 1880 as a clinic by the Hankou's Catholic Church. In 1893, it was expanded under the design of the Italian Franciscan Friar, Father E. Carlassare, and renamed as Catholic Hospital (right picture). Most  of the hospital buildings were destroyed by American bombing in 1944. The modern hospital is close to the Catholic Cathedral of St. Joseph, built in 1877 always under the design of Father E. Carlassare (see the page Past intense relations between Italy and Wuhan). Hankou, together with Wuchang and Hanyang, constitute the modern Wuhan. The Chinese motto should read: A hundred years of humanity, devoted to perfection (rén shù bǎinián jīngchéng zhì shàn).
(photo credits to Wuhan Central Hospital, from http://www.zxhospital.com/)
Acronimi

TBV To be verified (da verificare)

OMS Organizzazione Mondiale della Sanità (WHO)

ppm parti per milione

INMI Istituto Nazionale Malattie Infettive

TBC to be completed (da completare)

TBD to be done

Obiettivo

L’obiettivo è interpolare i dati dell’epidemia COVID-19 di coronavirus nCoV-2019 (ora SARS-COV-2) disponibili presso l’Organizzazione Mondiale della Sanità (OMS, WHO, World Health Organization) [1] e altre organizzazioni [2] impiegando la funzione logistica standard [3]. Il termine epidemia  (dall’Antico Greco {\epsilon}' \pi \iota \delta \eta \mu \acute{\iota} \alpha, soggiorno, visita, e per estensione in Ippocrate, medico, 460-377 AC, epidemia) è appropriato, essendo definita come la rapida diffusione di una malattia infettiva ad un gran numero di individui di una data popolazione in breve tempo, meno di due settimane.

L’interpolazione consente di stimare l’istante medio t_{max} di propagazione dell’epidemia, definito come l’istante della massima velocità di diffusione. La velocità di diffusione dell’epidemia, misurata dalla derivata temporale (rateo) \dot{y}\left ( t \right ) del volume di contagiati y\left ( t \right ) all’istante t, si accresce sino a t_{max} per poi decrescere asintoticamente verso zero (fase di saturazione).  Questa proprietà è espressa dall’equazione differenziale del prim’ordine:

\dot{y}\left ( t \right )=\frac{\beta}{n}\left ( 1-\left ( \frac{y\left ( t \right )}{y_{max}} \right )^{n} \right )y\left ( t \right ), y\left ( t_{0} \right )=y_{0} \:, y\left ( t \right )\geq 0\: \left ( 1 \right )

dove \beta/n è il tasso di crescita iniziale, y_{max} è il volume massimo di contagiati per t\rightarrow \infty ed n consente di rendere asimmetriche crescita e saturazione. Si noti immediatamente come per y\left ( t \right )\rightarrow 0 la soluzione di (1) è un esponenziale crescente y\left ( \left ( t \right ) \right )=y_{0}\textup{exp}\left ( \beta\left (t-t_{0} \right )/n \right ), mentre per y\left ( t \right )\rightarrow y_{max} la derivata tende a zero e la crescita termina.

Il caso standard per n=1 mostra fase di crescita e di saturazione simmetriche, come si desume dalla soluzione di (1):

y\left ( t \right )=\frac{y_{max}}{1+\textup{exp}\left ( -\beta \left ( t-t_{max} \right ) \right )} \: \left ( 2 \right )

Vale la pena avvertire che i risultati numerici ottenuti applicando ai dati la funzione (2), potranno essere contraddetti dalla realtà ove quest’ultima si manifesti seguendo una rotta diversa. Infatti il modello logistico, estremamente semplice, è la soluzione dell’equazione di stato (1) del prim’ordine e autonoma, ovvero priva di cause esterne che si riflettano nella modifica temporale dei suoi tre parametri \left \{ y_{max},t_{max},\beta \right \}. In questo sta il suo vantaggio e la sua debolezza.

L’analisi è ristretta per ora ai dati epidemiologici della Repubblica Popolare Cinese (in breve Cina).

I dati a disposizione

Si farà uso dei dati epidemiologici nell’intervallo dal 20 Gennaio al 2 febbraio 2020, indicato da 20\leqslant t\leq 33\, [\textup{d}], dove [d] indica la giornata civile di 24 h.  La data si riferisce al giorno del rapporto dati e quindi è plausibilmente in ritardo di almeno un giorno. Essi sono (si veda la Figura 1):

1) Il volume progressivo y_c\left ( t \right ) di casi confermati, ovvero di affetti da virus nCOV-2019 da esami di laboratorio.

2) Il volume progressivo y_s\left ( t \right ) di casi confermati, ovvero gravemente affetti da virus nCOB-2019 da esami di laboratorio.

3) Il volume progressivo y_p\left ( t \right ) di casi sospetti, ovvero di ricoverati per accertamenti.

4) Il volume progressvo y_d\left ( t \right ) di decessi di casi confermati.

Figura 1- I dati a disposizione: casi confermati, decessi (moltiplicati per 10), casi confermati come severi, casi sospetti. 

I casi confermati

L’analisi della derivata numerica (rateo) giornaliera y_c\left ( t+1 \right )-y_c\left ( t \right ) dei casi confermati mostra un salto significativo tra il giorno 27 e 28 e un conseguente picco il giorno 28.  Questo salto è stato interpretato assegnando una maggiore incertezza ai dati dei giorni precedenti il 28. In tal modo, la derivata logistica (a campana) si adatta bene ai dati più recenti mostrando una sottovalutazione dei dati precedenti al picco. L’errore massimo percentuale sui dati recenti è inferiore al 5%. Come si nota nella Figura 2, l’istante di picco della derivata t_{max} è previsto per il giorno 36 (5 febbraio 2020 secondo la datazione dei dati), ma si noti come l’ultimo punto di derivata è più alto dell’interpolazione, indicando con ciò un allarme. In pratica, i punti affidabili sono ancora pochi. Ritorneremo su questa previsione.


Figura 2 - Il rateo giornaliero dei casi confermati. Sono riportati i dati grezzi, la stima ed estrapolazione mediante derivata logistica e l'errore di stima.

Lo stesso modello d’incertezza è stato applicato ai dati cumulativi y_c\left ( t \right ) dei casi confermati, ottenendo i risultati di Figura 3. Anche in questa elaborazione si nota come i primi dati risultino sottostimati. L’istante stimato del picco della derivata losgistica è tuttavia inferiore a quello stimato dall’elaborazione del rateo numerico degli stessi dati (Figura 2). Infatti si trova t_{max}=31.9.  Questa discrepanza, come mostrato nella sezione sui dati dell’epidemia di SARS-COV, dipende da un errore sistematico di previsione per difetto (previsione minore del valore  vero incognito)  tanto magiore quanto più lontani dal valore vero.  Se si assume che l’ultimo dato a disposizione coincida con il valore vero di t_{max}=31.9 verrà dimostrato che l’errore sistematico può essere approssimato come 1/\beta \cong 3.2 \, \; [\textup{d}], il che sposta la previsione a t_{max}=35.1\: \; \left [ \textup{d}\right ], cui si deve aggiungere l’incertezza delle misure. Ovviamente, se l’ipotesi è falsa, l’errore può aumentare o decrescere.

Figure 3 - Casi confermati: volume progressivo. Dati grezzi, stima da modello logistico mediante minimi quadrati nonlineari (NLS), errore di stima, estrapolazione del modello logistico
I decessi

Lo stesso modello d’incertezza e il metodo dei minimi quadrati nonlineari sono stati applicati ai decessi cumulativi y_d\left ( t \right ). I risultati sono mostrati in Figura 4. L’errore di stima è contenuto e nei giorni più recenti (dal giorno 28) è inferiore al 3%.  L’istante t_{max}  è stimato al giorno 32.7, ovvero tra le stime delle precedenti elaborazioni.

Figura 4 - Decessi cumulativi: dati grezzi, stima con minimi quadrati nonlineari, errore di stima, estrapolazione con modello logistico.
Conclusioni

Le stime precedenti basate sul modello logistico e su di un rozzo modello d’incertezza, che tende a privilegiare i dati recenti, portano a ritenere che ci si trovi (2 febbraio 2020) vicini alla data intermedia t_{max} della diffusione corrente dell’epidemia, stimata tra il giorno 32 e il giorno 37 del corrente anno. Sia i casi confermati, sia il loro rateo numerico, sia i decessi cumulati portano a questo intervallo. Tuttavia i pochi dati affidabili e regolari della derivata, come già accennato, gettano dubbi su queste stime. L’incertezza stimata di ciascuna stima di t_{max} è riportata nella tabella seguente.

Tabella 1- Stima dell’istante intermedio t_{max}
No Caso Simbolo Unità Valore medio Incertezza (3 sigma)
1 Confermati cumulativi t_{max} d 31.9 <0.5 d
2 Decessi cumulativi t_{max} d 32.7 < 1.5 d
3 Rateo dei confermati t_{max} d 36.5 Da calcolare

Come già anticipato, occorre esercitare molta cautela, tenendo presente il periodo di incubazione e altri fattori d’incertezza, e avendo anche di fronte il profilo temporale dell’epidemia precedente (SARS-CoV, Severe acute respiratory syndrome coronavirus), che mostra una prima esplosione, tra Gennaio e Febbraio 2003  e una seconda più grave tra Aprile e Maggio 2003 [4]. I dati della seconda esplosione sono studiati qui di seguito.

Aggiornamenti

I risultati precedenti verranno aggiornati ogni tre o quattro giorni con i nuovi dati raccolti dall’OMS [1].

Aggiornamento del 5 febbraio

I dati recenti indicano che l’incremento giornaliero dei confermati continua ad aumentare con derivata seconda positiva, spostando in avanti t_{max}.  Se la derivata seconda si azzerasse o diventasse negativa in t, in [3] è stato dimostrato che t_{max}\leq t+1.32/\beta \approx 6 \: \; \textup{d}.  Ma per ora la derivata seconda è positiva. Ciò che sembra positivo è l’andamento dei casi sospetti (ricoverati in attesa di accertamento) il cui volume appare non lontano dalla saturazione, come mostra la Figura 5.


Figura 5- Dati grezzi ed estrapolazione dei casi sospetti.
Aggiornamento del 7 febbraio

L’incremento giornaliero di contagiati confermati è diminuito rispetto al giorno precedente, come mostra la Figura 6. Questo fatto era già successo negli ultimi giorni di Gennaio, in seguito a evidenti ritardi negli accertamenti. Ora è accompagnato dal rallentamento dei casi sospetti (Figura 5) Tuttavia occore cautela perchè anche in questo caso i dati mostrano un’anomalia molto simile a quella di Gennaio. L’istante intermedio è stimato intorno al giorno 40.

Figura 6 - Rateo giornaliero di casi confermati: dati grezzi, estrapolazione ed errore di stima.

Vale la pena mostrare un’altra anomalia simile a quella riscontrata nei dati dell’epidemia di SARS-COV a Taiwan (Figura 3, SARS, a destra). I decessi cumulati scalati ed estrapolati appaiono in anticipo rispetto ai confermati cumulati (Figura 7). Una prima ipotesi coerente con l’analisi dei dati dell’epidemia di SARS-COV è che gli accertamenti (e la trasmissione dati) siano in ritardo a motivo di una diagnosi difficoltosa. In pratica, l’incubazione dopo il contagio è asintomatico per parecchi giorni.

Figura 7 - Estrapolazione di casi confermati e decessi scalati. La scala è l'inverso del tasso di mortalità previsto al valore 1.7%.
Aggiornamento del 9 febbraio

Il rateo giornaliero di contagi confermati è in progressiva diminuzione e la stima dell’istante di picco t_{max} è stabile intorno al giorno 37 (6 Febbraio), molto vicino alla stima originale del 2 febbraio che indicava il giorno 36 come valore massimo. Assumendo che la diagnosi del contagio (si veda sotto) sia avvenuta con un ritardo di almeno una settimana (l’incubazione senza sintomi è stata stimata fino a due settimane), si può presumere che le misure del governo Cinese alla fine del mese di Gennaio siano state efficaci.


Figura 8 - Rateo giornaliero di contagi confermati in Cina (dati 
OMS). I dati sono stati interpolati con i minimi quadrati nonlineari (NLS) ed estrapolati con la logistica standard.

Il quadro è completato dalla sovrapposizione della curva dei contagi confermati e dei decessi cumulati  (in Cina) in Figura 9.  L’estrapolazione dei decessi appare in leggero ritardo rispetto all Figura 7. Ciò è dovuto ad una significativa riduzione del fattore di scala da 58.8 a 41.4, corrispondente ad un incremento del tasso di mortalità al 2.4%.


Figura 9 - Contagi confermati e decessi scalati e loro estrapolazione.
Aggiornamento del 12 febbraio

Le previsioni precedenti sono confermate dagli ultimi dati, pur con la massima  cautela a motivo dell’incertezza su virus, contagio e incubazione. La stima dell’istante t_{max} è ferma al giorno 37 come stabilito dall’ultimo aggiornamento (Figure 8 e 10). Anche il rateo giornaliero dei decessi è diminuito per la prima volta e l’estrapolazione in Figura 11, a sinistra, stima l’istante di picco intorno al giorno 23 (12 febbraio), con un ritardo di circa 6 giorni rispetto ai contagi confermati.  Un ritardo inferiore (circa 5 giorni) compare tra contagi cumulati e decessi cumulati e scalati in Figura 11, a destra. Anche i casi sospetti (in osservazione, non riportati in Figura) sono in calo.

Figura 10 - A sinistra. Aggiornamento di Figura 8 al 12 Febbraio. Contagi confermati in Cina e loro estrapolazione.



Figura 11 - A sinistra. Rateo giornaliero di decessi in Cina. Dati grezzi ed estrapolazione. A destra: Sovrapposizione di contagi confermati cumulati e di decessi cumulati e scalati, in Cina.
Aggiornamento del 13 febbraio


Figura 12. A sinistra. La provincia dell'Hubei e la sua capitale Wuhan sul Fiume Azzurro. Il lungo lago nel lato sinistro è formato dalla diga delle Tre Gole. A destra. Hubei nel cuore della Cina.

La fonte [6] riporta come in Cina vi sia stata un’impennata improvvisa e significativa di casi confermati giornalmente (15000 contro i 2000 degli ultimi giorni). Attendo i dati ufficiali dell’OMS.  Si tenga conto che i casi sospetti erano valutati in 16000.

Che cosa è successo? Secondo [6], nella provincia dell’Hubei (il centro dell’epidemia, Wuhan ne è la capitale) è stata adottata una nuova diagnosi di contagi e decessi. In pratica sia parte dei ricoverati sia  decessi  trascorsi sono stati ri-diagnosticati come affetti/causati da SARS-COV-2. Dei circa 15000 ri-diagnosticati solo circa 1600 sono i nuovi confermati, il che appare in accordo con le previsioni precedenti. Tuttavia ciò conferma la perdurante incertezza gravante su virus, contagio, sintomi e incubazione, e indica che i dati ufficiali, a motivo di tali incertezze, hanno finora sottostimato contagio e decessi. In pratica siamo in presenza di diagnosi ritardate, come già avvenuto nel caso dell’epidemia di SARS-COV (si veda sotto).

Aggiornamento del 19 febbraio

Purtroppo dal 17 febbraio OMS ha adottato la nuova diagnosi dei contagiati (da laboratorio e clinica), senza alcuna doverosa suddivisione tra le due diagnosi. Mi trovo quindi di fronte a un drastico cambiamento del modello logistico, che tuttavia intendo risolvere mantenendo un solo modello e assegnando una maggiore incertezza ai dati recenti che via via verrà scemata. Il risultato è che l’estrapolazione tende a dar maggior credito, per ora, alla regola precedente, come si vede da Figura 13. La stima dell’istante intermedio t_{max} è sempre nell’intorno del giorno 37.


Figura 13 - A sinistra: i contagi confermati cumulati. Si noti il gradino provocato dalla nuova regola. A destra: il rateo giornaliero di contagi confermati. Si noti, il giorno 47, il picco di circa 15000 nuovi contagiati (il dato grezzo indicato da un pallino rosso è fuori figura) e i successivi ratei polarizzati dalla nuova regola.

Aggiornamento del 21 febbraio

In Cina, il criterio di contagio è di nuovo stato modificato, ritornando alla precedente conferma di laboratorio. La scelta di associare ai dati della regola intermedia una larga incertezza è risultata corretta.

Aggiornamento del 22 febbraio

Il contagio del virus SARS-COV-2 in Cina continua a scemare, almeno elaborando i dati dell’OMS, mentre cresce al di fuori della Cina, in particolare in Corea del Sud, Giappone e Italia. Appare prematuro fare previsioni, sia perchè i dati provengono da zone disparate sia perchè l’istante intermedio t_{max} della curva logistica viene stimato a più di due settimane dalla data corrente (giorno 53). Non riporto per cautela la figura della relativa estrapolazione grafica.

Ciò suggerisce di seguire con cura le norme igieniche preventive suggerite da OMS [8] e autorità sanitarie nazionali.

1) Lavarsi spesso le mani o con acqua e sapone o con gel disinfettante almeno prima e dopo la propria presenza in ambienti pubblici e privati affollati.

2) Proteggere naso e bocca durante colpi di tosse e/o starnuti/sternuti (dal Latino sternutum, participio passato di sternuere, starnutire, Antico Greco, \pi \tau \alpha \varrho \mu \acute{o}\varsigma, starnuto, voci onamatopeiche?)  o con mascherina (ma attenzione ad un suo corretto uso) o con fazzoletto o altrimenti con il gomito.

3) Io riterrei appropriato anche lavarsi sovente il viso con acqua e sapone. Non ho tuttavia rintracciato quest’ultimo suggerimento, bensì quello di non toccarsi il viso con le mani, e quindi desumerei che lavarsi il viso sia un’efficace prevenzione. Un altro accorgimento è quello di lavarsi le narici  con fialette apposite.

4) Un suggerimento più arduo da mettere in pratica è quello di tenersi a distanza (almeno 1 metro, OMS) da persone che tossiscano o starnutiscano.

5) La mascherina viene suggerita dall’OMS [8] per proteggere gli estranei dalla propria tosse e/o starnuto (vedi punto 2) o allorchè ci si debba prendere cura di un contagiato. Tuttavia l’uso della mascherina richiede attenzione.

Ritengo, come provato in [7] per altre epidemie, che l’attuale stagione secca e fredda gravante sul Nord Italia sia a favore della diffusione dell’epidemia COVID-19.

Aggiornamento del 23 febbraio

Non mi sento per ora di mostrare grafici e tentare estrapolazioni del focolaio italiano.  Solo poche personali  e preliminari osservazioni, ovviamente rivedibili.

1) Il focolaio si è sviluppato in un piccolo centro urbano (Codogno, Provincia di Lodi, Lombardia) e non in una grande città. Questo dovrebbe consentire un più agevole contenimento del contagio. Tuttavia come osservato dal dottor M. Galli [10], il contagio, avvenuto fuori da ospedale di Codogno, è stato purtroppo amplificato nell’ospedale stesso.

2) L’apparente maggiore contagiosità in Cina rispetto all’epidemia SARS del 2003, potrebbe esserere correlata ad una maggior mobilità umana nelle grandi città cinesi. Alcuni semplici dati relativi a Wuhan, Milano e Lodi. La prima linea della metropolitana di Wuhan, epicentro dell’attuale epidemia  Covid-19 (l’epicentro dell’epidemia SARS 2003 fu nel sud della Cina, provincia di Guangdong e città di Hong Kong) fu inaugurata nel 2004. L’attuale rete metropolitana di Wuhan ha un’estensione di circa 330 km e trasporta mediamente 3.5 miloni di passeggeri al giorno.  Quella di Milano si estende per circa 97 km e trasporta circa 1.4 milioni di passeggeri al giorno. La densità abitativa dell’area metropolitana di Wuhan è  di circa 1300 abitanti/km2 (TBV). Quella della provincia di Milano è di circa 2000 abitanti/km2. La densità della provincia di Lodi è di circa 300 abitanti/km2.

3) I dati OMS della SARS 2003  mostrano una correlazione tra densità abitativa e tasso di mortalità (decessi/contagi confermati).  Hong Kong: densità circa 6800 abitanti/km2, tasso di mortalità 17%, provincia di Guangdong (capitale Canton): densità 628 abitanti/km2, rateo di mortalità in Cina 6.5%.  L’estrapolazione in Figura 14 stima il tasso finale leggermente superiore al 3%, meno della metà del rateo della SARS 2003 in Cina. Tali valori devono ritenersi limiti superiori, non essendo noto il numero effettivo di contagiati, ovviamente superiore (di quanto?) ai confermati.

Figura 14 - Dati grezzi (in rosso) e previsioni del rateo di mortalità dell'epidemia Covid-19 In Cina. Attenzione: decessi rispetto ai casi confermati (non ai casi accertati come gravi). Il primo picco irregolare si correla con il ritardo delle prime conferme di contagio. Il secondo picco si correla con la temporanea modifica del criterio di conferma.
Aggiornamento del 25 febbraio

La domanda è: l’allarme e le misure anti-contagio sono giustificate dal tasso di mortalità finora registrato? Credo che per rispondere, occorra comparare Covid-19 ad un’epidemia come l’influenza stagionale [9], ormai accettata come normale, e di cui esiste il vaccino.

Purtroppo i dati a disposizione, anche quelli raccolti da appositi osservatori,  sono o irregolari o troppo sintetici. Le stime mondiali dell’OMS [9] sono di decessi tra 290000 e 650000 contro casi gravi accertati (probabilmente ricoveri ospedalieri) da 3 a 5 milioni, da cui si desume un tasso di mortalità (rispetto ai casi gravi) tra il 10 e il 13%. Uno studio recente [11] stima la mortalità attribuita all’influenza in Europa (24 paesi) nella stagione 2017/18 a 254 ppm (ovvero 254 decessi per milione di abitanti). Se consideriamo i decessi attribuiti a Covid-19 in tutta la Cina (al 24 febbraio 2020) pari a circa 2600 e li riferiamo, per essere conservativi, alla sola popolazione della provincia dell’Hubei (epicentro dell’epidemia, Figura 12) di circa 60 milioni di persone, otteniamo 43 ppm, largamente inferiore al tasso di mortalità europeo dell’influenza (di cui esiste il vaccino). Tuttavia occorre considerare la drastica quarantena imposta dalle autorità cinesi: è equivalente ad una vaccinazione? Certamente la popolazione da considerare si riduce, ma abbiamo già considerato la sola popolazione della provincia dell’Hubei.  La comparazione è quindi piuttosto complessa. Occorrebbe riferirsi alla mortalità come rapporto tra decessi e casi confermati da laboratorio (eventualmente restringendosi ai solo casi gravi), il che tuttavia non sembra fornire dati certi nel caso dell’influenza.

La stima (si veda l’aggiornamento del 26 Febbraio) di contagiosità sembra giustificare provvedimenti di contenimento.

Il focolaio italiano. Mi accingo con una cert’apprensione a estrapolare i dati del focolaio italiano, ancora agl’inizi ? La difficoltà di estrapolazione sta nell’improvviso aumento di contagiati confermati contro un valore stabile lungo tre settimane (i ricoverati all’INMI L. Spallanzani di Roma). Farò due ipotesi estreme:

1) Ipotesi A -Il contagio nel focolaio Lodigiano è avvenuto improvvisamente, il che implica trattare tutti i dati alla stessa stregua.

2) Ipotesi B- Il contagio è avvenuto progressivemente, il che porta a ritenere i dati precedenti molto incerti (Figura 15). Ipotesi la più plausibile.

I dati impiegati di casi positivi (non ancora confermati, si veda oltre) sono dell’OMS [1], tranne l’ultimo desunto con un aggiustamento da Worldometer [2] .  Agendo sull’incertezza dei dati precedenti si ottiene la Figura 15, a destra. Ovviamente… cautela.




Figura 15. Casi positivi (non confermati, si veda oltre) del focolaio italiano ed estrapolazione. Ipotesi B.

Nota bene: l’estrapolazione in Figura 15 si è rivelata troppo prematura.

Aggiornamento del 26 febbraio

Dinamica dell’epidemia. I dati raccolti dall’OMS consentono con qualche cautela di identificare i parametri delle equazioni differenziali di Kormack-McKendrick, di seguito riportata:

\begin{matrix} \dot{x}\left ( t \right )=-x\left ( t \right )/\tau +\alpha x\left ( t \right )s\left ( t \right ),\, x\left ( t_{0} \right )=x_{0} \\\dot{s}\left ( t \right )=-\alpha x\left ( t \right )s\left ( t \right ),\, s\left ( t_{0} \right )=s_{0} \; (3)\\\dot{r}\left ( t \right )= x\left ( t \right )/\tau ,\, r\left ( t_{0} \right )=0 \end{matrix}

dove x indica gli attuali ricoverati (currently hospitalized=active cases), s indica la popolazione suscettibile d’infezione, r  somma la popolazione guarita e deceduta,  \tau è il tempo medio di guarigione (in giorni [d]) e R=s_{0}/\left ( \tau \alpha \right )  indica la contagiosità dell’epidemia (basic reproductive ratio) ed è l’obiettivo principale della stima. L’epidemia si manifesta allorquando R>1 , ovvero ogni contagiato genera più di un nuovo contagio. La somma delle tre popolazioni è assunta costante:

x\left ( t \right )+s\left ( t \right )+r\left ( t \right )=x_{0}+s_{0}

Maggiore R, più contagiosa è l’epidemia. Poichè s\left ( t \right ) non è noto, la stima dei parametri richiede di ottenere \dot{x}\left ( t \right )  dalla misura di x\left ( t \right ), disponibile giornalmente. La misura indiretta di \dot{x}\left ( t \right ) come si vede da Figura 16, a sinistra, è assai irregolare soprattutto negli ultimi giorni (forse in seguito alla modifica del criterio di conferma).  Ai valori più irregolari è stata assegnata un’opportuna incertezza.  Le equazioni in (3) consentono di scrivere una relazione lineare nei parametri, e quindi di stimarli mediante il metodo dei minimi quadrati (least squares, LS).  I parametri sono stati stimati accrescendo via via l’intervallo di tempo (a partire dal 20 Gennaio) e quindi il numero di misure a disposizione. L’andamento dei tre parametri \left \{ R,\tau ,s_{0}\right \} è in Figura 16, a destra.




Figura 16 - Stima dei parametri della dinamica epidemica. A sinistra: la derivata della popolazione ricoverata, ricostruzione e residuo. A destra: i tre parametri del modello: l'indice di contagiosità R, il tempo medio di guarigione \tau e la popolazione suscettibile.
WARNING, March 23. Profiles in figure 16 are wrong. See March 22 and 23 updates.

Come si nota in Figura 16, a destra, l’indice di contagiosità converge al momento intorno al valore R\cong 4, che si deve ritenere un valore elevato tenuto conto delle disposizioni di quarantena. La revisione in [12] riporta valori della letteratura tra 2 e 6.  Si noti come la decrescita di R sia accompagnata anche da una decrescita del tempo medio di guarigione \tau.  Questi risultati devono considerarsi preliminari e soggetti a revisione.  Si noti pure come il giorno di picco dei ricoveri giornalieri sia pressochè lo stesso del rateo giornaliero di casi confermati, intorno a 36. Il picco della popolazione ricoverata corrisponde allo zero della derivata, intorno al giorno 46.

Aggiornamento del 27 febbraio – ore 11:15 CET

Occorre distinguere, come chiarito dall’Istituto Superiore di Sanità [13], tra

1) i casi positivi alla prima  diagnosi del tampone faringeo: ricerca di sequenze note di RNA del virus SARS-COV-19 nel materiale genetico prelevato dal tampone ed elaborato;

2) i casi confermati da una seconda diagnosi eseguita da un altro istituto.

NB (6 marzo). I dati di Worldometer, dell’OMS  e della Protezione Civile sono sincronizzati alle 18:00 di ogni giorno.

1) Worldometer [2], ore 10.25 GMT, indica 470 casi confermati (total confirmed cases): in realtà questi sono casi positivi, come da definizione precedente, e corrispondono ai dati della Protezione Civile, somma dei casi positivi in cura (400 in Figura 17), dei guariti e dei decessi.

2) Il sito della Protezione civile italiana è fermo alle 18:00 del 26 febbraio (vedi Figura 17), l’ora in cui vengono aggiornati.

Figura 17 - Sito della protezione civile alle ore 11.15 del 27 Febbraio. Il termine positivo è stato definito in precedenza. Indirizzo: 
http://www.salute.gov.it/portale/ nuovocoronavirus   /dettaglioContenutiNuovoCoronavirus.jsp? lingua=italiano&id=5351&area=nuovoCoronavirus&menu=vuoto

3) La mappa sul sito del giornale Repubblica (aggiornata alle 8:00 CET del 27 febbraio) sommava a 452 casi positivi.

Figura 18 - Sito di Repubblica alle 11.15 del 27 Febbraio. I contagi riportati nella mappa (non tutti mostrati in Figura) sommavano a 452.
Aggiornamento del 28 febbraio

Focolaio italiano.  L’estrapolazione di Figura 15 si è rivelata troppo prematura, come si vede da Figura 19, in cui sono riportate sia l’estrapolazione dei casi positivi cumulati (a sinistra in figura) sia il loro rateo giornaliero (a destra in figura).  La stima di t_{max} è pari al giorno 64 (4 marzo pv) e si desume dall’estrapolazione del rateo giornaliero (Figura 19, a destra). L’estrapolazione sembra robusta a modifiche dell’incertezza assegnata ai dati costanti prima del giorno 53. Ancora … cautela. Ho parecchi dubbi su come utilizzare le misure iniziali. Credo si debbano eliminare…




Figura 19 - Focolaio italiano.A sinistra, i casi positivi cumulati. A destra il loro rateo giornaliero con relativa estrapolazione.
Aggiornamento del 1° marzo

Cina. In Figura 20, estrapolazione dei contagi confermati e dei decessi giornalieri, al 29 Febbraio 2020 (dati OMS).



Figura 20 - A sinistra, rateo giornaliero di casi confermati. A destra: rateo giornaliero di decessi.

Italia. Le estrapolazioni precedenti si sono rivelate assolutamente premature. Il rateo giornaliero di positivi è salito a circa 500.  Attendo ancora qualche giorno prima di estrapolare.

Aggiornamento del 3 Marzo- March 3 update

China. Data show epidemy close to an end. Today extrapolations repeat those in Figure 20.

Italia. Le estrapolazioni sono ancora assai incerte: dipendono fortemente dal modello d’incertezza assegnato. In particolare, il calo di ratei dal 2 al 3 marzo contro il balzo dal 1° al 2 Marzo è significativo? Ho mantenuto l’ipotesi B per quanto riguarda l’incertezza dei primi dati e ho assegnato (caso B1) una leggera incertezza al balzo, il che toglie significato alla successiva caduta. La Figura 21 compara l’estrapolazione del rateo di positivi con (B1, pessimistica) e senza incertezza (B0, ottimistica).




Figura 21- Italia: ipotesi B0 (ottimistica) e B1 (pessimistica).
Aggiornamento del 6 Marzo – March 6 update

China. Cumulative and daily confirmed cases repeat the profiles in Figure 20. Daily confirmed cases are shown in Figure 22, left. The peak day estimate is t_{max}=37.6\, \textup{d} (February 7) , close to the original prediction of day 36. Figure 22, right, predicts the final mortality rate \mu defined by the ratio between confirmed deaths and confirmed cases cto be close to 3.9%.



Figure 22 - China. Left: daily rate of confirmed cases. right: mortality rate.

Mortality comparison with seasonal influenza (briefly ‘flu’). A first comparison was done on February 25, based on the mortality rate defined as the ratio between confirmed deaths and country population.  We repeat the findings: 1) Europe mortality due to flu in the season 2017/18 estimated to 254 ppm (deaths per million inhabitants, from [11]). The rate is very similar to Italian average rate of 284  ppm  in the four seasons from 2013 t0 2017 [14]. 2) Updated Covid-19 mortality in the China Hubei province (see Figure 12) estimated to 2019/59170000=34 ppm (from WHO data [15]), about 15% of European flu mortality.  As already remarked, a direct comparison is questionable since flu is curbed by vaccination, and in China, Covid-19 has been curbed by  quarantine. Clearly, both limitations act in the same directions, but, unfortunately, we do not know their relative strength.  An equal mortality rate would imply that Chinese quarantine strength is more than six times greater than European vaccination against flu.

(continued). Actually, WHO (World Health Organization) and scientific papers report flu mortality rates (<<1%) which, at first sight, are lower than Covid-19’s.

 From WHO's document [18].
"Mortality for COVID-19 appears higher than for influenza, especially seasonal influenza. While the true mortality of COVID-19 will take some time to fully understand, the data we have so far indicate that the crude mortality ratio (the number of reported deaths divided by the reported cases) is between 3-4%, the infection mortality rate (the number of reported deaths divided by the number of infections) will be lower. For seasonal influenza, mortality is usually well below 0.1%. However, mortality is to a large extent determined by access to and quality of health care." 
My remark: please, notice the different definition of mortality rate for Covid-19 (reported deaths/reported cases) and seasonal influenza (reported deaths/number of infections). No serious comparison can be done!

In this case mortality rate  should be defined as the ratio between confirmed deaths and confirmed infected cases, as in Figure 22, right. The term ‘reported case’ in the WHO’s statement looks too vague.  The key issue is how to find reliable data  of flu confirmed cases. In the case of China Covid-19, data should be kept as rather reliable since each case, hospitalized, should correspond to an official laboratory confirmation of the virus infection (virus genome has been detected), and data anomalies have been discovered also by the present analysis. What about influenza? Let us report the US CDC data in [16] for the season 2018-19. The estimated infected cases are subdivided into ‘symptomatic illnesses, medical visits, hospitalizations and deaths’. No confirmed cases are explicitly mentioned, but the estimation method in [17] suggests that hospitalization is an estimate of confirmed cases: hospitalized with respiratory illness in the US sentinel health network are tested for detecting influenza virus, and data are extrapolated to US population. Table 2 shows estimated hospitalizations and deaths (together with their uncertainty range covering 95% of the available cases), and the mortality rate defined by deaths/hospitalizations. Values in Table 2 and previous discussion hardly claim that Covid-19 mortality rate is larger than seasonal influenza’s.

Table 2 – Estimated flu mortality rate  in US (season 2017-18)  compared to China Covid-19
No Type US 2017-18 hospitalization [kVol] from [16] US 2017-18  deaths [kVol] from [16] US 2017-18 mortality rate [kVol/kVol] China Covid-19 mortality rate (from Figure 22, right)
1 Estimate 808 61 0.075 0.038 (extrapolated)
2 Uncertainty 621 to 1357 (95%) 46 to 95 (95%) 0.040 to 0.13 TBD
kVol =number of individuals/1000

Italia. Ho ritardato a mostrare le estrapolazioni del caso italiano vista incertezza e sensibilità nei giorni scorsi. Ora con la cautela del caso, l’estrapolazione dei casi confermati sia cumulativa sia giornaliera non si contraddicono e appaiono robuste all’assegnazione d’incertezza (l’ipotesi è quella di Figura 21 a destra, B1). Come sempre … massima cautela.


Figure 23 - Italy. Left: cumulative positive cases. Right: daily rate. Daily rate of the cumulative extrapolation in magenta.

March 12 update

China. Figure 24 shows raw data and extrapolation of the daily confirmed cases.

Figure 24: China daily rates

Italy. Data elaboration of past days showed discrepancy between cumulative extrapolation and daily rate of the positive cases (different from Chinese confirmed cases). To try to synchronize them up to some delay, as suggested from experiments with SARS-COV data, we assigned some uncertainty to last daily raw data. See Figure 25. By the way, … high caution!


Figure 25: Italy. Left: cumulative positive cases compared to China delayed logistic. Right: daily rate extrapolation from the left cumulative profuile and from direct fitting of daily rate raw data (uncertainty added).
March 13 update

Italy. The daily rate of positive cases confirms the yesterday extrapolations, meaning that epidemy looks close to mid-time, denoted in the previous analysis as t_{max} and estimated between March 17 and 20. Figure 26 compares cumulative and rate profiles of positive cases (Italy) and confirmed cases (China). A correct comparison should roughly account of the ratio between Hubei province and Northern Italy population, which is very close to 2 (two). This implies that Chinese profiles should be divided by 2, making them smaller than Italian ones. May  reduction correlate with different quarantine measures?



Figure 26: Italy. Left: comparison between Italian cumulative positive cases and Chinese cumulative confirmed cases. Right: comparison of the direct extrapolation of daily rates with the cumulative extrapolation rate and the Chinese daily rate extrapolation (green).

Since tests lead the daily positive cases of one day, test scaling (uncertain) allows raw data to be advanced of one day. Accounting for uncertainty, the updated extrapolation makes the mid-time to coincide with the time estimated from the cumulative profile. The result seems to confirm the previous estimate from March 17 to March 20. As always … caution. Actual models assume stationarity of the epidemy model. New sources of infection may disrupt extrapolations.


Figure 27- Italy. Left: scaled daily test count and aligned positive cases (one day delay). Right: one-day updated daily rate (blue).
March 16 update

Italy . Extrapolations look not very different from those of March 13, in Figure 27.  Two positive findings: (1) mid-time estimate  t_{max} of the cumulative estrapolation converges to the mid-time estimate from the direct extrapolation of the daily rate data (Figure 28), (2) the test volume recorded on March 16 is smaller than that of  previous days and thus keeps the mid-time estimate blocked.  By the way, caution … some epidemy fomites do not seem to slow down!













Figure 28 - Italy: Left, cumulative positive cases compared with China. Right: daily rate without March 16 test data.

Figure 28 left seems telling us that the cumulative Italian positive cases track China evolution. As I have already mentioned above, Chinese cases should be roughly divided by 2. But let us look at the death rates in Figure 29.  The Italian rate coefficient \beta in equation (1) is estimated to be double than China: \beta_{IT }\cong 2\beta_{CH}\cong 0.3. May any reason be found? As a trial: (1) delay to impose the right quarantine measures, (2) very old Italian population, (3) saturation of Italian hospitalization. I would like to be contradicted by neat and sure proofs. A first step of the point (2) proof is in Figure 29, right. The mean age of Covid-19 deaths is about 80 years (the dispersion is about 10 years). Compared to 2018 Italian mortality (green histogram), death age by Covid 19 is about 3-year anticipated, in the average. The underlying probability distribution is slightly negatively skewed, but not very far from the overlapping normal.  The China death histogram was reconstructed by multiplying the confirmed case histogram by the percentage of deaths per age ([20], caveat). The mean age of Covid-19 Chinese deaths is about 70 years.



Figure 29 - Left: Italy cumulative deaths and extrapolation comparison with China. Center: Italy, death histogram versus age (blue, March 13, [19]), normal probability distribution and 2018 mortality in Italy (green, [21]). Right: reconstructed China Covid-19 death histogram ([22],caveat).
March 17 update

Good news! Today, the same two positive findings of yesterday! Let us hope…

March 21 update

In the past days, the daily rate of positive cases abnormally increased with respect to previous extrapolations. For instance, the peak daily rate of 4500 cases in Figure 28, right, has been bypassed by the daily rate of March 20, equal to about 6560.  To find out the causes and reset correct expectations we proceed along two steps which require elaboration of other batches of data .

1) As already pointed out in Figure 27,  daily test counts (in Figure 30, left, they  are roughly scaled to track the positive cases) are available from [19] and show a great surge, which corresponds to an increase in positive cases as in Figure 30, left. The surge looks incoherent with previous data and disrupts previous extrapolations. Which is the reason? As shown by the second step, the surge of test counts tends to discover new positive cases but free of symptoms that require hospitalization. Thus we need to study cumulative hospitalization data, to ascertain whether they adhere to a stationary model.

2) We define the hospitalization cases as the sum of active cases (current hospitalized people), recovered cases (healed people) and death cases. Such data are available from [19]. The cumulative data (red circles) and extrapolation (dashed blu) show that the peak instant t_{max} should occur soon. Somebody may object that hospitalization has been progressively constrained by hospital resources. Since it may be partly true, as always … caution. On the contrary, hospitalization volume looks coherent with China confirmed cases, both of them being proportional to Northern Italy and Hubei province population,the ratio being about 1/2, as already remarked. The abnormal finding is the mortality rate defined as the ratio death cases/hospitalized (confirmed) cases, which amounts to about 16%, four times the China rate.  The major cause, if not the only one, is the very old Italian population (see Figure 29, center and right). This fact, should be carefully meditated by Italian society and institutions, government, churches, healthcare, judiciary:

Natura capta ferum hominem cepit














Figure 30. Italy. Left: positive cases and scaled test counts. The manual scale is fluctuating around between 0.2 and 0.3 showing significant randomness around a mean value. The surge is evident since day 75. Right: cumulative hospitalization compared to cumulative positive cases.
March 22, 23 and 24 updates

March 22. Italy. As predicted in previous daily updates, epidemy mid time looks close.  How to reinforce the prediction? Two ways:

1) We plot day by day the estimated parameters of the analytic model, in this case either the standard logistic in (2) or the its time rate (the bell-shape profile). With reference to cumulated hospitalized in Figure 30, right, they are: (i) the maximum volume y_{max} [kVol] (red line), (ii) the exponential time constant 1/\beta [day] (gree line), (iii) the mid-time t_{max} [day] (blue line), i.e. the peak time of the bell-shape profile. As time progresses, parameter profiles are required to converge to a horizontal line in agreement with stationarity assumption of the model.  Figure 31  shows that profiles still fluctuate (especially the profile of y_{max}), but they seem, hopefully, converging to a constant value.

2) The estimated logistic at a past date d\leq d_{0}, where d_{0} is the current date, is extrapolated until d_{0} and the RMS (root mean square) of the fitting/extrapolation error is computed. Also in the case, the error RMS should converge to a constant value (black profile in Figure 31).

No variable uncertainty has been assigned to  raw data.

Figure 31 - Italy: time profiles of logistic parameters and the prediction error RMS, for the cumulated hospitalized cases.
On March 23, parameter profiles show better                                 convergence to constant values, thus confirming previous predictions.  
On March 24, converging estimates are close to be constant 
A posteriori estimation uncertainty looks rather low, less than 1% (3\sigma)                                      
                  

March 23, China. Sorry, the profiles in Figure 16 about epidemy parameter estimation were checked to be wrong. Correct and updated profiles are in Figure 32. They show convergence of the three parameters of the Kormack-McKendrick model in (3). They are  (i) the reproduction factor R (dimensionless),  (ii) the mean time to recover \tau [days] and (iii) the initial susceptible population s_{0} [Vol]. The reproduction factor converges to a rather low value, about 1.7, smaller than known literature [12]. Likely, is due to strict quarantine.  The initial susceptible/affectable population converges to about 500000 people. Which is the meaning? Asymptomatic infected people?

Figure 32 - China: Left, raw data and estimated profile of the hospitalization rate (positive and negative). Right: time profile of  model parameters which converge to a constant value. Final uncertainty less than 6% (3 \sigma).

March 24, China. WARNING. A drift appears in the daily rate of confirmed cases (see Figure 33). Hope it will be soon contrasted! This should be a WARNING to Italy and worldwide, too. We should prepare to continuously restrain infection and monitor infection level. Welfare, democratic and inclusive societies should change government and institution organization.

Figure 33 - China. Left: daily rate of confirmed cases. Right: zoom showing the current drift
March 31 update

Italy. The logistic mid-time t_{max} is now surpassed: cumulative (magenta) and rate logistic (blue) of the positive cases (Figure 34, left) fairly overlap, time estimate being confined between 82 and 84 day (22 and 24 March). Estimate residuals (in green) show a weekly period (7 days) in the positive cases recording, which is correlated with the Covid-19 test data (not shown). Fairly the same mid-time range is estimated from the hospitalized cases,  as shown by the blue curve in Figure 34, right.

Figure 34- Italy. Left: daily rates of positive cases with direct (blue) and cumulative (magenta) extrapolation.  Right: progressive profile of the logistic rate parameters.

It is now of interest the estimation of infections parameters like the reproduction factor R (how many people are infected by a single individual per day) and the mean time to remove \tau [d] (the mean time interval between positive test reponse and de-hospitalization). De-hospitalization includes both recovered and died people to be simple.  Positive (subscript p) and hospitalized cases (subscript h) will treated separately. The difference \tau_{i} =\tau _{p}-\tau _{h} can be interpreted as a lower bound of the mean time of incubation, since the set of positive cases is a lower bound of the infected people. The estimation assumes the following simplified version of the KM equations in (3), valid under constant susceptible people s\left ( t\rightarrow 0 \right )=s_{0} , which occurs in early times:

\begin{matrix} \dot{x}\left ( t \right )=\left (R-1\right )/\tau x\left ( t \right ),\, x\left ( t_{0} \right )=x_{0} \\\dot{r}\left ( t \right )= x\left ( t \right )/\tau ,\, r\left ( t_{0} \right )=0 \end{matrix}\; \left ( 4 \right )

Figure 35 -Italy. Left: epidemic parameters of positive cases. Right: from hospitalized cases.

Figure 35 shows the progressive estimates and their mean value. It is clear from the profile of the eman time to recover \tau that the simplified model in (4) ceases to be valid as soon as the mid time  t_{max} is approached, around day 80.  The most significant parameters are (i)  the positive reproduction factor, R_{p}\cong 8.2, a very high factor, (ii) the mean incubation time \tau _{i }\cong 13.9 \: \; \textup{days}. Both prameters testify the Covid-19 subtlety. It would be of interest a comparison with China parameters, but unfortunately earlier data (before January 20) are missing.  A rough estimate based on the available early data indicates R_{CH}>20 more than twice R_{p}\cong 8.2.

April 6 update

Italy. The daily rate of positive cases (including hospitalized and quarantined cases) is decreasing, but not with the same rate of the increasing phase which ended around March 23 (previous forecastings indicated March 20). This bevahiour cannot be fitted by the the standard logistic expression in (2), but should rely on the generic standard logistic formula, that is on the free response of the differential equation in (1). In our case, the exponent n is less than one, and becomes a further parameter to be estimated. The generic logistic fomulas (cumulative and rate) are the following

y\left ( t \right )= \frac{x_{max}}{\left (1+nexp\left (-\beta \left ( t-t_{max} \right ) \right ) \right )^{\frac{1}{n}}}\: (5)

\dot{y}\left ( t \right )=\beta \frac{x_{max}exp\left (-\beta \left ( t-t_{max} \right ) \right )}{\left (1+nexp\left (-\beta \left ( t-t_{max} \right ) \right ) \right )^{\frac{1}{n}+1}}\: (6))

Figure 36, left, shows the cumulative positive cases obtained by fitting the cumulative logistic curve with n=1 and n<1. The right figure shows the daily rate of positive cases. Asymmetric and symmetric curves look at first sight not very different. The reason is that the symmetric logistic shifts the peak time t_{max} in advance to get a better fitting. The fitting error oscillations indicate weekly variations in data collection. Estimated parameters are in Table 3. We should notice the low value of the exponent n  which is responsible for the asymmetry.

Which is the reason of the asymmetry? One reason could be related to the prgressively increased volume of discovered positive cases. The reason correlates with the fairly symmetric daily rate of hospitalized cases, as indicated by the higher exponent n in Table 3, row 5.













Figure 36 - Italy. Left: cumulative positive cases fitted by asymmetric and symmetric logistic curve. Right: the daily rate of positive case
Table 3 – Italy: fitting positive cases with asymmetric and symmetric logistic
No Parameter Symbol Unit Asymmetric fitting Symmetric
Positive cases
1 Peak time t_{max} d 84.1 84.6
2 Maximum volume y_{max} kVol 177 144
3 Exponent n dimless o.22 1
Hospitalized cases
4 Peak time t_{max} d 83.4 84.2
5 Exponent n dimless 0.48 1
April 7 update

Torino (province of), Italy. Fitting the daily rate of positive cases with the generalized logistic function in (6), we found that the exponent n tended to become negative, implying that the logistic model fails. The reason becomes clear by observing that numerator and denominator exponentials posses the same coefficient \beta \, [1/\textup{day}], thus imposing the same rate to the early increasing exponential and the final decreasing exponential.

Figure 37 shows raw data of daily positive cases: they look rather irregular, sometimes due to one day reporting delay. The asymmetric logistic (solid blue) better fits the irregular data than the symmetric one (dashed blue), but the exponent n tends to be negative as already mentioned. It has been blocked close to zero (about 0.043) by the barrier function -\gamma \textup{log}\left ( n \right ) where \gamma must be tuned on the specific case.  The fact is that the estimated exponential coefficient \beta =0.089 \: \textup{1/d} cannot fit at the same time increasing and decreasing profiles. In fact the symmetric logistic estimates a higher coefficient \beta =0.15 \: \textup{1/d}  more suitable to the early profile.


Figure 37 - Province of Torino, Italy. Symmetric and asymmetric fitting of irregular daily positive cases.
April 12 update

Italy. Raw data of positive cases look distorted by the progressively high  daily volume of test cases. I presume that the goal should be to search for asymptomatic operators, who attend hospitalized (and not) people.  The result is that Italian positive cases slowly decreases with significant oscillations of a weekly period. Daily rates of positive and test cases are shown in Figure 38, left. The test cases volume has been divided by ten, which implies that the current fraction of positive cases is less than 10% (a huge and expensive effort, of which utility?). Raw data of positive cases are overlapped with the extrapolation of the fitted asymmetric logistic defined in (6). This means that contrary to China confirmed cases, Italian positive cases cannot be fitted by logistic models. In fact, during the last ten days the average rate turned to be fairly constant, giving the impression of an erratic standstill!  Is Italian government (central and regional, though randomly) being driven by such confused data to modulate quarantine decisions?



Figure 38- Italy. Left: daily rate of positive (red,blue) and test cases (black). right: active cases (currently hospitalized) in China and Italy.

To overcome the difficulty and to better understand and predict epidemy slow down, we could clean positive cases from components correlated with the test drift, which looks a rather uncertain task. We prefer to rely on the raw data of hospitalized people, who are better discriminated as already mentioned and should coincide with China confirmed cases (so to make a comparison). The cumulative hospitalized cases are the sum of currently hospitalized cases (active cases, x\left ( t \right ) in the KM equations (3)), recovered and died cases (their sum has been denoted by r\left ( t \right )  in (3)). We are focusing on the daily rate of active cases, that is with \dot{x}\left ( t \right ) in (3), which is indirectly measurable. KM equations allow us to reconstruct \dot{x}\left ( t \right ) from x\left ( t \right ) and r\left ( t \right ), and to estimate the parameters in (3). See Figure 32.

The first step is to compare Italian and Chinese reconstructed daily rates of active cases, as they pass form being positive during epidemy outbreak to become negative during infection slew down. Significant times are the zero crossing time t_{0}, the positive peak time t_{max} and the negative peak time t_{min}. They are reported in Table 4. Figure 38, right, shows that China and Italy positive phases have different durations, a fact to be investigated. The ratio of their peak values \xi _{max}=\dot{x}_{IT,max}/\dot{x}_{CH,max}\cong 0.41 is close to the ratio of Northern Italy and Hubei province population (less than 0.5), which implies that, in both countries, epidemy has developed in a similar way, notwithstanding  different quarantine strengths.  The ratio of the positive phase durations amounts to \tau _{+}=\tau_{IT,+}/\tau_{CH,+}\cong 1.5, which may help to predict Italian negative peak time to about  t _{IT,min} \cong 114 \: d \: (\textup{April, 23}). Notice that the Italian positive peak time (row 1) coincides with our peak prediction of Italian positive cases (day 80), when Covid-19 tests were restricted to symptomatic people. Subsequently and currently, peak time estimation day by day drifted forward, as entrained by the huge test drift.

Table 4 – Active case comparison (April 11)
No Parameter Symbol Unit Italy China
1 Positive peak time t_{max} d 79 37
2 Zero crossing time t_{0}-t_{max} d 16.5 11.3
3 Negative peak time t_{min}-t_{max} d 30.7 (+) 21
4 Positive peak volume \dot{x}_{max} kVol 1.46 3.51
5 Negative peak volume \left | \dot{x} _{min}\right | kVol NA 2.58
(+) Predicted

The negative peak time looks a significant date. In China, less than a week later (actually four days later, on day 62) the confirmed case rate  (dashed blue) entered the epidemy queue band , when erratic daily rates (under study) remain below an upper bound (dashed red, 200 confirmed cases in China, but fairly equal to South Korea). I hope the same will occur to Italy! See Figure 39.

Figure 39 - China: daily rates of active (solid blue) and confirmed cases (dashed blue), both overlapping raw data. The dashed red bound intersects the confirmed case profile at the negative peak time of the active cases, thus marking a significant epidemy date.
References

[1] World Health Organization, Novel coronavirus (nCoV-2019)-Situation reports from 1 to 12, February 1, 2020, e seguenti.

[2] Worldometer, Wuhan coronavirus outbreak, February 2, 2020, from https://www.worldometers.info/coronavirus/#age, e seguenti

[3] E. Canuto and D. Mazza, Introduction to population dynamics and resource exploitation, Politecnico di Torino, see the Article in this site.

[4]  C. Cao, W. Chen, S. Zheng, J. Zhao, J. Wang  and W. Cao, Analysis of Spatiotemporal Characteristics of Pandemic SARS Spread in Mainland China, BioMed Research International, 2016, pp. 1-12.

[5] World Health Organization, Cumulative Number of Reported Probable Cases of Severe Acute Respiratory Syndrome (SARS), From 17 March 2003 to 21 April 2004. From https://www.who.int/csr/sars/country/en/

[6] Worldometer, COVID-19 Coronavirus Outbreak, February 13, 2020. from https://www.worldometers.info/coronavirus/#age

[7] L.M. Casanova, S. Jeon, W. A. Rutala, D.J. Weber and M.D. Sobsey,  Effects of Air Temperature and Relative Humidityon Coronavirus Survival on Surfaces, Applied and Environmnetal Microbiology, Vol. 76, No. 9, May 2010, p. 2712–2717.

[8] World Health Organization, Coronavirus disease (COVID-19) advice for the public: When and how to use masks, from https://www.who.int/emergencies/diseases/novel-coronavirus-2019/advice-for-public/when-and-how-to-use-masks.

[9] World Health Organization, Influenza (seasonal), from https://www.who.int/en/news-room/fact-sheets/detail/influenza-(seasonal).

[10] L. Ripamonti,  Coronavirus, l’infettivologo Galli: «L’epidemia nata fuori dall’ospedale, dov’è stata soltanto amplificata. Ecco perché tanti casi in Italia», Corriere della Sera, 24 febbraio 2020.

[11] J. Nielsen et al., European all-cause excess and influenza-attributable mortality in the2017/18 season: should the burden of influenza B be reconsidered?, Clinical Microbiology and Infection, Vol. 25, 2019, pp. 1266-1276.

[12] Y. Liu, A.A. Gayle, A. Wilder-Smith and J. Rocklöv, The reproductive number of COVID-19 is higher compared to SARS coronavirus, Journal of Travel Medicine,2020, 1–4, from https://academic.oup.com/jtm/advance-article/doi/10.1093/jtm/taaa021/5735319.

[13] Istituto Superiore di Sanità, Casi confermati in Italia saranno comunicati dal ministero della Salute, from https://www.iss.it/?p=5158.

[14] A. Rosano, A. Bella, F. Gesualdo, A. Acampora, P. Pezzotti, S. Marchetti, W. Ricciardi and C. Rizzo, Investigating the impact of influenza on excess mortality in all ages in Italy during recent seasons (2013/14–2016/17 seasons), Int. J. of Infectious Diseases, Vol. 88, 2019, pp.  127–134.

[15] World Health Organization (WHO), Coronavirus disease 2019 (COVID-19) Situation Report –45 (March 5, 2020).

[16] Center for Desease Control and Prevention (CDC), Estimated Influenza Illnesses, Medical visits, Hospitalizations, and Deaths in the United States — 2018–2019 influenza season, https://www.cdc.gov/flu/about/burden/2018-2019.html.

[17] Center for Desease Control and Prevention (CDC), How CDC Estimates the Burden of Seasonal Influenza in the U.S., from https://www.cdc.gov/flu/about/burden/how-cdc-estimates.htm.

[18] World Health Organization (WHO), Coronavirus disease 2019 (COVID-19) Situation Report –46 (March 6, 2020), SUBJECT IN FOCUS: Q&A: Similarities and differences –COVID-19 and influenza.

[19] Il Sole 24 ore, Lab24, Coronavirus in Italia, i dati e la mappa, Aggiornato al 17 marzo 2020, ore 18.00. Variazioni rispetto al giorno precedente. E seguenti.

[20] Statista, Breakdown of 44,672 sample patients infected with novel coronavirus COVID-19 in China as of February 11, 2020, by age group, https://www.statista.com/statistics/1095024/china-age-distribution-of-wuhan-coronavirus-covid-19-patients/

[21] ISTAT, Tavole di mortalità, 2018, from http://dati.istat.it/Index.aspx?DataSetCode=DCIS_MORTALITA