Simple metoder til at forstå epidemiudbrud

Det aktuelle udbrud af Coronavirus eller Covid-19 bliver naturligt behandlet intensivt i medierne. Her ser vi på, hvordan en epidemi udvikler sig, så man får en bedre forståelse af om epidemien accelerer eller vi er på vej til at inddæmme den.

I to tidligere artikler er der set på den såkaldte SIR model for epidemiudbrud i en befolkning. Karantæners betydning for spredning af coronavirus beskrev, hvordan man kunne nedsætte smitteraten ved hjælp af karantæne, og hvad det betyder for smittehastigheden i befolkningen. Hvorfor er det svært at forudsige epidemier, lige efter de er gået i udbrud? fortæller i detaljer om de store usikkerheder, der er i estimationen af epidemiers forløb i de tidlige faser, hvor data er usikre.

I dette indlæg vil vi bruge en meget simpel beskrivelse af udviklingen af epidemien ved en eksponentiel udvikling, eller rentesregning, der specielt er god i den første fase af et udbrud. I starten af et udbrud, der er nemlig ikke nogen, der er immune, og alle kan smittes.

Udviklingen i starten af et epidemiudbrud er som rentesregning

I starten af en epidemi er der næsten ingen immune i forhold til antallet af syge, og det er derfor en god tilnærmelse at antage, at alle kan smittes. Man kan også tænke på det som om, at man har en “uendelig stor” population i forhold til antallet af syge. Dette er en simplere model end SIR modellen, der tager højde for at nogle er immune eller kommer i karantæne.

Figur 1: Eksempel på eksponentiel vækst med daglig tilvækst på 5%, 10% og 15%.

Dette kan for eksempel udtrykkes ved, hvor stor tilvæksten er per dag, f.eks. \(v=10\%=0.1\). Så vil hver inficerede person smitte \(v\) andre personer hver dag. Hvis man starter med \(s(0)=a\) syge til tid \(t=0\), så har man næste dag \(s(1)=a\cdot(1+v)\) syge, og til dag 2 er der \(s(2)=a\cdot(1+v)\cdot(1+v)=a\cdot(1+v)^2\) syge. Til dag \(t\) har man \(s(t)=a\cdot(1+v)^t\) syge. Dette er helt som hvis man tilskrev rente på en bankkonto, hvor man dog ville regne \(t\) i år i stedet for dage som vi gør her, og kaldes en eksponentiel vækst.

Hvor hurtigt kan man fylde et svømmebassin med vand?

I en hvis forstand er eksponentielle funktioner en af de klasser af funktioner, der vokser hurtigst, og det er derfor, at befolkningen i langt de fleste lande med Covid-19 er pålagt strenge restriktioner mod at forsamle sig, så man kan reducere tilvæksten \(v\).

Vi vil give et eksempel, der kan illustrere, hvorfor man skal have stor respekt for den eksponentielle udvikling.

Forestil jer, at vi har et stort tomt svømmebassin, og vi på dag 0 fylder en dråbe i, på dag 1 endnu en dråbe, dag 2 to dråber, dag 3 fire dråber, og så fremdeles. Det svarer til, at vi hver dag fordobler mængden af vand i bassinet og derfor har en daglig tilvækst på \(v=100\%=1\). Antallet af dråber i bassinet til tid \(t\) er \(s(t)=(1+v)^t=2^t\). Hvor mange dage vil det tage at fylde svømmebassinet?

Vi skal først regne ud hvor mange dråber vi skal bruge. Hvis vi antager at bassinet er 3m dybt, 10m bredt, og 50m langt, så er der \(3 \cdot 10 \cdot 50\text{m}^3=1500\text{m}^3\) vand i bassinet. Ifølge DMI er en lille regndråbe 3mm i diameter og en stor regndråbe 5mm. Til vores formål regner vi med en kubisk regndråbe med en sidelængde på 3mm, der så får en volumen på \(3 \cdot 3 \cdot 3\text{mm}^3=27\text{mm}^3\). I alt kan der i svømmebassinet være \(1500\text{m}^3/27\text{mm}^3\) = \(1500 * 1000^3\text{mm}^3/27\text{mm}^3 =\) \(55555555556 = 55.6\cdot 10^9\), dvs. ca. 56 mia dråber.1 Til sammenligning er jordens befolkning ca 7.8 mia mennesker.

Så hvor mange dage går der før bassinet er fyldt, når vi starter med en dråbe og hvor dag fordobler mængden af vand? Svaret fås ved at løse ligningen \(2^t=55.6 \cdot 10^9\), \(t = \log(55.6 \cdot 10^9)/\log(2) = 35.7\) dage. Med andre ord, så fyldes svømmebassinet på kun lidt over en måned… Man taler også om, at den eksponentielle udvikling går langsomt i starten og så accelererer. I eksemplet ovenfor vil halvdelen af vandet være kommet til på den pågældende dag.

Udviklingen kan beskrives ved daglig vækstrate eller fordoblingstiden

Vi har ovenfor set, at den eksponentielle vækst kan beskrive ved den daglige tilvækst \(v\). Vi skal nu se, at væksthastigheden også kan beskrives ved fordoblingstiden \(d\).

Så hvis vi til tid \(t\) har \(s(t)\) syge, hvor lang tid \(d\) skal der så gå, før vi har dobbelt så mange syge?

Dette svarer til at løse ligningen \(s(t+d)=2s(t)\), eller \(a\cdot(1+v)^{(t+d)}=2a\cdot(1+v)^t\), og løsningen er \(d=\log(2)/\log(1+v)\). Vi ser, at hvis vi har en daglig tilvækst på 100%, så får vi præcist \(d=1\) som forventet, en fordobling hver dag, og vi ser også, at udtrykket for \(d\) ikke afhænger af starttidspunktet \(t\). Fordoblingstiden \(d\) og den daglige tilvækst \(v\) er altså lige gode til at beskrive forløbet af antal syge.

Vi kan også regne den daglige tilvækst ud fra fordoblingstiden, \(v=10^{(\log_{10}(2)/d)}-1\), hvor det nu er vigtigt at \(\log_{10}\) er 10-tals logaritmen. Har man en fordobling hver anden dag, \(d=2\), så får man en daglig tilvækst på 41%. Er den daglige tilvækst 25%, så får man en fordoblingstid på 3.1 dag. Hvis eksemplet med svømmebassinet havde en fordobling hver tredie dag, i stedet for hver dag, så ville der i stedet går \(3 \cdot 35.7 = 107.1\) dage før bassinet er fyldt.

Når man kigger på rigtige data, så vil der være tilfældige udsving fra dag til dag, og man vil ofte bruge flere dage for at få et mere stabilt og sikkert estimat af fordoblingstiden og den daglige tilvækst.

Grafen med de logaritmiske tal bliver en ret linie

Det kan være svært at kigge på “buede” kurver som \(s(t)=a\cdot(1+v)^t\) og vurdere, hvor meget de “buer”. Figur 2 viser antal Covid-19 diagnosticerede i USA:

Figur 2: Udviklingen i antallet af diagnosticerede syge i USA

På figuren kan man groft sagt kun se, at tingene begynder at gå meget hurtigt eller “eksploderer”, og den første del af kurven giver ikke meget information, da “det hele” sker til sidst. Hvis vi tager logaritmen, så får man, at \(\log(s(t)) = \log(a) + t \cdot \log(1+v)\), dvs. en ret linie med hældning \(\log(1+v)\).

Figur 3: Udviklingen i antallet af bekræftede syge i USA på log skala. Fordoblingstiden er baseret på de sidste 7 dage og er 4.9 dage for de diagnosticerede.

På den logaritmiske skala er det meget lettere at vurdere om stigningstaksten stiger eller falder ved at vurdere om hældningen på kurven med de logaritmiske tal stiger eller falder. Det bliver også tydeligere hvordan tilvæksten er i de tidligere faser. Vi ser, at grafen ikke er helt ret, men vi har på basis af de sidste 7 dage estimeret den aktuelle tilvækst og indtegnet det som en ret stiplet linie og angivet fordoblingstiden.

Samme model for antal syge, hospitals indlagte og døde

Hvorfor er det svært at forudsige epidemier, lige efter de er gået i udbrud? omtaler i detaljer nogle af de usikkerheder der ved de tal man kan få fat i vedrørende det igangværende Covid-19 udbrud, specielt hvis man vil sammenligne på tværs af lande. Forskellig aldersfordeling i befolkningen, forskellige test strategier, forskellig geografi, mv., påvirker både hvad man observerer og giver nogle underliggende forskelle i hvordan sygdommen vil påvirke f.eks. antal døde, da Covid-19 f.eks. har større dødelighed blandt ældre.

Vi har ovenfor omtalt modellen for antal syge. Imidlertid, så kan vi ikke observere antallet af syge, men har kun et antal for dem der er diagnosticeret efter en Covid-19 test. Da man ikke tester hele befolkningen, så vil der være en forskel mellem dem der er syge og dem der er diagnosticeret, og det er det såkaldte “mørketal” af syge udiagnosticerede personer. Ydermere, så justeres strategien for hvem man tester og test kapaciteten løbende, så det påvirker også udviklingen i antal diagnosticerede.

Vi kan med ret stor sikkerhed observere antallet af hospitalsindlagte og antal døde af Covid-19. Der kan imidlertid stadig være forskelle mellem lande, da de kan have forskellige måder at registrere dødsfald på, hospitals kapacitet, mv. Danmark medregner f.eks. alle der har fået konstateret Covid-19 inden for 30 dage før dødsfaldet2 Indtil 29. marts 2020 opgjorde SSI et dødsfald som et Covid-19 dodsfald, hvis det personen havde fået konstateret Covid-19 i perioden 60 dage inden alle dødsfaldet. Det er efterfølgende indskrænket til 30. dage., uanset om døden direkte skyldes Covid-19 eller ej, som død pga. Covid-19. Andre lande kan opgøre det anderledes.

Hvis man vil sammenligne på tværs af lande, så er antallet af døde dog stadig et af de tal, der er størst sikkerhed omkring, og antal døde er det eneste man med nogenlunde sikkerhed kan opgøre og sammenligne.

Uanset om man observerer antal syge, antal diagnosticerede, antal hospitalsindlagte, eller antal døde, så kan den eksponentielle model omtalt ovenfor være god til at beskrive udviklingen. Hvis man ydermere antager, at man observerer en bestemt andel af de syge,3 Denne antagelse kan ændre sig, hvis/når teststrategien ændrer sig. en bestemt andel af de syge bliver hospitalsindlagte, eller at dødeligheden blandt de syge er konstant, så vil alle observationerne have samme daglige tilvækst og fordoblingstid, og de følger samme form og udvikling.

Der er imidlertid en forsinkelse i observationerne. De personer, som vi diagnosticerer med Covid-19 er typisk blevet smittet uger tidligere. Og dem der dør, er typisk blevet hospitalsindlagt en del tid før. Det vi kan observere nu er med andre ord resultatet af vores adfærd uger tidligere, og det i kombination med den hurtige eksponentielle vækst og at mange har meget lette symptomer på Covid-19 infektion, gør at denne sygdom har potentialet til at udvikle sig meget voldsomt. Det omvendte gælder også, at de tiltag og ændringer vi gør nu, dem ser vi først effekten af om nogle uger.

Som eksempel kan vi se på logaritmen til antal syge og døde i den samme graf:

Figur 4: Antal syge og døde i USA på log skala. Fordoblingstiden er baseret på de sidste 7 dage for døde er ca. 3.2 dage, mens fordoblingstiden for diagnosticerede er ca. 4.9 dage.

Vi ser, at de to linier har næsten samme hældning, hvilket betyder, at de har samme daglige tilvækst. Denne tilnærmelse er dog endnu bedre, hvis man tager højde for, at kurven over antal døde er forsinket i forhold til antal syge (stadig under forudsætning om, at andelen er konstant). Vi går ikke mere ind i dette, men det betyder, at der kunne være håb om, at hvis kurven over antal syge flader ud, så kommer det også til at gøre sig gældende for antal døde i nær fremtid. Dette kan også forklare hvorfor det er naturligt at fordoblingstiden for antal syge er lidt lavere end for antal døde, da de tiltag man har taget endnu ikke er slået fuldt igennem for antal døde.

Det er også kun på log skalaen, at det giver mening at afbillede syge og døde i samme graf, da der — heldigvis — er meget færre syge end døde. Hvis vi blot plottede dem i samme graf, vil antal døde være en nærmest vandret streg i bunden.

Hvordan ser man, om det begynder at gå den rigtige vej?

Lad os prøve at se på graferne fra Italien og Spanien med logaritmen til antal syge og døde:

Figur 5: Antal syge og døde i Italien og Spanien på log skala. Den øverste kurver i hvert plot er antallet af diagnosticerede, og den nederste er antallet af døde. Fordoblingstiden er baseret på de sidste 7 dage. For Spanien er fordoblingstiden for døde ca. 6.2 dage, mens fordoblingstiden for diagnosticerede er ca. 8.1 dage. For Italien er fordoblingstiden 10.2 dage og 14.9 dage for henholdsvis døde og diagnosticerede.

Hvis den eksponentielle vækst fortsatte, så skulle ovenstående kurver være rette linier. Vi kan imidlertid se, at kurverne krummer og at hældningen aftager. Dvs. at de daglige tilvækster falder, og det er et tegn på at de tiltag, der er taget i Italien og Spanien begynder at virke.

Bemærk, at man godt kan have at den faktiske tilvækst kan stige, selv om den procentvise tilvækst falder. Hvis man f.eks. starter med 80 og lægger 25% til, så får man en tilvækst på 20 til 100. Lægger man derefter 22% til, så får man en tilvækst på 22 personer til i alt 122, men den procentuelle tilvækst er faldet.

Hvordan ser det ud i Danmark?

Lad os se grafen for Danmark:

Figur 6: Antal syge og døde i Danmark på log skala. Fordoblingstiden er baseret på de sidste 7 dage for døde er ca. 4.9 dage, mens fordoblingstiden for diagnosticerede er ca. 8.0 dage.

Det skarpe knæk i kurven for antal syge omkring 13. marts skyldes ændring i teststrategi, hvor man gik fra at teste alle med symptomer til kun at teste dem med alvorlige symptomer. Der er ikke et tilsvarende skarpt knæk i kurven for antal døde, da de alvorligt syge i alle tilfælde testes. Vi ser, at fordoblingstiden for antal syge har været ret konstant siden 13. marts, omkring 8 dage, hvor den ligger på ca 5 dage for antal døde siden 24. marts, hvor antal døde nåede 32.

Antallet af syge ses at følge nogenlunde en eksponentiel kurve, da grafen med logaritmerne er en ret linie. Der kan være to modsat rettede effekter her. På den ene side har man efter 13. marts gradvist øget testkapaciteten, hvilket burde betyde, at man opdagede flere syge, og man ville forvente at kurven krummede opad. På den anden siden, så burde effekten af de forskellige tiltag også begynde at slå igennem, så kurven burde aftage og krumme mindre.

Konklusion

Vi har lært, at man skal have respekt for den eksponentielle vækst, da det kan gå meget hurtigt, og har set hvordan logaritmen kan hjælpe med at fortolke udviklingen i antal syge og døde, da det bliver mere synligt om den daglige tilvækst eller fordoblingstiden stiger eller falder.

Vil man f.eks. gøre udvikligen i forskellige lande mere sammenlignelige, så kunne man også vælge at justere dato aksen, så man f.eks. bruger antal dage siden 100 syge eller 25 døde, på x-aksen.

Data i dette indlæg kommer fra John Hopkins (via covid19data.dk). Vil man se på flere tal eller grafer, så kan man f.eks. kigge her: