Lehet, hogy a legrosszabb vége? Covid-19 Adatelemzés

Az új koronavírus-törzs január óta jelenik meg a hírekben, amikor Kínában az első eseteket jelentették. Az elmúlt néhány hétben először az adatok indokolják okot arra, hogy feltételezzük, hogy legalább Kínában elkezdenek halványulni.

Ebben a cikkben áttekintem a Rami Krispin által szolgáltatott adatokat, hogy ezt megértsem. Az R-t fogom használni az adatok rendezéséhez és megjelenítéséhez, itt hagyok néhány kódot, és a többi megtalálható a GitHub-on.

Kezdjük.

Betölti az adatokat a GitHub-ból, és betölti a szükséges könyvtárakat, a ggplot2 grafikonokat és a tidyverse az adatok megszervezéséhez.

Kína

könyvtár (ggplot2) könyvtár (tidyverse)
c1 <- koronavírus%>% Select (dátum, típus, esetek, ország.region)%>% group_by (dátum, típus, ország.Régió)%>% összegzése (összesen esetek = összeg (esetek)) c2 <- as.data .frame (c1 [amely (c1 $ type == "megerősítette" és c1 $ Ország.Régió == "Szárazföldi Kína"),]) c2 $ nap <- (1: hossz (c2 $ összes_cases)) c2 $ corcumtotal_cases < - cumsum (c2 $ total_cases)

Az adatokat úgy rendeztem, hogy csak a megerősített esetekre vonatkozzon az információ Kínából, és hozzon létre egy új oszlopot annak érdekében, hogy napi összesített összeszám legyen.

PlotChinalin <- ggplot (c2, aes (nap, corcumtotal_cases)) + geom_line (méret = 1,25, szín = "red1") + téma (plot.title = element_text (méret = 12, arc = "félkövér", hjust = 0,5)) , plot.caption = element_text (méret = 8, arc = "dőlt"), panel.grid.minor = element_blank (), panel.grid.major = element_line (színes = "grey50", méret = 0,5), panel.grid .major.x = element_blank (), panel.background = element_blank (), line = element_blank (), axis.ticks.length = unit (.15, "cm"), axis.ticks.y = element_blank (), tengely .title.x = element_text (szín = "fekete", méret = 12), tengely.title.y = element_text (szín = "fekete", méret = 10, arc = "dőlt")) + scale_y_ Continuous (expand = c ( 0, 0), határok = c (0,0,81000), szünetek = sorrend (0,0 900 000 100 000), név = "Az alanyok száma") + skála_x_folytonos (kiterjesztés = c (0, 0), törések = sorrend (0,0) , 40,5), név = "Napok") + laboratóriumok (cím = "A megerősített esetek száma Kína", felirat = "Az információ a RamiKrispin-től származik.") PlotChinalin

A ggplot2 használatával elkészítem a Kínában naponta kimutatott kumulált esetek grafikáját, mivel az első esetekről tegnap számoltak be, erről most beszélnek mindenki, a megerősített esetek befejeződtek, és az emberek gyógyulnak Kínában . Ez valóban jó hír Kína számára, vannak más országok, ahol ez csak most kezdődik.

Mivel a grafikonok kódjai hosszúak, az elsőt itt hagyom, a többit itt találhatod.

Dél-Korea

Dél-Korea volt az első országok, amelyek a covid-19 esetekről számoltak be, azonban az első hetekben a megerősített esetek kevés és messze vannak. Dél-Koreában most 4335 megerősített eset van.

c3 <- as.data.frame (c1 [amely (c1 $ type == "megerősítette" & c1 $ Ország.Régió == "Dél-Korea"),]) c3 $ nap <- 1: hossz (c3 $ összes_cases) c3 $ corcumtotal_cases <- cumsum (c3 $ total_cases) PlotKorea <- ggplot (c3, aes (nap, corcumtotal_cases)) + geom_line () PlotKorea

A covid-19 elterjedése Dél-Koreában egészen más történet, később kezdődött, mint Kínában, de az elmúlt pár hétben felgyorsult. Ne feledje azonban mindkét gráf skáláját, Kínában egy olyan gráfra néztünk, amely egészen a 80 000-ig terjedt, Koreában pedig csak azt, amely csak 4500-ot ért el.

Dél-Koreával kapcsolatban érdemes megjegyezni, hogy az elmúlt két napban kevesebb megerősített esetet jelentett, mint a 02–29-én, amikor az országban bejelentették a megerősített esetek maximális számát.

Olaszország

Olaszország volt az első európai nemzet, amely a covid-19 súlyos kitörését jelentette, és az azt követő 13 napon belül az megerősített esetek száma 2 036-ra nőtt, úgy tűnik, hogy a változás üteme felgyorsul.

c4 <- as.data.frame (c1 [amely (c1 $ type == "megerősítette" & c1 $ Ország.Régió == "Olaszország"),]) c4 $ nap <- 1: hossz (c4 $ összesen_cases) c4 $ corcumtotal_cases <- cumsum (c4 $ total_cases)
PlotItalylin <- ggplot (c4, aes (nap, corcumtotal_cases)) + geom_line () PlotItalylin

Fontos megjegyeznünk, hogy a lineáris gráf skálája csak 2200-ra megy, és csak 13 nap esetén nincs elegendő információ. Valójában, ha megnézzük az első 13 napot Kínában, meglehetõsen hasonló képet kapunk növekményben, bár sokkal nagyobb számban.

Amint a grafikonból láthatjuk, a terjedés kezdete Kínában sokkal agresszívebb volt, mint Olaszországban, de mivel az abszolút számok megtévesztőnek tűnhetnek, létrehoztam egy logaritmikus skála gráfot.

A napló grafikonját tekintve egyértelműen láthatjuk, hogy a változás üteme Kínában az első 13 napban sokkal magasabb volt, mint ma Olaszországban. Ezt nagyon fontos megjegyezni, mert mivel korábban láttuk Olaszország grafikonját, úgy tűnt, hogy nincs mennyezete.

Az általános szám lelassul, mivel Kína úgy tűnik, hogy a vírust ellenőrzés alatt tartja, azonban az egyes képeket tekintve azt találjuk, hogy még sok tennivaló van a világon.