proxies = {
'http': 'xxxxx',
'https': 'xxxxx'
}
import requests
import pandas as pd
from scipy.stats import linregress
import matplotlib.pyplot as plt
from sklearn.preprocessing import MinMaxScaler
import numpy as np
urls = ['https://covidlive.com.au/report/daily-cases/nsw',
'https://covidlive.com.au/report/daily-deaths/nsw',
'https://covidlive.com.au/report/daily-vaccinations/nsw']
T = 13
T2 = 42
d = pd.DataFrame()
for url in urls:
html = requests.get(url,proxies=proxies).content
tab_list = pd.read_html(html)
data = tab_list[1]
data.set_index("DATE", inplace=True)
d = pd.concat([d, data], axis=1)
d.index = pd.to_datetime(d.index)
data = d[['DEATHS','DOSES','CASES','NEW']]
data = data.dropna()
data = data.assign(DAILYDEATH = data["DEATHS"] - data["DEATHS"].shift(-1),
CASE_T = data["NEW"].shift(-1*T),
CASELOG = data["NEW"]/data["NEW"].shift(-1),
DEATHLOG = data["DEATHS"]/data["DEATHS"].shift(-1),
DOSE_T = data["DOSES"].shift(-1*T2))
data = data.dropna()
data.fillna(0, inplace=True)
data["CASELOG"] = data["CASELOG"].apply(np.log)
data["DEATHLOG"] = data["DEATHLOG"].apply(np.log)
data['CFR'] = data.DAILYDEATH/data.CASE_T
data = data.sort_index()
data = data.loc["2021-07-01":]
#[['NEW','DAILYDEATH','CASE_T','INCREASELOG','DOSE_T','CFR']]
standardizer = MinMaxScaler().fit(data)
data = pd.DataFrame(data, columns=['DEATHS', 'DOSES', 'CASES', 'NEW', 'DAILYDEATH', 'CASE_T',
'CASELOG', 'DEATHLOG', 'DOSE_T', 'CFR'])
data[["CFR", "DOSE_T"]].corr()
CFR DOSE_T
CFR 1.000000 -0.108629
DOSE_T -0.108629 1.000000
#完全疫苗率上升,死亡率下降
data[["CASELOG", "DOSE_T"]].corr()
CASELOG DOSE_T
CASELOG 1.000000 -0.197275
DOSE_T -0.197275 1.000000
#完全疫苗率上升,病例扩散速度下降
data[["CASELOG", "CFR"]].corr()
CASELOG CFR
CASELOG 1.000000 0.091137
CFR 0.091137 1.000000
#病例扩散速度增加,死亡增加
评论
公共卫生/疫苗/病毒和统计学都是有相当高的专业门槛的。粗糙计算一下欢迎指正。
评论
太粗糙了
评论
欢迎指正。哪些方面应该提高精度、如何提高精度等等。谢谢。
评论
你的态度还是正确的。要提准确及精确度需要长时间的认真学习。就像“疫苗”一样,研发不到一年,那就不会知道一年后发生什么。需要足够长的时间。
评论
敢问一下你是不是有在中国国企当领导的经验?说话高屋建瓴,洋洋洒洒,永远正确-任何人都需要提高、学习啊。
我们做技术的,一般说这种人就是:虽然心里没数,不妨碍到处放屁。
当然如果你并没有到处放屁的习惯,请不要自己认领这个头衔。有建设性意见就提吧。
评论
安慰一下楼主,新闻版有不少ID的贴是不能回的。个人觉得a picture is worth a thousand words, 对于我们这些不是数学专业的人来说,我们要看图。
评论
赞同一图胜过千言万语。比如下面这张
评论
很多前两排的 ,尤其是develop too fast和own research。
评论
真不文明
评论
Who stands for gain的也不少哈哈。近期犹多。
评论
有个问题请务必回答一下:
你对疫苗的看法,都是基于同样的自信发表的吗?这种自信,是天生的呢,还是习得的呢?
评论
真可怜
澳洲中文论坛热点
- 悉尼部份城铁将封闭一年,华人区受影响!只能乘巴士(组图)
- 据《逐日电讯报》报导,从明年年中开始,因为从Bankstown和Sydenham的城铁将因Metro South West革新名目而
- 联邦政客们具有多少房产?
- 据本月早些时分报导,绿党副首领、参议员Mehreen Faruqi已获准在Port Macquarie联系其房产并建造三栋投资联