معرفی
در این مقاله، موارد ابتلا به ویروس کرونا (COVID-19) را به صورت جغرافیایی با استفاده از پایتون تجسم خواهیم کرد.
مراحل
chart_studio را در محیط خود نصب کنید. اکنون Plotly بخشی از chart_studio است
- pip install chart_studio
تمام کتابخانه های لازم را وارد کنید و نوت بوک jupyter خود را برای استفاده آفلاین به صورت طرحواره تنظیم کنید
- import pandas as pd
- import chart_studio.plotly as py
- import plotly.graph_objs as go
- from plotly.offline import download_plotlyjs, init_notebook_mode, plot, iplot
- init_notebook_mode(connected=True)
- # Lets get data from that url
- df = pd.read_html('https://www.worldometers.info/coronavirus/#countries')
- # data is imported as a list
- # use the indexing to get your dataframe
- df = df[0]
- type(df)
- df.info()
مقادیر زیادی NA را خواهید یافت. بیایید داده ها را پاک کنیم و همچنین نام ستون ها را تغییر دهیم و نوع داده را تغییر دهیم
- df.rename(columns = {"Country,Other": "COUNTRY"}, inplace=True)
- # fill NaN and Change columntype
- df["NewCases"] = df["NewCases"].fillna(0).astype('int')
- df["TotalDeaths"] = df["TotalDeaths"].fillna(0).astype('int')
- df["NewDeaths"] =df["NewDeaths"].fillna(0).astype('int')
- df["TotalRecovered"] = df["TotalRecovered"].fillna(0).astype('int')
- df["ActiveCases"] = df["ActiveCases"].fillna(0).astype('int')
- df["Serious,Critical"] =df["Serious,Critical"].fillna(0).astype('int')
- df.info()
اکنون، ما یک متن ستون جدید ایجاد می کنیم تا تمام این اطلاعات را به صورت رشته ای در ستون تکی دریافت کنیم تا زمانی که ماوس را بر روی یک کشور نگه دارید، نمایش آن آسان باشد.
- df['text'] = df.apply(lambda r : "Deaths: " + str(r.TotalDeaths + r.NewDeaths) + " Suspected: " + " " + str(r.NewCases + r.ActiveCases),
- axis = 1)
حالا وقتی سر این دیتافریم را می بینید، داده ای مانند زیر دریافت خواهید کرد.