در این مطلب، ویدئو پروژه تحلیل داده های فوتبال | تجزیه و تحلیل داده های فوتبال با استفاده از پایتون | تجزیه و تحلیل داده ها | Simplile Learn با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:59:20
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:11,120 –> 00:00:12,880
سلام به همه و به این
2
00:00:12,880 –> 00:00:14,799
ویدیوی واقعا جالب در مورد
3
00:00:14,799 –> 00:00:17,279
پروژه تجزیه و تحلیل داده های فوتبال با استفاده از پایتون خوش آمدید.
4
00:00:17,279 –> 00:00:19,359
5
00:00:19,359 –> 00:00:21,439
6
00:00:21,439 –> 00:00:22,800
7
00:00:22,800 –> 00:00:24,080
8
00:00:24,080 –> 00:00:26,000
9
00:00:26,000 –> 00:00:28,039
10
00:00:28,039 –> 00:00:30,880
فصل 2020-2021 که آخرین
11
00:00:30,880 –> 00:00:33,280
فصل epl است،
12
00:00:33,280 –> 00:00:35,200
اجازه دهید ابتدا مجموعه داده
13
00:00:35,200 –> 00:00:36,239
هایی را
14
00:00:36,239 –> 00:00:39,280
که برای جلسه نمایشی خود استفاده
15
00:00:39,280 –> 00:00:42,640
می کنیم به شما نشان دهم، بنابراین در اینجا مجموعه داده های فصل 2021 epl 2020 است
16
00:00:42,640 –> 00:00:44,800
که برای
17
00:00:44,800 –> 00:00:46,160
نسخه نمایشی خود استفاده خواهیم کرد.
18
00:00:46,160 –> 00:00:48,160
بنابراین در ستون اول می توانید
19
00:00:48,160 –> 00:00:49,920
اسامی بازیکنان مختلفی را ببینید که
20
00:00:49,920 –> 00:00:52,160
در لیگ برتر انگلیس بازی می کنند، بنابراین ما
21
00:00:52,160 –> 00:00:53,079
حدود
22
00:00:53,079 –> 00:00:56,480
532 بازیکن داریم که در فصل گذشته در epl شرکت کرده اند،
23
00:00:56,480 –> 00:00:58,960
سپس ستون دوم
24
00:00:58,960 –> 00:01:00,399
مربوط به باشگاهی است که آنها به آن تعلق دارند، می توانید
25
00:01:00,399 –> 00:01:02,399
ببینید که ما متفاوت هستیم. باشگاه اول
26
00:01:02,399 –> 00:01:05,360
چلسی است ما منچستر سیتی داریم
27
00:01:05,360 –> 00:01:08,240
من یونایتد لیورپول لستر وست هام
28
00:01:08,240 –> 00:01:10,400
یونایتد تاتنهام آرسنال
29
00:01:10,400 –> 00:01:12,080
و اگر به پایین اسکرول کنم می توانید
30
00:01:12,080 –> 00:01:15,119
سایر باشگاه ها مانند
31
00:01:15,119 –> 00:01:18,640
باشگاه هایی مانند استون ویلا که ما اورتون داریم را ببینید.
32
00:01:18,640 –> 00:01:21,119
ولوو فانتوم ودررز ما کریستال
33
00:01:21,119 –> 00:01:23,920
پالاس داریم و دیگران
34
00:01:23,920 –> 00:01:27,360
در حال حاضر به ستون سوم می آیند که در
35
00:01:27,360 –> 00:01:28,479
36
00:01:28,479 –> 00:01:30,479
مورد ملیت بازیکنان است
37
00:01:30,479 –> 00:01:31,600
که بازیکنان
38
00:01:31,600 –> 00:01:33,360
متعلق به کشورهای مختلفی هستند که ما انگلیس داریم
39
00:01:33,360 –> 00:01:35,439
، فکر می کنم اینجا سنگال است
40
00:01:35,439 –> 00:01:36,799
آلمان
41
00:01:36,799 –> 00:01:40,240
ما فرانسه اسپانیا ایتالیا ایتالیا برزیل
42
00:01:40,240 –> 00:01:42,479
کرواسی و دیگران داریم.
43
00:01:42,479 –> 00:01:44,240
حالا
44
00:01:44,240 –> 00:01:46,000
ستون چهارم در مورد پست
45
00:01:46,000 –> 00:01:46,960
است که
46
00:01:46,960 –> 00:01:48,720
موقعیتی است که
47
00:01:48,720 –> 00:01:50,799
این بازیکنان در حال حاضر در آن بازی می کنند، می توانید ببینید که
48
00:01:50,799 –> 00:01:52,560
برخی از بازیکنان
49
00:01:52,560 –> 00:01:53,759
در پست های مختلف
50
00:01:53,759 –> 00:01:55,119
بازی می کنند و می توانند برای دو
51
00:01:55,119 –> 00:01:56,560
پست مختلف بازی کنند، به عنوان مثال
52
00:01:56,560 –> 00:01:58,320
از بازی های چلسی به
53
00:01:58,320 –> 00:02:00,560
عنوان هافبک و همچنین در پست های مختلف بازی کنند.
54
00:02:00,560 –> 00:02:01,759
55
00:02:01,759 –> 00:02:04,640
ادوارد مندی دروازه بان است
56
00:02:04,640 –> 00:02:06,240
57
00:02:06,240 –> 00:02:09,360
58
00:02:09,360 –> 00:02:10,479
59
00:02:10,479 –> 00:02:12,879
60
00:02:12,879 –> 00:02:14,560
61
00:02:14,560 –> 00:02:15,440
62
00:02:15,440 –> 00:02:18,239
63
00:02:18,239 –> 00:02:19,599
64
00:02:19,599 –> 00:02:21,120
65
00:02:21,120 –> 00:02:24,000
بازیکن دریافت
66
00:02:24,000 –> 00:02:26,400
کرد این است که آیا بازیکن
67
00:02:26,400 –> 00:02:28,319
در 11 بازی بوده است یا نه، پس ما
68
00:02:28,319 –> 00:02:29,920
تعداد کل دقایقی را داریم که
69
00:02:29,920 –> 00:02:31,519
بازیکن
70
00:02:31,519 –> 00:02:33,360
در آخرین فصل بازی کرده است. n از epl این
71
00:02:33,360 –> 00:02:35,680
تعداد کل دقایقی است که بازیکن در
72
00:02:35,680 –> 00:02:37,120
مرحله بعد بازی کرده است، تعداد کل گل های
73
00:02:37,120 –> 00:02:39,680
زده شده توسط هر بازیکن را داریم.
74
00:02:39,680 –> 00:02:43,360
75
00:02:43,360 –> 00:02:44,879
76
00:02:44,879 –> 00:02:46,879
77
00:02:46,879 –> 00:02:50,160
78
00:02:50,160 –> 00:02:52,400
ما
79
00:02:52,400 –> 00:02:54,480
تعداد کل گل های زده شده از
80
00:02:54,480 –> 00:02:57,280
ضربات پنالتی را داریم و سپس
81
00:02:57,280 –> 00:02:59,200
تعداد کل پنالتی هایی را داریم که زده
82
00:02:59,200 –> 00:03:00,400
شد،
83
00:03:00,400 –> 00:03:03,120
اکنون دو ستون مختلف داریم x g
84
00:03:03,120 –> 00:03:06,400
و x a بنابراین x g تعداد گل های مورد
85
00:03:06,400 –> 00:03:09,680
انتظار بازیکن در یک مسابقه و x a
86
00:03:09,680 –> 00:03:11,519
تعداد گل های مورد انتظار است. امتیاز از
87
00:03:11,519 –> 00:03:13,599
بازیکن در یک مسابقه و در نهایت
88
00:03:13,599 –> 00:03:15,280
دو ستون آخر
89
00:03:15,280 –> 00:03:18,720
تعداد کل کارت های زرد دریافت شده
90
00:03:18,720 –> 00:03:20,640
توسط بازیکن در
91
00:03:20,640 –> 00:03:22,400
آخرین فصل epl و سپس
92
00:03:22,400 –> 00:03:24,640
تعداد کل کارت های قرمز
93
00:03:24,640 –> 00:03:26,239
دریافت شده توسط بازیکن در آخرین
94
00:03:26,239 –> 00:03:29,280
فصل epl را داریم. که 2020 2021 است، بنابراین
95
00:03:29,280 –> 00:03:31,280
ما قصد داریم از این مجموعه داده استفاده کنیم
96
00:03:31,280 –> 00:03:32,640
97
00:03:32,640 –> 00:03:34,480
و سوالات خاصی
98
00:03:34,480 –> 00:03:36,879
مانند تعداد کل گل های زده شده،
99
00:03:36,879 –> 00:03:38,799
کل گل های زده شده در ضربات پنالتی و
100
00:03:38,799 –> 00:03:41,120
کل گل های زده شده را تجزیه و تحلیل و پاسخ دهیم. در هنگام زدن پنالتیها از دست رفتند،
101
00:03:41,120 –> 00:03:42,959
102
00:03:42,959 –> 00:03:44,640
سپس
103
00:03:44,640 –> 00:03:46,319
بازیکنانی از کشورهای مختلف داریم که
104
00:03:46,319 –> 00:03:48,480
در epl بازی میکنند، سپس ما همچنین بررسی خواهیم کرد که کدام
105
00:03:48,480 –> 00:03:50,239
باشگاهها بیشترین تعداد بازیکن را
106
00:03:50,239 –> 00:03:52,400
در ترکیب دارند، همچنین
107
00:03:52,400 –> 00:03:54,560
بازیکنان را بر اساس گروه سنی
108
00:03:54,560 –> 00:03:57,280
آنها تجزیه و تحلیل خواهیم کرد. مجموع
109
00:03:57,280 –> 00:04:00,239
گل های زده شده توسط 10 بازیکن برتر در
110
00:04:00,239 –> 00:04:03,280
فصل آخر epl را مشاهده
111
00:04:03,280 –> 00:04:05,519
خواهیم کرد و این نتایج را
112
00:04:05,519 –> 00:04:07,599
با کمک نمودارهای مختلف مانند نمودار
113
00:04:07,599 –> 00:04:10,159
میله ای نمودار دایره
114
00:04:10,159 –> 00:04:12,840
ای تجسم خواهیم کرد و همچنین
115
00:04:12,840 –> 00:04:15,840
با استفاده از کتابخانه هایی مانند cbon و همچنین نمودارهایی ایجاد خواهیم کرد.
116
00:04:15,840 –> 00:04:18,399
matplotlib پس بیایید به
117
00:04:18,399 –> 00:04:20,160
نوت بوک jupyter خودمان برویم، اجازه دهید من نوت بوک jupyter را به شما نشان
118
00:04:20,160 –> 00:04:23,360
دهم که از آن استفاده خواهیم کرد،
119
00:04:23,360 –> 00:04:26,240
بنابراین این
120
00:04:26,240 –> 00:04:28,320
نوت بوک jupyter من است که امروز برای این جلسه زنده از آن استفاده
121
00:04:28,320 –> 00:04:30,720
122
00:04:30,720 –> 00:04:32,320
خواهم کرد، می توانید ببینید من نوت بوک را به epl تغییر داده ام
123
00:04:32,320 –> 00:04:36,240
نسخه ی نمایشی تجزیه و تحلیل داده 2020 2021
124
00:04:36,240 –> 00:04:37,759
و من
125
00:04:37,759 –> 00:04:39,919
برخی از سلول ها را از قبل پر کرده ام، این
126
00:04:39,919 –> 00:04:42,560
برای اطمینان از صرفه جویی در زمان است،
127
00:04:42,560 –> 00:04:43,360
128
00:04:43,360 –> 00:04:45,440
بنابراین قبل از هر چیز بیایید پیش برویم و
129
00:04:45,440 –> 00:04:47,840
کتابخانه های لازم را
130
00:04:47,840 –> 00:04:50,320
که برای نسخه ی نمایشی ما نیاز است وارد کنیم،
131
00:04:50,320 –> 00:04:53,280
بنابراین ابتدا من من
132
00:04:53,280 –> 00:04:55,120
کتابخانه دستکاری داده ها را که
133
00:04:55,120 –> 00:04:57,040
pandas است به صورت pd
134
00:04:57,040 –> 00:05:00,080
وارد می کنیم و سپس
135
00:05:00,080 –> 00:05:01,759
numpy را
136
00:05:01,759 –> 00:05:04,000
به عنوان np وارد می کنیم،
137
00:05:04,000 –> 00:05:06,000
سپس من
138
00:05:06,000 –> 00:05:08,840
matplotlib
139
00:05:08,840 –> 00:05:10,400
dot
140
00:05:10,400 –> 00:05:12,000
pi نمودار را
141
00:05:12,000 –> 00:05:14,240
به صورت plt
142
00:05:14,240 –> 00:05:15,680
143
00:05:15,680 –> 00:05:17,280
خواهم داشت و پس از آن دومین
144
00:05:17,280 –> 00:05:19,840
کتابخانه تجسم داده را که c bond است به عنوان
145
00:05:19,840 –> 00:05:22,320
sns وارد می کنیم.
146
00:05:22,880 –> 00:05:25,199
من
147
00:05:25,199 –> 00:05:26,880
درصد
148
00:05:26,880 –> 00:05:28,639
matplotlib را به صورت
149
00:05:28,639 –> 00:05:30,160
درون خطی می گویم،
150
00:05:30,160 –> 00:05:32,160
بنابراین وقتی نمودارها و نمودارها را ایجاد کردیم، نتایج خود را
151
00:05:32,160 –> 00:05:33,360
152
00:05:33,360 –> 00:05:35,680
دقیقاً زیر کد دریافت می
153
00:05:35,680 –> 00:05:37,520
کنیم،
154
00:05:37,520 –> 00:05:40,080
بنابراین اجازه دهید Shift enter را بزنم تا این
155
00:05:40,080 –> 00:05:42,639
سلول اول اجرا شود،
156
00:05:47,840 –> 00:05:49,600
شما می توانید ببینید که
157
00:05:49,600 –> 00:05:51,280
158
00:05:51,280 –> 00:05:53,280
اکنون کتابخانه های مختلف را با موفقیت وارد کرده ایم. گام بعدی این است
159
00:05:53,280 –> 00:05:54,800
که
160
00:05:54,800 –> 00:05:56,639
مجموعه داده های epl خود را بارگذاری کنیم،
161
00:05:56,639 –> 00:05:58,479
بنابراین من متغیری به نام epl
162
00:05:58,479 –> 00:06:00,400
underscore df ایجاد می کنم که در اصل
163
00:06:00,400 –> 00:06:01,840
مخفف قاب داده است،
164
00:06:01,840 –> 00:06:04,479
من می گویم pd dot،
165
00:06:04,479 –> 00:06:06,720
زیرا یک فایل csv است که ما به تازگی
166
00:06:06,720 –> 00:06:09,600
دیدیم، می گویم اکنون underscore csv را بخوانید.
167
00:06:09,600 –> 00:06:11,360
در داخل
168
00:06:11,360 –> 00:06:15,039
نقل قول هایی که قرار است در
169
00:06:15,039 –> 00:06:17,360
محل فایل ارسال کنیم و به دنبال آن
170
00:06:17,360 –> 00:06:21,759
نام فایل و پسوند فایل
171
00:06:21,759 –> 00:06:23,840
خوب است، بنابراین من محل فایل را کپی کردم،
172
00:06:23,840 –> 00:06:26,800
اجازه دهید فقط آن را در اینجا
173
00:06:26,800 –> 00:06:28,720
در داخل نقل قول ها قرار دهم،
174
00:06:28,720 –> 00:06:32,000
اکنون
175
00:06:32,720 –> 00:06:34,639
یک m می دهیم. ore
176
00:06:34,639 –> 00:06:37,919
backslash به طوری که به درستی به محل مورد نظر رسیده است،
177
00:06:37,919 –> 00:06:40,400
178
00:06:40,400 –> 00:06:42,240
حدس میزنم اگر روی سیستم لینوکس یا مک هستید، نیازی به انجام این کار ندارید،
179
00:06:42,240 –> 00:06:44,400
180
00:06:44,400 –> 00:06:47,120
181
00:06:47,120 –> 00:06:48,800
حالا بعد از این
182
00:06:48,800 –> 00:06:51,520
، دو
183
00:06:51,520 –> 00:06:54,800
بک اسلش دیگر میدهیم و
184
00:06:54,800 –> 00:06:58,400
نام فایل را میدهیم که epl underscore 20
185
00:06:58,400 –> 00:07:01,360
underscore 21 dot
186
00:07:01,360 –> 00:07:03,440
csv
187
00:07:03,440 –> 00:07:05,039
cool
188
00:07:05,039 –> 00:07:06,639
now
189
00:07:06,639 –> 00:07:10,080
line بعدی من می خواهم هد فریم داده را چاپ کنم که
190
00:07:10,080 –> 00:07:11,919
191
00:07:11,919 –> 00:07:14,880
پنج ردیف اول قاب داده است که epl
192
00:07:14,880 –> 00:07:16,479
underscore df است
193
00:07:16,479 –> 00:07:19,440
پس می گویم epl underscore df dot head
194
00:07:19,440 –> 00:07:20,800
بیایید آن را اجرا کنیم
195
00:07:20,800 –> 00:07:22,800
اکنون می توانید خروجی را مشاهده کنید که
196
00:07:22,800 –> 00:07:24,960
ما پنج ردیف اول را از
197
00:07:24,960 –> 00:07:26,880
مجموعه داده چاپ کرده ایم
198
00:07:26,880 –> 00:07:29,039
و می توانید ستون های مختلفی را
199
00:07:29,039 –> 00:07:30,560
که در
200
00:07:30,560 –> 00:07:31,680
حال حاضر
201
00:07:31,680 –> 00:07:33,440
202
00:07:33,440 –> 00:07:36,000
داریم مشاهده کنید.
203
00:07:36,560 –> 00:07:38,560
204
00:07:38,560 –> 00:07:40,240
205
00:07:40,240 –> 00:07:44,000
206
00:07:44,000 –> 00:07:46,479
و همچنین کل
207
00:07:46,479 –> 00:07:48,319
مقادیر غیر تهی را در هر یک از ستون ها نمایش دهید،
208
00:07:48,319 –> 00:07:49,680
بنابراین می گویم
209
00:07:49,680 –> 00:07:51,759
epl
210
00:07:51,759 –> 00:07:53,280
underscore
211
00:07:53,280 –> 00:07:56,720
df dot info
212
00:07:56,720 –> 00:08:00,319
بیایید آن را اجرا کنیم، می توانید ببینید که
213
00:08:00,319 –> 00:08:02,400
نام ستون های مختلف داریم و در بالا
214
00:08:02,400 –> 00:08:04,199
می توانید ببینید که در کل
215
00:08:04,199 –> 00:08:06,400
532 ورودی
216
00:08:06,400 –> 00:08:08,240
داریم. در مجموع 18 ستون شما ج
217
00:08:08,240 –> 00:08:09,919
مجموع 18 ستون را ببینید
218
00:08:09,919 –> 00:08:10,840
این
219
00:08:10,840 –> 00:08:12,479
کل
220
00:08:12,479 –> 00:08:14,960
ستون ها نام ستون ها هستند و در
221
00:08:14,960 –> 00:08:16,560
سمت راست می توانید تعداد کل
222
00:08:16,560 –> 00:08:19,039
اشیاء عادی را مشاهده کنید، یعنی
223
00:08:19,039 –> 00:08:21,360
224
00:08:21,360 –> 00:08:23,840
در هیچ یک از سلول ها یا هیچ یک از
225
00:08:23,840 –> 00:08:25,919
ستون ها و در پایین هیچ مقدار تهی نداریم. اکنون میتوانید
226
00:08:25,919 –> 00:08:28,560
میزان مصرف حافظه و انواع دادهها
227
00:08:28,560 –> 00:08:30,240
228
00:08:30,240 –> 00:08:32,399
را ببینید، اجازه دهید ادامه دهیم و از تابع توصیف
229
00:08:32,399 –> 00:08:34,399
استفاده کنیم تا آمار خلاصهای
230
00:08:34,399 –> 00:08:36,320
درباره مجموعه دادههایمان به دست آوریم،
231
00:08:36,320 –> 00:08:38,000
بنابراین من میگویم
232
00:08:38,000 –> 00:08:41,599
epl underscore df dot description
233
00:08:41,599 –> 00:08:43,440
اجازه دهید آن را اجرا کنیم
234
00:08:43,440 –> 00:08:46,080
و اکنون میتوانید ببینید که داریم
235
00:08:46,080 –> 00:08:48,320
تعداد میانگین انحراف معیار
236
00:08:48,320 –> 00:08:49,600
حداقل
237
00:08:49,600 –> 00:08:52,080
مقدار حداکثر مقدار صدک 25
238
00:08:52,080 –> 00:08:56,399
صدک 50 و صدک 75
239
00:08:56,399 –> 00:09:00,000
اکنون این تابع توصیف فقط روی ستون های عددی کار می کند و
240
00:09:00,000 –> 00:09:02,399
241
00:09:02,399 –> 00:09:04,640
242
00:09:06,560 –> 00:09:07,360
اکنون
243
00:09:07,360 –> 00:09:09,200
اجازه دهید راهی به شما نشان دهم که در آن می
244
00:09:09,200 –> 00:09:11,360
توانید تعداد کل مقادیر تهی را بررسی کنید.
245
00:09:11,360 –> 00:09:13,440
در هر یک از
246
00:09:13,440 –> 00:09:15,600
ستونها، ما از
247
00:09:15,600 –> 00:09:18,399
تابع is n استفاده میکنیم و از
248
00:09:18,399 –> 00:09:20,160
تابع sum استفاده میکنم تا
249
00:09:20,160 –> 00:09:23,839
تعداد کل مقادیر تهی
250
00:09:24,320 –> 00:09:27,040
را به دست بیاورم، میگویم
251
00:09:27,040 –> 00:09:31,120
epl underscore df
252
00:09:31,120 –> 00:09:34,080
dot an d بگو مجموع نقطه ای است
253
00:09:34,080 –> 00:09:35,519
254
00:09:35,519 –> 00:09:38,160
حالا اجازه دهید آن را در اینجا اجرا کنم،
255
00:09:38,160 –> 00:09:39,839
می توانید ببینید
256
00:09:39,839 –> 00:09:42,240
که ما هیچ مقدار تهی برای هیچ یک
257
00:09:42,240 –> 00:09:43,680
از ستون ها
258
00:09:43,680 –> 00:09:45,440
نداریم
259
00:09:45,440 –> 00:09:47,600
حالا اجازه دهید روندی را به شما نشان دهم که در آن
260
00:09:47,600 –> 00:09:50,640
می توانید دو ستون دیگر
261
00:09:50,640 –> 00:09:52,560
مانند دقیقه در هر مسابقه ایجاد کنید
262
00:09:52,560 –> 00:09:54,480
و ما ستون دیگری ایجاد خواهیم کرد
263
00:09:54,480 –> 00:09:56,480
که گل های هر مسابقه است،
264
00:09:56,480 –> 00:09:57,760
بنابراین
265
00:09:57,760 –> 00:10:00,080
من ابتدا فریم داده های خود را
266
00:10:00,080 –> 00:10:02,320
که epl underscore df است فراخوانی می کنم
267
00:10:02,320 –> 00:10:04,240
و در داخل پرانتز نام ستون جدید
268
00:10:04,240 –> 00:10:05,600
خود را می دهم
269
00:10:05,600 –> 00:10:07,680
که
270
00:10:07,680 –> 00:10:09,120
دقیقه
271
00:10:09,120 –> 00:10:10,000
در هر
272
00:10:10,000 –> 00:10:12,240
مسابقه است. یک نام پایتون معتبر باشد
273
00:10:12,240 –> 00:10:14,640
274
00:10:14,640 –> 00:10:16,720
، میگویم برابر با
275
00:10:16,720 –> 00:10:18,160
الان، دقیقههای هر مسابقه باید
276
00:10:18,160 –> 00:10:19,600
برابر باشد با تعداد کل
277
00:10:19,600 –> 00:10:22,079
دقیقهها تقسیم بر مسابقات که
278
00:10:22,079 –> 00:10:24,800
تعداد مسابقات انجام شده است، بنابراین میگویم epl
279
00:10:24,800 –> 00:10:28,240
underscore df، دقیقهها را بر
280
00:10:29,519 –> 00:10:30,880
تقسیم میکنم
281
00:10:30,880 –> 00:10:33,360
282
00:10:33,360 –> 00:10:36,480
اجازه دهید یک براکت در اینجا بدهم
283
00:10:36,480 –> 00:10:38,160
، میگویم
284
00:10:38,160 –> 00:10:40,480
epl underscore
285
00:10:40,480 –> 00:10:41,760
df
286
00:10:41,760 –> 00:10:43,440
و
287
00:10:43,440 –> 00:10:46,240
سپس آن را بر ستون مسابقات تقسیم میکنم
288
00:10:46,240 –> 00:10:48,079
289
00:10:48,079 –> 00:10:51,600
و میخواهیم نوع را بهعنوان عدد صحیح تنظیم کنیم،
290
00:10:51,600 –> 00:10:53,680
291
00:10:53,680 –> 00:10:55,040
292
00:10:55,040 –> 00:10:58,079
سپس ستون دومی که ایجاد میکنم
293
00:10:58,079 –> 00:11:00,560
گلها در هر مسابقه است. می گویم epl
294
00:11:00,560 –> 00:11:02,720
underscore df
295
00:11:02,720 –> 00:11:05,279
و نام ستون جدید من اهداف
296
00:11:05,279 –> 00:11:06,240
p است er
297
00:11:06,240 –> 00:11:07,519
match
298
00:11:07,519 –> 00:11:09,279
برابر
299
00:11:09,279 –> 00:11:12,640
با براکت شروع می کنیم، می گوییم
300
00:11:12,640 –> 00:11:16,079
epl underscore df
301
00:11:16,079 –> 00:11:18,399
ستون اهداف را در نظر می گیریم
302
00:11:18,399 –> 00:11:20,959
303
00:11:20,959 –> 00:11:22,880
و سپس
304
00:11:22,880 –> 00:11:25,200
آن را بر epl underscore تقسیم می
305
00:11:25,200 –> 00:11:26,800
306
00:11:26,800 –> 00:11:29,440
307
00:11:29,440 –> 00:11:32,880
308
00:11:32,880 –> 00:11:35,360
309
00:11:37,279 –> 00:11:40,320
310
00:11:40,320 –> 00:11:43,120
311
00:11:43,120 –> 00:11:45,519
312
00:11:46,800 –> 00:11:48,160
کنیم. اکنون آن را اجرا کنید
313
00:11:48,160 –> 00:11:50,399
اگر می گویم
314
00:11:50,399 –> 00:11:52,880
print
315
00:11:55,680 –> 00:11:58,079
pl
316
00:11:58,639 –> 00:12:02,160
بیایید کد df را بنویسیم می توانید ببینید
317
00:12:02,160 –> 00:12:07,040
یا فرض کنید epl underscore df سر نقطه
318
00:12:07,040 –> 00:12:11,240
برای چاپ پنج سطر اول
319
00:12:11,360 –> 00:12:15,040
در اینجا می توانید ببینید که ما دو ستون دیگر ایجاد کرده ایم
320
00:12:15,120 –> 00:12:16,800
321
00:12:16,800 –> 00:12:19,040
اجازه دهید فقط این عبارت چاپ را حذف کنم
322
00:12:19,040 –> 00:12:21,519
و اجرا می کنیم اکنون دوباره
323
00:12:21,519 –> 00:12:23,040
می توانید ببینید که ما دو ستون دیگر ایجاد کرده ایم
324
00:12:23,040 –> 00:12:25,760
که دقیقه در هر مسابقه
325
00:12:25,760 –> 00:12:27,600
برای هر یک از بازیکنان مختلف است و
326
00:12:27,600 –> 00:12:29,440
سپس گل های هر مسابقه برای
327
00:12:29,440 –> 00:12:31,600
هر یک از بازیکنان مختلف را
328
00:12:31,600 –> 00:12:34,000
329
00:12:34,480 –> 00:12:36,560
330
00:12:36,560 –> 00:12:38,639
در حال حاضر در سلول بعدی که می خواهیم محاسبه کنیم، داریم.
331
00:12:38,639 –> 00:12:40,399
332
00:12:40,399 –> 00:12:42,639
کل کل گل هایی که در
333
00:12:42,639 –> 00:12:44,560
فصل 2021
334
00:12:44,560 –> 00:12:47,760
یا 2020-2021 به ثمر رسیده است،
335
00:12:47,760 –> 00:12:49,680
بنابراین بیایید
336
00:12:49,680 –> 00:12:51,440
مجموع گل ها را ببینیم، متغیری
337
00:12:51,440 –> 00:12:53,519
به نام کل زیرخط
338
00:12:53,519 –> 00:12:55,760
گل ها ایجاد می
339
00:12:55,760 –> 00:12:59,519
کنم که برابر با i’ll underscore epl df
340
00:12:59,519 –> 00:13:02,160
ما ستون گل ها را می گیریم
341
00:13:02,160 –> 00:13:04,480
342
00:13:04,480 –> 00:13:05,600
و سپس
343
00:13:05,600 –> 00:13:07,040
من می خواهم از
344
00:13:07,040 –> 00:13:09,120
تابع جمع استفاده کنم
345
00:13:09,120 –> 00:13:11,839
حالا بیایید کل گل ها را
346
00:13:11,839 –> 00:13:13,839
چاپ کنیم
347
00:13:13,839 –> 00:13:15,760
348
00:13:15,760 –> 00:13:17,839
349
00:13:17,839 –> 00:13:20,560
اگر زبانه را فشار دهید به طور خودکار تکمیل می شود
350
00:13:20,560 –> 00:13:22,800
اجازه دهید من آن را اجرا کنم
351
00:13:22,800 –> 00:13:24,959
352
00:13:24,959 –> 00:13:26,160
تا
353
00:13:26,160 –> 00:13:28,560
گل ها را حذف کنم اکنون می توانید
354
00:13:28,560 –> 00:13:29,959
ببینید در کل
355
00:13:29,959 –> 00:13:32,800
986 مدرسه در آخرین
356
00:13:32,800 –> 00:13:35,440
فصل برتر انگلیسی به ثمر رسیده است. لیگ
357
00:13:35,440 –> 00:13:38,560
حالا بیایید از این 986 گل
358
00:13:38,560 –> 00:13:41,440
دریابیم که چند گل در ضربات پنالتی به ثمر رسیده است،
359
00:13:41,440 –> 00:13:42,880
بنابراین از
360
00:13:42,880 –> 00:13:44,320
361
00:13:44,320 –> 00:13:46,240
ستون زیر خط پنالتی گل ها استفاده می
362
00:13:46,240 –> 00:13:48,639
کنیم و متغیری به نام کل
363
00:13:48,639 –> 00:13:50,240
زیرخط
364
00:13:50,240 –> 00:13:52,800
پنالتی ایجاد
365
00:13:54,480 –> 00:13:57,040
می
366
00:13:57,040 –> 00:13:59,839
کنیم که برابر با ما می گوییم epl underscore
367
00:13:59,839 –> 00:14:01,519
df
368
00:14:01,519 –> 00:14:04,000
سپس ما هستیم.
369
00:14:04,000 –> 00:14:08,079
ستون زیر خط پنالتی گلها
370
00:14:08,079 –> 00:14:10,399
را در نظر میگیرم، سپس میگویم
371
00:14:10,399 –> 00:14:12,720
مجموع نقطهای برای یافتن تعداد کل
372
00:14:12,720 –> 00:14:15,199
گلهایی که در
373
00:14:15,199 –> 00:14:17,519
پنالتیها زده شده است،
374
00:14:17,519 –> 00:14:19,360
اگر زبانه را بزنید
375
00:14:19,360 –> 00:14:20,959
، به شما یک فرمان میدهد که اجازه دهید
376
00:14:20,959 –> 00:14:23,839
گل دوم
377
00:14:25,040 –> 00:14:27,519
را انتخاب کنم.
378
00:14:27,519 –> 00:14:29,600
379
00:14:29,600 –> 00:14:32,560
از مجموع 986 گلی که
380
00:14:32,560 –> 00:14:34,320
در فصل گذشته در epl به
381
00:14:34,320 –> 00:14:38,320
ثمر رسید، 102 گل در خارج از ضربات پنالتی به ثمر رسید،
382
00:14:38,320 –> 00:14:40,160
اکنون در تحلیل بعدی
383
00:14:40,160 –> 00:14:41,839
تعداد کل
384
00:14:41,839 –> 00:14:44,000
پنالتی های زده شده و
385
00:14:44,000 –> 00:14:44,800
تعداد آنها را مشاهده می کنیم.
386
00:14:44,800 –> 00:14:46,720
387
00:14:46,720 –> 00:14:48,880
برای آن تبدیل شده است، اجازه دهید متغیر دیگری
388
00:14:48,880 –> 00:14:50,560
به نام مجموع
389
00:14:50,560 –> 00:14:52,720
تلاش های
390
00:14:52,720 –> 00:14:54,560
پنالتی
391
00:14:54,560 –> 00:14:56,880
392
00:14:56,880 –> 00:14:59,199
393
00:14:59,199 –> 00:15:01,040
ایجاد کنیم که برابر با اکنون است.
394
00:15:01,040 –> 00:15:03,760
395
00:15:03,760 –> 00:15:08,079
396
00:15:08,240 –> 00:15:10,240
397
00:15:10,240 –> 00:15:13,120
398
00:15:13,120 –> 00:15:14,800
399
00:15:14,800 –> 00:15:17,600
400
00:15:19,440 –> 00:15:22,480
401
00:15:22,480 –> 00:15:24,480
پنالتیهایی که گرفته شدهاند
402
00:15:24,480 –> 00:15:26,160
و میخواهیم از عبارت چاپ استفاده
403
00:15:26,160 –> 00:15:27,920
کنیم،
404
00:15:27,920 –> 00:15:30,800
اجازه دهید من را بزنم و آیتمهای پنالتی را انتخاب میکنم
405
00:15:30,800 –> 00:15:31,759
،
406
00:15:31,759 –> 00:15:33,279
اجازه دهید آن را اجرا کنیم،
407
00:15:33,279 –> 00:15:34,399
بنابراین در
408
00:15:34,399 –> 00:15:37,519
مجموع 125 پنالتی گرفته شد
409
00:15:37,519 –> 00:15:40,880
که از این تعداد 102 پنالتی تبدیل شدند و بقیه همه
410
00:15:40,880 –> 00:15:43,440
از دست رفتند
411
00:15:44,399 –> 00:15:47,360
که میخواهیم ایجاد کنیم. اولین
412
00:15:47,360 –> 00:15:48,399
طرح
413
00:15:48,399 –> 00:15:51,199
ما در تجزیه و تحلیل زنده ما در مورد
414
00:15:51,199 –> 00:15:54,000
فصل epl 2020-2021، بنابراین
415
00:15:54,000 –> 00:15:56,240
میخواهیم نمودار دایرهای برای پنالتیهایی که به
416
00:15:56,240 –> 00:15:59,680
ثمر رسیده و از دست رفته
417
00:16:01,199 –> 00:16:02,079
درست کنیم،
418
00:16:02,079 –> 00:16:05,279
بنابراین اول از همه میخواهیم شکل طرح خود را
419
00:16:05,279 –> 00:16:06,399
420
00:16:06,399 –> 00:16:08,560
421
00:16:08,560 –> 00:16:10,399
به اندازه مشخصی تنظیم
422
00:16:10,399 –> 00:16:12,480
423
00:16:12,480 –> 00:16:14,399
کنیم، بیایید بگوییم
424
00:16:14,399 –> 00:16:16,079
و بگوییم رقم.
425
00:16:16,079 –> 00:16:18,160
اندازه
426
00:16:18,160 –> 00:16:20,079
برابر است
427
00:16:20,079 –> 00:16:21,519
و این یک تاپلی خواهد بود
428
00:16:21,519 –> 00:16:23,839
429
00:16:24,079 –> 00:16:26,160
، فرض کنید میگویم
430
00:16:26,160 –> 00:16:29,759
13 کاما 6.
431
00:16:29,759 –> 00:16:31,519
432
00:16:31,519 –> 00:16:33,440
حالا میگویم
433
00:16:33,440 –> 00:16:35,600
پنالتی به
434
00:16:35,600 –> 00:16:37,120
ثمر رسیده
435
00:16:37,120 –> 00:16:38,880
برابر با
436
00:16:38,880 –> 00:16:41,839
فریم داده است که epl underscore
437
00:16:41,839 –> 00:16:44,160
df است
438
00:16:44,160 –> 00:16:47,839
.
439
00:16:48,560 –> 00:16:51,199
440
00:16:51,199 –> 00:16:54,079
ستون تلاش اصلی
441
00:16:56,320 –> 00:16:59,040
و جمع آن
442
00:16:59,040 –> 00:17:02,000
و من میخواهم
443
00:17:02,000 –> 00:17:04,480
کل
444
00:17:04,480 –> 00:17:06,959
گلهای پنالتی را کم
445
00:17:06,959 –> 00:17:10,079
کنم تا کل گلهای پنالتی زیرخط باشد.
446
00:17:10,079 –> 00:17:12,480
447
00:17:13,760 –> 00:17:16,480
دادههای برابر با
448
00:17:16,480 –> 00:17:19,760
این یک لیست خواهد بود، بنابراین من میگویم
449
00:17:19,760 –> 00:17:20,880
پنالتی
450
00:17:20,880 –> 00:17:24,079
نمره نمیگیرد، اجازه دهید فقط آن را کپی کرده و
451
00:17:24,079 –> 00:17:25,599
کاما
452
00:17:25,599 –> 00:17:27,520
بچسبانم. دوباره در
453
00:17:27,520 –> 00:17:29,120
مجموع
454
00:17:29,120 –> 00:17:32,679
گل های پنالتی پاس می دهیم
455
00:17:33,440 –> 00:17:34,640
همچنین به
456
00:17:34,640 –> 00:17:37,520
نمودار دایره ای ما برچسب می دهیم
457
00:17:37,520 –> 00:17:40,080
تا برچسب
458
00:17:40,080 –> 00:17:42,400
ها
459
00:17:42,400 –> 00:17:44,080
پنالتی باشند پنالتی
460
00:17:44,080 –> 00:17:47,080
از دست رفته
461
00:17:48,880 –> 00:17:52,160
به ثمر
462
00:17:52,160 –> 00:17:54,400
می رسد مطمئن شوید که آن را در داخل
463
00:17:54,400 –> 00:17:57,400
نقل
464
00:18:01,600 –> 00:18:03,840
قول ها قرار داده اید ما
465
00:18:03,840 –> 00:18:05,679
به
466
00:18:05,679 –> 00:18:07,919
نمودار دایره ای رنگ می دهیم تا من از آن استفاده کنم.
467
00:18:07,919 –> 00:18:12,000
my c bond library i’ll say sns dot
468
00:18:12,000 –> 00:18:14,320
color underscore
469
00:18:14,320 –> 00:18:16,720
470
00:18:17,600 –> 00:18:20,080
palette بگو پالت رنگم را
471
00:18:20,080 –> 00:18:21,840
روی 2 تنظیم
472
00:18:21,840 –> 00:18:23,919
می کنم می توانید پالت های رنگی مختلف را بررسی کنید
473
00:18:23,919 –> 00:18:26,799
فقط پالت رنگ
474
00:18:26,799 –> 00:18:28,559
seaborn را در گوگل جستجو
475
00:18:28,559 –> 00:18:31,120
کنید و اگر اینجا بروید روی لینک اول کلیک کنید و
476
00:18:31,120 –> 00:18:32,960
477
00:18:32,960 –> 00:18:34,559
می توانید ببینید
478
00:18:34,559 –> 00:18:36,080
479
00:18:36,080 –> 00:18:38,240
پالت های رنگی مختلف
480
00:18:38,240 –> 00:18:41,120
را می توانید برگه 10 را ببینید
481
00:18:41,120 –> 00:18:43,280
سپس hls را نیز دارید
482
00:18:43,280 –> 00:18:45,200
483
00:18:45,200 –> 00:18:47,840
که usl که برای
484
00:18:47,840 –> 00:18:49,360
hustle است را با
485
00:18:49,360 –> 00:18:50,640
هم جفت کرده اید
486
00:18:50,640 –> 00:18:52,240
اما به پایین اسکرول کنید شما
487
00:18:52,240 –> 00:18:54,880
موشک underscore r راکت دارید همچنین
488
00:18:54,880 –> 00:18:56,480
مارپیچ مکعبی دارید
489
00:18:56,480 –> 00:18:59,440
سپس ماگما و بقیه
490
00:18:59,440 –> 00:19:01,600
کاملاً خوب اجازه دهید من برمی
491
00:19:01,600 –> 00:19:04,000
گردم، بنابراین از set to palette استفاده می کنم
492
00:19:04,000 –> 00:19:06,480
و می بینیم که plt dot
493
00:19:06,480 –> 00:19:08,240
نمودار دایره ای را ایجاد می کند، می خواهیم از
494
00:19:08,240 –> 00:19:09,520
495
00:19:09,520 –> 00:19:11,600
تابع pi استفاده
496
00:19:11,600 –> 00:19:14,000
کنیم و داده های خود را به
497
00:19:14,000 –> 00:19:15,520
دنبال
498
00:19:15,520 –> 00:19:18,799
پارامتر labels که برابر
499
00:19:18,799 –> 00:19:22,480
با برچسب ها است، ارسال می کنیم. که در بالا اعلام کردیم
500
00:19:22,480 –> 00:19:25,120
که این
501
00:19:25,120 –> 00:19:27,039
مشکلی ندارد،
502
00:19:27,039 –> 00:19:29,280
503
00:19:29,280 –> 00:19:31,600
اکنون می گویم پارامتر رنگ ها باید
504
00:19:31,600 –> 00:19:32,799
برابر
505
00:19:32,799 –> 00:19:35,120
با پالت رنگی باشد که
506
00:19:35,120 –> 00:19:38,160
در خط بالا تعریف
507
00:19:38,160 –> 00:19:39,360
کرده
508
00:19:39,360 –> 00:19:42,400
ایم، سپس از auto pct استفاده می کنیم،
509
00:19:42,400 –> 00:19:43,600
510
00:19:43,600 –> 00:19:46,000
بنابراین این pct خودکار به شما امکان می دهد
511
00:19:46,000 –> 00:19:46,799
512
00:19:46,799 –> 00:19:48,880
مقدار درصد با استفاده از قالببندی رشته پایتون،
513
00:19:48,880 –> 00:19:50,320
514
00:19:50,320 –> 00:19:52,640
بنابراین میتوانید از pct خودکار برای نمایش
515
00:19:52,640 –> 00:19:53,679
516
00:19:53,679 –> 00:19:56,559
مقادیر درصدی خود استفاده کنید، اجازه دهید یک درصد قالببندی مشخصی را به من بدهم
517
00:19:56,559 –> 00:19:58,799
518
00:19:58,799 –> 00:20:00,240
519
00:20:00,240 –> 00:20:01,440
520
00:20:01,440 –> 00:20:02,880
521
00:20:02,880 –> 00:20:05,200
که برای
522
00:20:05,200 –> 00:20:08,799
رشته است، دو درصد مقدار میدهد
523
00:20:08,799 –> 00:20:11,679
در نهایت میخواهم بگویم plt dot show برای
524
00:20:11,679 –> 00:20:14,400
نمایش نمودار من
525
00:20:14,799 –> 00:20:16,799
526
00:20:16,799 –> 00:20:17,760
خوب
527
00:20:17,760 –> 00:20:20,960
حالا بیایید این را اجرا کنیم خوب، یک
528
00:20:20,960 –> 00:20:25,360
خطا در اینجا وجود دارد که شکل نقطه طرح است،
529
00:20:25,360 –> 00:20:27,520
این باید شکل نقطه طرح باشد و
530
00:20:27,520 –> 00:20:29,039
زیر خط
531
00:20:29,039 –> 00:20:30,640
532
00:20:30,640 –> 00:20:32,720
533
00:20:32,720 –> 00:20:36,240
534
00:20:36,240 –> 00:20:39,760
نکشید.
535
00:20:39,760 –> 00:20:43,039
درصد از پنالتی ها به
536
00:20:43,039 –> 00:20:46,000
ثمر رسید در حالی که 18 درصد از دست رفتند،
537
00:20:46,000 –> 00:20:49,000
538
00:20:49,760 –> 00:20:52,400
اکنون
539
00:20:52,799 –> 00:20:55,600
تعداد کل
540
00:20:55,600 –> 00:20:58,240
موقعیت های منحصر به فردی که
541
00:20:58,240 –> 00:21:01,280
هر یک از بازیکنان برای آنها بازی می کنند را پیدا می کنیم،
542
00:21:01,280 –> 00:21:02,799
این همچنین تعداد
543
00:21:02,799 –> 00:21:04,720
کل موقعیت هایی را که در فوتبال وجود دارد به ما می گوید
544
00:21:04,720 –> 00:21:06,400
.
545
00:21:06,400 –> 00:21:09,840
من می گویم epl underscore df
546
00:21:09,840 –> 00:21:13,200
بیایید ستون موقعیت را در نظر بگیریم
547
00:21:13,280 –> 00:21:15,120
548
00:21:15,120 –> 00:21:16,880
و من از تابع منحصر به فرد
549
00:21:16,880 –> 00:21:18,480
برای یافتن تعداد کل موقعیت های منحصر به فرد استفاده
550
00:21:18,480 –> 00:21:20,799
می کنم، مانند
551
00:21:20,799 –> 00:21:23,679
هافبک هافبک میانی
552
00:21:23,679 –> 00:21:26,240
مدافعان دروازه بان و غیره
553
00:21:26,240 –> 00:21:28,640
اگر آن را اجرا کنم، اینجا را می بینید.
554
00:21:28,640 –> 00:21:32,080
یک هافبک دروازه بان
555
00:21:32,080 –> 00:21:35,280
و یک هافبک مدافع
556
00:21:35,280 –> 00:21:36,480
جلودار
557
00:21:36,480 –> 00:21:39,440
هافبک دفاعی هافبک و غیره داشته
558
00:21:39,440 –> 00:21:41,840
باشید اکنون می توانید ببینید که برخی از پست
559
00:21:41,840 –> 00:21:42,799
560
00:21:42,799 –> 00:21:44,880
ها ترکیبی از دو موقعیت هستند که
561
00:21:44,880 –> 00:21:46,960
به این معنی است که تعداد کمی از
562
00:21:46,960 –> 00:21:49,039
بازیکنان برای دو موقعیت مختلف
563
00:21:49,039 –> 00:21:50,400
در زمین
564
00:21:50,400 –> 00:21:52,799
565
00:21:54,000 –> 00:21:55,919
بازی
566
00:21:55,919 –> 00:21:58,480
می کنند که کاملاً به جلو حرکت می کنند.
567
00:21:58,480 –> 00:22:00,240
تعداد کل
568
00:22:00,240 –> 00:22:02,159
بازیکنان فورواردی که در آخرین
569
00:22:02,159 –> 00:22:04,559
فصل epl بازی کردند، بنابراین من میخواهم دوباره
570
00:22:04,559 –> 00:22:05,360
571
00:22:05,360 –> 00:22:08,240
epl underscore df
572
00:22:08,240 –> 00:22:10,320
را در داخل پرانتز
573
00:22:10,320 –> 00:22:12,480
ببینم. pl روی df تأکید کنید و ما ستون موقعیت را
574
00:22:12,480 –> 00:22:13,679
در نظر می گیریم که
575
00:22:13,679 –> 00:22:16,559
576
00:22:17,679 –> 00:22:20,640
اساساً زیر مجموعه داده قاب را برای
577
00:22:20,640 –> 00:22:23,520
بدست آوردن اطلاعات ارزشمند در نظر می گیریم،
578
00:22:23,520 –> 00:22:25,600
اکنون این باید برابر با
579
00:22:25,600 –> 00:22:29,360
مقدار من باشد که f w است که جلوتر است،
580
00:22:29,360 –> 00:22:30,720
بیایید آن را اجرا
581
00:22:30,720 –> 00:22:32,640
کنیم شما بروید،
582
00:22:32,640 –> 00:22:35,120
بنابراین اگر به پایین اسکرول کنم به اینجا بروید. می توانید
583
00:22:35,120 –> 00:22:38,240
بازیکنان مختلفی را که برای آنها بازی
584
00:22:38,240 –> 00:22:40,960
کرده اند مشاهده کنید در مجموع 81 ردیف وجود دارد
585
00:22:40,960 –> 00:22:42,720
که به این معنی است که
586
00:22:42,720 –> 00:22:44,320
81 بازیکن
587
00:22:44,320 –> 00:22:47,440
در epl به عنوان مهاجم بازی
588
00:22:47,440 –> 00:22:50,159
589
00:22:50,159 –> 00:22:52,320
590
00:22:52,320 –> 00:22:54,559
591
00:22:54,559 –> 00:22:58,159
592
00:22:58,159 –> 00:23:01,520
593
00:23:02,480 –> 00:23:04,960
کرده اند. بیلی شارپ از شفیلد
594
00:23:04,960 –> 00:23:06,480
یونایتد و
595
00:23:06,480 –> 00:23:09,840
دانیل همچنین
596
00:23:10,320 –> 00:23:11,360
597
00:23:11,360 –> 00:23:14,720
سوال بعدی که قرار است به آن پاسخ
598
00:23:14,720 –> 00:23:16,320
دهیم این است که بازیکنان کشورهای مختلف
599
00:23:16,320 –> 00:23:19,919
را خواهیم دید، بنابراین در epl خواهیم دید
600
00:23:19,919 –> 00:23:21,520
که ملت ها یا تعداد
601
00:23:21,520 –> 00:23:24,559
کل کشورهایی که بازیکنان از آنها آمده اند
602
00:23:24,559 –> 00:23:26,880
چقدر هستند. من از این تابع به نام
603
00:23:26,880 –> 00:23:29,280
numpy.size استفاده خواهم کرد
604
00:23:29,280 –> 00:23:30,880
و در داخل
605
00:23:30,880 –> 00:23:34,240
پرانتز epl underscore df را می بینم
606
00:23:34,240 –> 00:23:36,159
، ستون ملیت را برای یافتن تعداد در نظر می گیریم،
607
00:23:36,159 –> 00:23:38,799
608
00:23:38,799 –> 00:23:42,720
بنابراین من ملیت را می گویم
609
00:23:44,559 –> 00:23:47,279
و ما قصد داریم از
610
00:23:47,279 –> 00:23:48,960
تابع منحصربهفرد برای بدست آوردن تعداد
611
00:23:48,960 –> 00:23:50,960
کل ملتهای منحصربهفردی که بازیکنان از آنها
612
00:23:50,960 –> 00:23:53,279
در epl
613
00:23:53,279 –> 00:23:54,880
614
00:23:54,880 –> 00:23:57,120
615
00:23:57,120 –> 00:23:58,640
616
00:23:58,640 –> 00:24:00,799
بازی میکنند استفاده
617
00:24:00,799 –> 00:24:02,640
کنیم.
618
00:24:02,640 –> 00:24:06,320
بازیکنان از کدام کشورها می آیند
619
00:24:06,320 –> 00:24:08,799
برای آن
620
00:24:09,279 –> 00:24:12,240
من متغیری به نام
621
00:24:12,240 –> 00:24:16,080
ملیت ایجاد می کنم برابر با من از قاب داده خود استفاده می کنم
622
00:24:16,080 –> 00:24:18,559
epl underscore df به
623
00:24:18,559 –> 00:24:20,320
دنبال آن
624
00:24:20,320 –> 00:24:21,120
625
00:24:21,120 –> 00:24:23,039
گروه بر
626
00:24:23,039 –> 00:24:25,279
تابع ابتدا ستون ملیت را گروه بندی می کنیم
627
00:24:25,279 –> 00:24:27,279
628
00:24:27,279 –> 00:24:29,760
و سپس i’ اندازه نقطه را می
629
00:24:29,760 –> 00:24:31,360
630
00:24:31,360 –> 00:24:34,640
گوییم و
631
00:24:34,960 –> 00:24:38,320
مقادیر را به ترتیب صعودی مرتب می کنیم،
632
00:24:38,320 –> 00:24:39,760
بنابراین از
633
00:24:39,760 –> 00:24:42,480
پارامتر صعودی استفاده می کنم و
634
00:24:42,480 –> 00:24:44,480
آن را روی false قرار می دهم که به این معنی است که
635
00:24:44,480 –> 00:24:46,640
به ترتیب نزولی چاپ می کنیم و
636
00:24:46,640 –> 00:24:48,480
637
00:24:48,480 –> 00:24:50,080
638
00:24:50,080 –> 00:24:52,640
بعد صعودی نمی کنیم.
639
00:24:54,279 –> 00:24:56,480
Nationality.head از آنجایی که میخواهم
640
00:24:56,480 –> 00:24:57,279
641
00:24:57,279 –> 00:24:59,039
10 کشور
642
00:24:59,039 –> 00:25:02,000
برتر را که اکثر بازیکنان
643
00:25:02,000 –> 00:25:04,080
از آنها آمدهاند بدانم،
644
00:25:04,080 –> 00:25:06,799
همچنین میخواهیم آن را ترسیم کنیم
645
00:25:06,799 –> 00:25:09,679
که باید یک نمودار میلهای وجود داشته باشد، بنابراین میگویم
646
00:25:09,679 –> 00:25:11,440
نوع
647
00:25:11,440 –> 00:25:14,480
برابر با میله است،
648
00:25:14,480 –> 00:25:16,720
بیایید اندازه شکلی
649
00:25:16,720 –> 00:25:18,480
650
00:25:18,480 –> 00:25:20,000
651
00:25:20,000 –> 00:25:21,840
برابر با
652
00:25:21,840 –> 00:25:26,320
فرض کنید 12 کاما 6
653
00:25:26,400 –> 00:25:28,400
و
654
00:25:28,400 –> 00:25:31,360
حالا میخواهم بگویم رنگ برابر است با
655
00:25:31,360 –> 00:25:33,440
دوباره استفاده از
656
00:25:33,440 –> 00:25:36,400
پالت رنگ باند c، بنابراین میگویم sns پالت
657
00:25:36,400 –> 00:25:39,360
زیر خط
658
00:25:40,840 –> 00:25:43,919
رنگ نقطهای این بار انتخاب میکنیم
659
00:25:43,919 –> 00:25:46,720
بیایید ماگما را ببینیم
660
00:25:46,799 –> 00:25:49,039
درست است
661
00:25:50,480 –> 00:25:53,039
، فکر میکنم همه چیز خوب است بیایید فقط
662
00:25:53,039 –> 00:25:54,960
663
00:25:54,960 –> 00:25:58,640
عالی اجرا کنید اگر به پایین اسکرول کنم،
664
00:25:58,640 –> 00:26:01,440
میتوانید ملیتهای مختلف را ببینید،
665
00:26:01,440 –> 00:26:04,080
10 کشور برتر
666
00:26:04,080 –> 00:26:06,640
که بیشترین بازیکنان از آنها میآیند،
667
00:26:06,640 –> 00:26:07,919
البته از آنجایی که
668
00:26:07,919 –> 00:26:09,279
669
00:26:09,279 –> 00:26:11,760
epl در انگلیس است یا
670
00:26:11,760 –> 00:26:13,760
میزبان آن در انگلیس است، بنابراین اکثر
671
00:26:13,760 –> 00:26:15,600
بازیکنان از انگلیس هستند،
672
00:26:15,600 –> 00:26:18,000
پس ما داریم
673
00:26:18,000 –> 00:26:19,919
بیشترین تعداد بازیکنانی که از
674
00:26:19,919 –> 00:26:20,960
فرانسه
675
00:26:20,960 –> 00:26:22,240
برزیل
676
00:26:22,240 –> 00:26:23,679
اسپانیا بازی می کنند
677
00:26:23,679 –> 00:26:25,440
این ایرلند است من حدس می زنم پس از آن ما
678
00:26:25,440 –> 00:26:27,840
پرتغال اسکاتلند هلند چرخ ها و
679
00:26:27,840 –> 00:26:29,919
بلژیک
680
00:26:29,919 –> 00:26:32,159
سرد
681
00:26:32,240 –> 00:26:34,080
اکنون
682
00:26:34,080 –> 00:26:35,919
در حال حرکت رو
683
00:26:35,919 –> 00:26:37,679
به جلو بیایید به
684
00:26:37,679 –> 00:26:39,760
سلول بعدی بیاییم ما می خواهیم باشگاه هایی را
685
00:26:39,760 –> 00:26:43,840
با حداکثر بازیکنان در ترکیب خود ببینیم.
686
00:26:44,720 –> 00:26:46,960
برای ما
687
00:26:46,960 –> 00:26:48,320
باشگاهها
688
00:26:48,320 –> 00:26:50,559
، فرض کنید پنج باشگاه برتری
689
00:26:50,559 –> 00:26:52,640
که حداکثر بازیکنان را در ترکیب خود دارند یا
690
00:26:52,640 –> 00:26:54,919
در فصل 2020-2021 بیشترین بازیکنان
691
00:26:54,919 –> 00:26:58,240
692
00:26:58,320 –> 00:27:01,760
را دارند، ستون باشگاه را در نظر
693
00:27:01,760 –> 00:27:02,640
694
00:27:02,640 –> 00:27:04,720
میگیریم. میخواهیم
695
00:27:04,720 –> 00:27:07,600
تعداد کل بازیکنان را بشماریم،
696
00:27:07,600 –> 00:27:10,159
بنابراین میگویم ارزشها
697
00:27:10,1