در این مطلب، ویدئو پایتون پروژه علم داده را برای پیش بینی کیفیت شراب کامل کرد | پروژه پایان به پایان با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:56:34
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,160 –> 00:00:03,600
سلام و به پروژه جدید
2
00:00:03,600 –> 00:00:06,000
آموزش علوم داده خوش آمدید، جایی که من در
3
00:00:06,000 –> 00:00:09,200
4
00:00:09,200 –> 00:00:12,000
آنجا پروژه پایان به انتها را به شما نشان خواهم داد، بنابراین
5
00:00:12,000 –> 00:00:14,240
ما با وارد کردن داده
6
00:00:14,240 –> 00:00:15,599
تأیید تأیید داده
7
00:00:15,599 –> 00:00:18,560
، استانداردسازی اکتشاف
8
00:00:18,560 –> 00:00:20,160
داده ها را شروع می کنیم،
9
00:00:20,160 –> 00:00:21,760
پس از آن یادگیری ماشین، نوع دیگری را اعمال خواهیم کرد.
10
00:00:21,760 –> 00:00:23,119
از
11
00:00:23,119 –> 00:00:24,640
یادگیری ماشینی و من
12
00:00:24,640 –> 00:00:26,640
در اینجا به شما چند کار می دهم همچنین
13
00:00:26,640 –> 00:00:29,119
برای تکالیف شما در اینجا به شما وظایف می دهم تا بتوانید
14
00:00:29,119 –> 00:00:31,119
به راحتی انجام دهید،
15
00:00:31,119 –> 00:00:33,920
شما تمام تمرینات را همراه من می دانید
16
00:00:33,920 –> 00:00:36,800
و سپس ما بر اساس
17
00:00:36,800 –> 00:00:38,879
یادگیری ماشینی که انجام خواهیم داد برخی از پیشبینیها را
18
00:00:38,879 –> 00:00:41,040
نیز انجام دهید در نهایت آنچه را که من به شما برخی
19
00:00:41,040 –> 00:00:43,360
از پیشبینیهای بلادرنگ را نشان میدهم انجام دهید، به این معنی که فرض
20
00:00:43,360 –> 00:00:45,920
کنید این مدل را انتخاب میکنید و
21
00:00:45,920 –> 00:00:47,920
در نوعی
22
00:00:47,920 –> 00:00:50,559
برنامه کاربردی مانند یک برنامه وب یا
23
00:00:50,559 –> 00:00:53,039
برنامه اضافی یا هر جایی قرار
24
00:00:53,039 –> 00:00:55,360
میدهید، به طور کلی چگونه
25
00:00:55,360 –> 00:00:58,000
ورودی من را میپذیرید.
26
00:00:58,000 –> 00:01:00,399
نمونه ای از آن
27
00:01:00,399 –> 00:01:02,160
را به شما نشان می دهد و یک پیش بینی انجام می
28
00:01:02,160 –> 00:01:03,120
دهد تا
29
00:01:03,120 –> 00:01:05,280
بتوانید اطلاعات را ارائه دهید، به این معنی که در واقع می توانید
30
00:01:05,280 –> 00:01:06,799
31
00:01:06,799 –> 00:01:09,520
یک برنامه واقعی ایجاد کنید
32
00:01:09,520 –> 00:01:11,600
اگر شما این روش را دنبال می کنید یا اگر
33
00:01:11,600 –> 00:01:13,760
این را دنبال کنید تنها چیزی که به
34
00:01:13,760 –> 00:01:16,880
شما نشان نمی دهم توسعه
35
00:01:16,880 –> 00:01:18,560
برنامه است زیرا این چیزی خارج
36
00:01:18,560 –> 00:01:19,840
از این محدوده
37
00:01:19,840 –> 00:01:22,080
برنامه وب است اگر می خواهید
38
00:01:22,080 –> 00:01:24,640
بدانید که چگونه نوعی برنامه وب
39
00:01:24,640 –> 00:01:26,240
ایجاد کنید. من دو دوره مختلف تولید کرده ام
40
00:01:26,240 –> 00:01:27,680
41
00:01:27,680 –> 00:01:30,400
یکی در مورد براق که مربوط به
42
00:01:30,400 –> 00:01:32,720
برنامه نویسی r است اگر شما در
43
00:01:32,720 –> 00:01:35,200
برنامه نویسی r هستید و دیگری مربوط
44
00:01:35,200 –> 00:01:36,479
به داش است
45
00:01:36,479 –> 00:01:39,439
بنابراین داش اساسا چارچوبی است که
46
00:01:39,439 –> 00:01:41,040
می توانید داشبورد و
47
00:01:41,040 –> 00:01:43,360
برنامه های کاربردی برای این کار ایجاد کنید. شما می
48
00:01:43,360 –> 00:01:44,960
توانید آن دوره ها را بررسی کنید، من احتمالاً ادامه خواهم
49
00:01:44,960 –> 00:01:46,479
داد و پیوند را در
50
00:01:46,479 –> 00:01:48,079
توضیحات قرار
51
00:01:48,079 –> 00:01:49,520
52
00:01:49,520 –> 00:01:51,439
خواهم داد، اما به طور عمده به شما نشان خواهم داد
53
00:01:51,439 –> 00:01:53,360
که چگونه
54
00:01:53,360 –> 00:01:55,759
اساساً این نوع پروژه را انجام می دهید
55
00:01:55,759 –> 00:01:57,520
که
56
00:01:57,520 –> 00:02:00,159
اساساً از هر کسی که نیاز است.
57
00:02:00,159 –> 00:02:01,600
58
00:02:01,600 –> 00:02:05,759
بیایید ابتدا این کار را انجام دهیم
59
00:02:05,759 –> 00:02:07,680
که قرار است چه دادههایی وارد کنیم،
60
00:02:07,680 –> 00:02:10,318
بنابراین کیفیت شراب اساساً
61
00:02:10,318 –> 00:02:11,760
دادهای است
62
00:02:11,760 –> 00:02:15,120
که دادهای است که مربوط به
63
00:02:15,120 –> 00:02:18,640
بررسی f بنابراین یک
64
00:02:18,640 –> 00:02:20,560
عدد به یک
65
00:02:20,560 –> 00:02:22,560
نوع شراب از یک شراب داده شده است که این نوع شراب است
66
00:02:22,560 –> 00:02:24,879
و کیفیت آن چگونه است، بنابراین
67
00:02:24,879 –> 00:02:27,760
اگر در شرکتی هستید که درست یک
68
00:02:27,760 –> 00:02:30,560
شرکت شراب سازی است،
69
00:02:30,560 –> 00:02:33,840
مثلاً در هند در ناسیک، در مورد این فکر کنید. این
70
00:02:33,840 –> 00:02:36,560
شرکت شراب سولا فرض می کند که شما در یک
71
00:02:36,560 –> 00:02:38,959
شرکت شراب سولا کار می کنید و
72
00:02:38,959 –> 00:02:41,760
در حال حاضر این شرکت
73
00:02:41,760 –> 00:02:42,720
74
00:02:42,720 –> 00:02:44,400
صدها هزار
75
00:02:44,400 –> 00:02:48,800
روپیه یا میلیون ها روپیه از نظر
76
00:02:48,800 –> 00:02:51,360
طعم درست شراب و بررسی اینکه آیا
77
00:02:51,360 –> 00:02:53,360
کیفیت شراب خوب است یا نه، هزینه می کند، بنابراین
78
00:02:53,360 –> 00:02:56,319
فرض کنید 100 نفر دارید. کسانی که
79
00:02:56,319 –> 00:02:59,120
صدها یا هزاران
80
00:02:59,120 –> 00:03:00,800
شراب مختلف را میچشند که احتمالاً
81
00:03:00,800 –> 00:03:03,120
هر ماه درست درست میکنند و اساساً
82
00:03:03,120 –> 00:03:04,560
بازخورد و مواردی از این قبیل را ارائه میکنند،
83
00:03:04,560 –> 00:03:06,239
بنابراین میخواهید کل این
84
00:03:06,239 –> 00:03:07,519
فرآیند
85
00:03:07,519 –> 00:03:08,319
و
86
00:03:08,319 –> 00:03:10,400
با کمک الگوریتم به
87
00:03:10,400 –> 00:03:12,239
کمک
88
00:03:12,239 –> 00:03:15,360
دستگاه را خودکار کنید. شما ممکن است بخواهید
89
00:03:15,360 –> 00:03:16,879
کل این فرآیند
90
00:03:16,879 –> 00:03:21,840
را بهینه کنید تا منتظر
91
00:03:21,840 –> 00:03:24,239
نمانید تا طعمه شراب که در نهایت شراب
92
00:03:24,239 –> 00:03:26,000
ساخته شود یا نمونه ای ساخته شود و آنها در حال
93
00:03:26,000 –> 00:03:27,920
آزمایش و انجام آن باشند، اما w با
94
00:03:27,920 –> 00:03:29,760
کمک دستگاه شما باید بخواهید
95
00:03:29,760 –> 00:03:31,760
به اندازه 90 درصد و بیشتر دقت داشته باشید
96
00:03:31,760 –> 00:03:34,720
که شراب شما واقعاً خوب است
97
00:03:34,720 –> 00:03:38,080
یا درست نیست، بنابراین اگر
98
00:03:38,080 –> 00:03:40,480
این پروژه ای است که به
99
00:03:40,480 –> 00:03:42,640
ما می رسد، می توانیم از آن استفاده
100
00:03:42,640 –> 00:03:44,799
کنیم یا ما می توانیم چگونه می توانیم این کار را انجام دهیم
101
00:03:44,799 –> 00:03:46,239
چیزی است که من به شما نشان خواهم داد، بنابراین
102
00:03:46,239 –> 00:03:48,560
نوع مشابهی از موارد استفاده را می توانید
103
00:03:48,560 –> 00:03:52,799
با کمک این فرآیند
104
00:03:52,799 –> 00:03:55,519
105
00:03:55,519 –> 00:03:59,239
106
00:03:59,239 –> 00:04:02,000
حل کنید. و همانطور که می بینید من
107
00:04:02,000 –> 00:04:04,560
از Uh collab
108
00:04:04,560 –> 00:04:06,560
right google collab
109
00:04:06,560 –> 00:04:08,879
استفاده می کنم که به این معنی است که این یک کتاب کار زنده خواهد بود
110
00:04:08,879 –> 00:04:11,280
شما می توانید ادامه دهید و با استفاده از
111
00:04:11,280 –> 00:04:12,640
پیوندی که در
112
00:04:12,640 –> 00:04:15,200
توضیحات داده ام تمام داده ها را به آن دسترسی داشته باشید، اگرچه اوه و
113
00:04:15,200 –> 00:04:17,199
همراه با آن شما پیوند مجموعه دادهها
114
00:04:17,199 –> 00:04:19,839
را نیز داشته باشید، بنابراین با
115
00:04:19,839 –> 00:04:21,918
اولین چیزی که میخواهیم ابتدا کیفیت شراب را
116
00:04:21,918 –> 00:04:24,160
آپلود کنیم
117
00:04:24,160 –> 00:04:27,199
118
00:04:27,199 –> 00:04:29,840
، این مجموعه دادهها با کیفیت شراب n است و
119
00:04:29,840 –> 00:04:32,800
من روی آپلود
120
00:04:32,800 –> 00:04:34,000
کلیک میکنم، روی ok کلیک کنید،
121
00:04:34,000 –> 00:04:35,440
بنابراین این چیزی است که شما خواهید
122
00:04:35,440 –> 00:04:36,560
123
00:04:36,560 –> 00:04:39,440
داشت. و اگر دیدید سمت
124
00:04:39,440 –> 00:04:42,639
چپ در اینجا کیفیت الهی وجود دارد،
125
00:04:42,639 –> 00:04:44,880
بنابراین ما قصد داریم چند
126
00:04:44,880 –> 00:04:46,720
کتابخانه استاندارد
127
00:04:46,720 –> 00:04:50,320
مانند پانداها numpy matplotlib و c
128
00:04:50,320 –> 00:04:52,800
bond را وارد
129
00:04:52,800 –> 00:04:55,040
130
00:04:55,040 –> 00:04:57,680
131
00:04:57,680 –> 00:05:00,800
کنیم.
132
00:05:00,800 –> 00:05:04,000
میفهمید که چه زمانی باید کدام کتابخانه را
133
00:05:04,000 –> 00:05:06,160
درست وارد کنید، گاهی اوقات وقتی یک برنامه واقعی را میبینید
134
00:05:06,160 –> 00:05:07,280
135
00:05:07,280 –> 00:05:09,280
، مثلاً 15 یا 20
136
00:05:09,280 –> 00:05:12,400
کتابخانه مختلف وجود دارد که در آنجا هستند و زمانی که من
137
00:05:12,400 –> 00:05:14,080
شروع به یادگیری در آن روز
138
00:05:14,080 –> 00:05:16,240
کردم که بسیار دلهرهآور بود، این است
139
00:05:16,240 –> 00:05:18,320
که کجا میتوانم از همه این کتابخانه ها
140
00:05:18,320 –> 00:05:20,240
استفاده کنید و دقیقاً چه فایده ای دارد
141
00:05:20,240 –> 00:05:22,560
که دقیقاً در کجا مورد استفاده قرار می گیرد، بنابراین با
142
00:05:22,560 –> 00:05:24,800
در نظر گرفتن تلاشی که من در
143
00:05:24,800 –> 00:05:26,560
حدود 5 سال قبل از زمانی که
144
00:05:26,560 –> 00:05:28,720
این فضا را شروع کردم، داشتم، اوه این
145
00:05:28,720 –> 00:05:30,080
چیزی است که می خواهم آن را برای
146
00:05:30,080 –> 00:05:32,720
شما ساده کنم. و من میخواهم
147
00:05:32,720 –> 00:05:34,960
فقط در صورت نیاز کتابخانه را به شما نشان دهم،
148
00:05:34,960 –> 00:05:36,160
149
00:05:36,160 –> 00:05:39,280
بنابراین بیایید ابتدا
150
00:05:39,280 –> 00:05:44,320
پانداهای مورد علاقه خود را به عنوان np
151
00:05:44,320 –> 00:05:46,560
با نام مستعار import
152
00:05:46,560 –> 00:05:48,560
seaborn وارد کنیم. به عنوان یک
153
00:05:48,560 –> 00:05:50,240
sns
154
00:05:50,240 –> 00:05:52,560
و matplotlib
155
00:05:52,560 –> 00:05:57,600
مک پلات آزمایشگاه نقطه pi نمودار به عنوان plt
156
00:05:57,600 –> 00:06:00,240
بنابراین این همه این کتابخانه ها این
157
00:06:00,240 –> 00:06:02,319
به ما کمک می کند تا
158
00:06:02,319 –> 00:06:04,720
وارد کردن داده ها و همچنین
159
00:06:04,720 –> 00:06:07,360
برخی از وظایف کاوش داده را انجام دهیم، حتی
160
00:06:07,360 –> 00:06:09,199
برخی در موارد خاص تجسم و همچنین
161
00:06:09,199 –> 00:06:10,000
162
00:06:10,000 –> 00:06:12,319
numpy اساساً برای تبدیل آن است. داده ها
163
00:06:12,319 –> 00:06:14,479
در آرایه زمانی که ما می خواستیم
164
00:06:14,479 –> 00:06:16,720
نوعی پیش بینی بر روی داده های واقعی انجام
165
00:06:16,720 –> 00:06:19,199
دهیم، سپس کتابخانه c bond مانند
166
00:06:19,199 –> 00:06:21,120
seaborn را به عنوان sns داریم
167
00:06:21,120 –> 00:06:23,520
که همچنین یک کتابخانه تجسم داده
168
00:06:23,520 –> 00:06:25,520
است و matplotlib نیز یک
169
00:06:25,520 –> 00:06:27,919
کتابخانه تجسم است matplotlib
170
00:06:27,919 –> 00:06:30,080
اساساً تجسم پایه است. کتابخانه
171
00:06:30,080 –> 00:06:32,080
علاوه بر آن، شما پیوند c را دارید که
172
00:06:32,080 –> 00:06:34,400
دارای ویژگی های پیشرفته
173
00:06:34,400 –> 00:06:36,720
تری است که ما به آن می رویم
174
00:06:36,720 –> 00:06:40,000
175
00:06:40,000 –> 00:06:42,400
176
00:06:42,400 –> 00:06:43,280
177
00:06:43,280 –> 00:06:46,000
178
00:06:46,000 –> 00:06:48,160
در شرف منسوخ شدن است، بنابراین
179
00:06:48,160 –> 00:06:50,240
اگر میخواهید فیلتر کنید
180
00:06:50,240 –> 00:06:51,440
، میتوانیم
181
00:06:51,440 –> 00:06:54,000
از این نوع
182
00:06:54,000 –> 00:06:56,160
183
00:06:56,160 –> 00:06:58,319
184
00:06:58,319 –> 00:07:01,440
اخطارها استفاده کنیم.
185
00:07:01,440 –> 00:07:02,880
186
00:07:02,880 –> 00:07:03,919
ay
187
00:07:03,919 –> 00:07:05,840
بی جهت اخطارهای طولانی
188
00:07:05,840 –> 00:07:07,680
زیاد نخواهد آمد، اما اگر واقعاً
189
00:07:07,680 –> 00:07:09,120
علاقه مند به دیدن اخطار
190
00:07:09,120 –> 00:07:11,120
هستید، می توانید آن را
191
00:07:11,120 –> 00:07:12,639
از اینجا حذف کنید
192
00:07:12,639 –> 00:07:16,080
، پس از آن اول،
193
00:07:16,080 –> 00:07:18,960
ابتدا یک شی چارچوب داده ایجاد
194
00:07:18,960 –> 00:07:21,280
می کنیم که در آن
195
00:07:21,280 –> 00:07:22,160
196
00:07:22,160 –> 00:07:24,639
شراب با کیفیت
197
00:07:24,639 –> 00:07:28,960
شراب را ذخیره می کنیم. کیفیت و نقطه csv
198
00:07:28,960 –> 00:07:30,960
و ما قرار بود آن را وارد کنیم
199
00:07:30,960 –> 00:07:32,319
و حالا
200
00:07:32,319 –> 00:07:33,919
هیچ جستجویی وجود ندارد،
201
00:07:33,919 –> 00:07:36,720
فقط مطمئن شوید که y به درستی در
202
00:07:36,720 –> 00:07:38,319
آنجا نوشته شده باشد
203
00:07:38,319 –> 00:07:40,560
و امیدوارم هیچ
204
00:07:40,560 –> 00:07:42,160
مشکلی وجود
205
00:07:42,160 –> 00:07:44,240
206
00:07:44,240 –> 00:07:47,759
207
00:07:47,759 –> 00:07:50,479
نداشته باشد. پنج ردیف اول را دقیقاً در اینجا نشان می دهد،
208
00:07:50,479 –> 00:07:52,879
در این مورد اوه
209
00:07:52,879 –> 00:07:55,039
همه آنها شراب سفید هستند
210
00:07:55,039 –> 00:07:58,080
اگر می خواهید ردیف های آخر را بررسی کنید باد
211
00:07:58,080 –> 00:07:59,199
یا
212
00:07:59,199 –> 00:08:01,120
دم کاری است که می توانید انجام دهید
213
00:08:01,120 –> 00:08:02,800
جایی که دو ردیف آخر را می بینید
214
00:08:02,800 –> 00:08:05,039
بنابراین تا آخر راه می رود.
215
00:08:05,039 –> 00:08:08,319
تا 6496،
216
00:08:08,319 –> 00:08:10,479
بنابراین این چیزی است که
217
00:08:10,479 –> 00:08:14,400
ما میتوانیم از 0 تا 6496
218
00:08:14,400 –> 00:08:18,000
آن را بررسی کنیم، یعنی 6497 ردیف وجود دارد،
219
00:08:18,000 –> 00:08:20,800
اگرچه میتوانیم از این روش نیز استفاده کنیم
220
00:08:20,800 –> 00:08:23,199
که به شکل نقطه y
221
00:08:23,199 –> 00:08:24,800
است، همچنین همان خروجی را میدهد که
222
00:08:24,800 –> 00:08:28,240
شما شش چهار و نه هفت دارید. n ردیف بنابراین
223
00:08:28,240 –> 00:08:30,160
از صفر تا شش شروع می شود و چهار نه شش
224
00:08:30,160 –> 00:08:33,200
در واقع 6497 است و شما در
225
00:08:33,200 –> 00:08:34,640
اینجا 13 ستون دارید
226
00:08:34,640 –> 00:08:36,080
که
227
00:08:36,080 –> 00:08:37,760
این را از نوع شروع
228
00:08:37,760 –> 00:08:40,320
می کنید تا تا آخر کیفیت را شروع کنید، بنابراین
229
00:08:40,320 –> 00:08:42,240
13 ستون در آنجا دارید،
230
00:08:42,240 –> 00:08:45,200
بنابراین نکته مهم دیگر
231
00:08:45,200 –> 00:08:48,160
بررسی تهی در هر کدام است. ستون
232
00:08:48,160 –> 00:08:51,120
بنابراین نقطه شراب صفر است
233
00:08:51,120 –> 00:08:54,480
مجموع نقطه با عرض
234
00:08:54,480 –> 00:08:59,519
پوزش من این باید براکت باشد،
235
00:09:00,080 –> 00:09:04,080
بنابراین در اینجا شما بررسی می کنید که
236
00:09:04,080 –> 00:09:07,440
ستون اسیدیته ثابت دارای
237
00:09:07,440 –> 00:09:10,560
مقادیر تهی است مانند 10 مقدار هشت
238
00:09:10,560 –> 00:09:12,800
مقدار سه دو دو، بنابراین مثل
239
00:09:12,800 –> 00:09:13,600
240
00:09:13,600 –> 00:09:14,640
این است که شما
241
00:09:14,640 –> 00:09:16,560
مقادیر حداقلی را می دانید که تهی
242
00:09:16,560 –> 00:09:18,880
و به طور کلی در اینجا نیز ph دارای
243
00:09:18,880 –> 00:09:21,360
9 و سطح چهار است، بنابراین دو کار را
244
00:09:21,360 –> 00:09:23,440
می توان در اینجا انجام داد، یکی این است
245
00:09:23,440 –> 00:09:24,720
که یا آن را حذف کرده
246
00:09:24,720 –> 00:09:27,680
ایم یا اساساً به آن
247
00:09:27,680 –> 00:09:29,839
نسبت داده می شود، بنابراین در این مورد چون آنها
248
00:09:29,839 –> 00:09:31,200
بسیار کمتر هستند،
249
00:09:31,200 –> 00:09:33,360
می توانیم این را حذف کنیم، بنابراین ما می توانیم آن را حذف
250
00:09:33,360 –> 00:09:36,399
کنیم. این قطره نقطه شراب
251
00:09:36,399 –> 00:09:38,160
را داشته باشید
252
00:09:38,160 –> 00:09:39,279
بیایید بگوییم
253
00:09:39,279 –> 00:09:41,120
نه خوب
254
00:09:41,120 –> 00:09:43,120
قطره هیچ
255
00:09:43,120 –> 00:09:45,839
و بعد از
256
00:09:45,839 –> 00:09:48,240
257
00:09:48,240 –> 00:09:50,240
آن فقط ببینم که آیا
258
00:09:50,240 –> 00:09:53,120
همه چیز را رها می کند یا نه
259
00:09:53,680 –> 00:09:56,399
شش چهار شش سه
260
00:09:56,399 –> 00:09:58,560
ردیف آیا این همان چیزی است که اکنون
261
00:09:58,560 –> 00:10:00,399
اینجا می آید نه پس آنچه باید
262
00:10:00,399 –> 00:10:01,600
مطمئن شویم این است که
263
00:10:01,600 –> 00:10:05,839
ما می گوییم در محل برابر با true است،
264
00:10:07,600 –> 00:10:09,600
بنابراین اکنون خوب است و اکنون خواهید دید
265
00:10:09,600 –> 00:10:13,160
که 6497 6463 را تغییر می دهد،
266
00:10:13,160 –> 00:10:15,680
یعنی تمام این ردیف ها
267
00:10:15,680 –> 00:10:18,160
حذف می شوند اگر دوباره این کد را اجرا کنیم
268
00:10:18,160 –> 00:10:20,800
، همه آنها 0 0 0 0 هستند.
269
00:10:20,800 –> 00:10:22,959
مهم این است که شما هیچ
270
00:10:22,959 –> 00:10:26,640
مقدار گمشده
271
00:10:26,640 –> 00:10:28,800
ای نداشته باشید تا زمانی که
272
00:10:28,800 –> 00:10:30,880
273
00:10:30,880 –> 00:10:33,519
یادگیری ماشین را به درستی انجام می دهید
274
00:10:33,519 –> 00:10:35,680
مشکلی نداشته باشید روش دیگری که می خواهم به شما نشان دهم اگر
275
00:10:35,680 –> 00:10:38,399
می خواهید میانگین ها را در آنجا جا بیندازید
276
00:10:38,399 –> 00:10:40,959
پس چه کاری می توانید انجام دهید. این است که شما به سادگی می توانید
277
00:10:40,959 –> 00:10:42,480
این دستور را اجرا کنید،
278
00:10:42,480 –> 00:10:46,959
نقطه به روز رسانی نقطه من، نقطه من را به
279
00:10:46,959 –> 00:10:48,959
درستی اجرا کنید، بنابراین شما
280
00:10:48,959 –> 00:10:51,760
آبجکت شراب را به روز می کنید و n a را
281
00:10:51,760 –> 00:10:52,800
با
282
00:10:52,800 –> 00:10:54,880
معنی نقطه شراب
283
00:10:54,880 –> 00:10:57,279
پر می کنید، به این ترتیب میانگین ها را در آنجا پر می کنید،
284
00:10:57,279 –> 00:11:00,160
بنابراین من فقط نگه می دارم
285
00:11:00,160 –> 00:11:01,920
از
286
00:11:01,920 –> 00:11:03,760
آنجایی که قبلاً این
287
00:11:03,760 –> 00:11:06,000
رها کردن را انجام دادهایم، پایان کار اینجاست، اما اگر
288
00:11:06,000 –> 00:11:08,160
میخواهید میانگینها را پر کنید، این
289
00:11:08,160 –> 00:11:10,000
همان چیزی است که قرار است از آن استفاده
290
00:11:10,000 –> 00:11:11,120
291
00:11:11,120 –> 00:11:13,839
کنید، بسیار خب، پس از آن،
292
00:11:13,839 –> 00:11:17,279
اکنون اجازه دهید بررسی کنیم که چند و
293
00:11:17,279 –> 00:11:20,959
چند شراب قرمز و سفید
294
00:11:20,959 –> 00:11:23,680
فقط برای به منظور بررسی
295
00:11:23,680 –> 00:11:25,279
همه چیز خوب است، بنابراین
296
00:11:25,279 –> 00:11:29,279
می گوییم نوع شراب و
297
00:11:29,279 –> 00:11:32,640
ارزش نقطه زیرخط شمارش می شود،
298
00:11:32,640 –> 00:11:36,079
بنابراین وقتی انجام دادیم که چیزی که به دست می آورید این است که اگر بخواهم درصد را بررسی کنم،
299
00:11:36,079 –> 00:11:38,240
چهار هشت هفت صفر
300
00:11:38,240 –> 00:11:40,399
و یک پنج نه سه
301
00:11:40,399 –> 00:11:42,000
خواهیم داشت
302
00:11:42,000 –> 00:11:43,839
. خیلی
303
00:11:43,839 –> 00:11:46,160
راحتتر میتوان آن را بهخوبی تفسیر کرد، در آن صورت،
304
00:11:46,160 –> 00:11:49,839
در شمارش ارزش، شما خوب میشوید،
305
00:11:49,839 –> 00:11:52,639
اما در اینجا،
306
00:11:52,639 –> 00:11:56,560
نرمال کردن برابر با true است،
307
00:11:56,560 –> 00:11:59,839
بنابراین 75 مقدار از مقادیر، همان چیزی است که برای
308
00:11:59,839 –> 00:12:01,120
شراب سفید
309
00:12:01,120 –> 00:12:03,760
برای شراب قرمز دارید، به همین ترتیب
310
00:12:03,760 –> 00:12:06,000
آنچه انجام میدهید این است
311
00:12:06,000 –> 00:12:08,959
که متغیر کیفیت بسیار
312
00:12:08,959 –> 00:12:11,839
خوب
313
00:12:11,839 –> 00:12:14,639
است و اگر میخواهید
314
00:12:14,639 –> 00:12:17,440
این اطلاعات را تجسم کنید تا
315
00:12:17,440 –> 00:12:20,399
بتوانید آن را با استفاده از
316
00:12:20,399 –> 00:12:21,680
کتابخانه
317
00:12:21,680 –> 00:12:24,800
sns رسم کنید
318
00:12:24,800 –> 00:12:26,480
.
319
00:12:26,480 –> 00:12:28,800
320
00:12:30,959 –> 00:12:34,639
321
00:12:34,639 –> 00:12:36,240
322
00:12:36,240 –> 00:12:38,720
ما که
323
00:12:38,720 –> 00:12:41,519
شراب سفید زیاد است شراب قرمز کم است
324
00:12:41,519 –> 00:12:43,279
این همان چیزی است که با این اعداد نیز نشان می دهد،
325
00:12:43,279 –> 00:12:45,120
326
00:12:45,120 –> 00:12:47,120
بنابراین این چیزی است که اکنون می توانیم انجام دهیم،
327
00:12:47,120 –> 00:12:49,839
328
00:12:49,839 –> 00:12:52,160
چیز مهم دیگری که عموماً می خواهیم
329
00:12:52,160 –> 00:12:53,440
330
00:12:53,440 –> 00:12:56,320
بدانیم توزیع این داده ها است.
331
00:12:56,320 –> 00:12:59,279
درست است بنابراین کاری که من انجام خواهم داد این است که توزیع اسیدیته ثابت را به شما نشان می دهم و همچنین به شما نشان می دهم
332
00:12:59,279 –> 00:13:02,240
که
333
00:13:02,240 –> 00:13:03,839
آیا هیچ نقطه ای
334
00:13:03,839 –> 00:13:05,600
وجود دارد یا نه و باید
335
00:13:05,600 –> 00:13:08,240
با هر ستون به بالا بررسی کنید تا الکل به این
336
00:13:08,240 –> 00:13:10,399
ترتیب تکرار کنید. کدی
337
00:13:10,399 –> 00:13:12,320
که اکنون در اینجا می نویسم
338
00:13:12,320 –> 00:13:14,320
که در تکالیف برای شما است،
339
00:13:14,320 –> 00:13:15,120
بنابراین
340
00:13:15,120 –> 00:13:17,519
اولین چیزی که ابتدا دو تصویر را ترسیم می
341
00:13:17,519 –> 00:13:21,279
کنیم، بنابراین می گوییم plt
342
00:13:21,279 –> 00:13:22,800
343
00:13:22,800 –> 00:13:24,959
plt چیزی نیست جز
344
00:13:24,959 –> 00:13:27,680
این لوله نقطه matplotlib نه فقط برای
345
00:13:27,680 –> 00:13:29,519
ایجاد یک اتصال در آنجا
346
00:13:29,519 –> 00:13:31,040
347
00:13:31,040 –> 00:13:35,920
شکل plt dot ما دو شکل می خواهیم و
348
00:13:35,920 –> 00:13:39,040
plt نقطه فرعی یک دو یکی
349
00:13:39,040 –> 00:13:42,000
که به معنی یک سطر دو ستون است و
350
00:13:42,000 –> 00:13:44,160
شکل اول که به این معنی است
351
00:13:44,160 –> 00:13:46,880
که پس از آن شما sns دارید،
352
00:13:46,880 –> 00:13:50,880
بنابراین نمودار توزیع این نمودار همان
353
00:13:50,880 –> 00:13:52,720
نمودار است
354
00:13:52,720 –> 00:13:55,120
و ما می
355
00:13:55,120 –> 00:13:59,760
گوییم اوه اسیدیته ثابت را می خواهیم درست است،
356
00:13:59,760 –> 00:14:02,720
پس ما چه می دانیم اسیدیته ثابت است،
357
00:14:02,720 –> 00:14:04,079
بنابراین این کار انجام شد،
358
00:14:04,079 –> 00:14:07,519
اوم، اکنون می گوییم plt dot subplot یک
359
00:14:07,519 –> 00:14:09,040
دو دو
360
00:14:09,040 –> 00:14:10,000
و
361
00:14:10,000 –> 00:14:13,199
در اینجا ما به یک نمودار جعبه نیاز داریم، بنابراین ما یک
362
00:14:13,199 –> 00:14:15,199
کد کمی متفاوت می نویسیم:
363
00:14:15,199 –> 00:14:16,399
364
00:14:16,399 –> 00:14:18,880
365
00:14:18,880 –> 00:14:20,480
366
00:14:20,480 –> 00:14:22,959
367
00:14:22,959 –> 00:14:26,480
اسیدی ty dot نمودار نقطه نقطه
368
00:14:26,480 –> 00:14:27,680
369
00:14:27,680 –> 00:14:29,040
و
370
00:14:29,040 –> 00:14:32,160
بیایید آن را کمی بزرگ کنیم
371
00:14:32,160 –> 00:14:33,360
372
00:14:33,360 –> 00:14:35,760
اندازه انجیر
373
00:14:35,760 –> 00:14:37,680
برابر با
374
00:14:37,680 –> 00:14:39,760
15 کاما 5 بنابراین تجسم کمی بزرگتر
375
00:14:39,760 –> 00:14:42,000
376
00:14:42,000 –> 00:14:45,519
پس از آن چه چیزی
377
00:14:45,519 –> 00:14:47,279
خوب است بنابراین
378
00:14:47,279 –> 00:14:49,920
دو رقم این اولین شکل است
379
00:14:49,920 –> 00:14:51,600
این چیزی است که باید رسم شود این
380
00:14:51,600 –> 00:14:53,199
نمودار شکل دوم است و این همان چیزی است که شما
381
00:14:53,199 –> 00:14:57,399
باید رسم کنید اجازه دهید اجرا شود
382
00:15:00,320 –> 00:15:01,519
.
383
00:15:01,519 –> 00:15:03,120
384
00:15:03,120 –> 00:15:06,160
385
00:15:06,160 –> 00:15:09,600
386
00:15:09,600 –> 00:15:11,760
387
00:15:11,760 –> 00:15:13,760
388
00:15:13,760 –> 00:15:16,480
389
00:15:16,480 –> 00:15:19,360
ایده ای در مورد داده هایی که با چه چیزی سر و کار دارید به
390
00:15:19,360 –> 00:15:20,560
391
00:15:20,560 –> 00:15:23,199
این ترتیب برای شما آسان است وقتی آن را
392
00:15:23,199 –> 00:15:25,600
تفسیر می کنید یا اساساً
393
00:15:25,600 –> 00:15:28,240
اسنادی را در کنار هم قرار می دهید
394
00:15:28,240 –> 00:15:29,759
که برخی از آن متغیرهایی هستند که
395
00:15:29,759 –> 00:15:31,600
ممکن است تأثیر زیادی داشته باشند مانند این موارد در این مورد.
396
00:15:31,600 –> 00:15:34,320
نقاط دورافتاده ممکن است بر این تاثیر بگذارند و
397
00:15:34,320 –> 00:15:36,399
شاید بخواهید
398
00:15:36,399 –> 00:15:39,759
بعد از تولید اولین مدل پایه
399
00:15:39,759 –> 00:15:40,720
درست، برخی از درمانها را انجام دهید،
400
00:15:40,720 –> 00:15:42,720
بنابراین این چیزی است که اکنون باید
401
00:15:42,720 –> 00:15:44,880
روی هر متغیری انجام دهید که در
402
00:15:44,880 –> 00:15:48,079
اسیدیته ثابت b به شما نشان دادهام این کار را در هر متغیر انجام دهید و بعد از اتمام کار، آن را به
403
00:15:48,079 –> 00:15:50,880
404
00:15:50,880 –> 00:15:52,079
درستی تفسیر
405
00:15:52,079 –> 00:15:54,800
کنید، که یک
406
00:15:54,800 –> 00:15:56,880
تحلیل تک متغیری
407
00:15:56,880 –> 00:15:59,600
در اسیدیته ثابت است، اکنون از شما میخواهم
408
00:15:59,600 –> 00:16:02,800
که تجزیه و تحلیل دو متغیره را انجام دهید،
409
00:16:02,800 –> 00:16:04,399
به این معنی که شامل دو
410
00:16:04,399 –> 00:16:05,600
متغیر است،
411
00:16:05,600 –> 00:16:09,120
بنابراین ما به دریافت کنید،
412
00:16:09,120 –> 00:16:10,959
413
00:16:10,959 –> 00:16:11,920
414
00:16:11,920 –> 00:16:15,600
اساساً کیفیت شراب را در برابر همه
415
00:16:15,600 –> 00:16:17,920
متغیرهای مختلف ترسیم می کنم، به این معنی
416
00:16:17,920 –> 00:16:19,759
که یک متغیر را به شما نشان می دهم و شما باید
417
00:16:19,759 –> 00:16:21,680
آن را برای بقیه انجام دهید،
418
00:16:21,680 –> 00:16:23,360
بنابراین برای این
419
00:16:23,360 –> 00:16:25,120
کار می
420
00:16:25,120 –> 00:16:27,360
گوییم یک رقم کمی بزرگتر ایجاد
421
00:16:27,360 –> 00:16:28,959
می کنم تا آسان
422
00:16:28,959 –> 00:16:31,600
است اندازه جعلی است، همان کد است،
423
00:16:31,600 –> 00:16:33,360
اگر مشاهده کنید اگر آن را 10
424
00:16:33,360 –> 00:16:35,279
بار بنویسید، متخصص خواهید بود
425
00:16:35,279 –> 00:16:36,399
و به همین دلیل است که من از شما می خواهم این
426
00:16:36,399 –> 00:16:37,600
تکلیف را انجام دهید،
427
00:16:37,600 –> 00:16:38,399
بنابراین
428
00:16:38,399 –> 00:16:41,360
شکل نقطه plt اندازه ثابت 10 7
429
00:16:41,360 –> 00:16:44,480
ثانیه و نوار نقطه است. نمودار بنابراین ما در مورد نمودار ایجاد خواهیم کرد که
430
00:16:44,480 –> 00:16:47,199
در آن متغیر اول x
431
00:16:47,199 –> 00:16:49,199
متغیر چیزی
432
00:16:49,199 –> 00:16:50,399
جز
433
00:16:50,399 –> 00:16:51,839
434
00:16:51,839 –> 00:16:54,639
کیفیت نیست، متغیر y
435
00:16:54,639 –> 00:16:57,920
چیزی نیست، اما فرض کنید اسیدیته ثابت است در
436
00:16:57,920 –> 00:16:59,920
این مورد،
437
00:16:59,920 –> 00:17:03,440
بنابراین اسیدیته ثابت
438
00:17:03,440 –> 00:17:09,280
و اوه ما دادههایی برابر با y
439
00:17:10,720 –> 00:17:13,599
داریم نباید اخطار
440
00:17:13,599 –> 00:17:14,720
شراب باشد
441
00:17:14,720 –> 00:17:16,640
و اجرا کنیم. این
442
00:17:16,640 –> 00:17:18,720
و آن
443
00:17:18,720 –> 00:17:21,679
کیفیت را برای انواع مختلف اسیدیتههای ثابت برای ما تولید
444
00:17:21,679 –> 00:17:25,599
میکند، بنابراین به وضوح میدانید شراب
445
00:17:25,599 –> 00:17:28,640
شماره هفت هشت و نه جایی است که
446
00:17:28,640 –> 00:17:30,559
شما
447
00:17:30,559 –> 00:17:32,960
کیفیت خوبی دارید
448
00:17:32,960 –> 00:17:34,799
و y عدد نه
449
00:17:34,799 –> 00:17:36,799
با کمک این خطا تغییراتی را نشان میدهد.
450
00:17:36,799 –> 00:17:37,679
نوار
451
00:17:37,679 –> 00:17:39,840
بنابراین چیزی است که شما باید تولید کنید
452
00:17:39,840 –> 00:17:41,120
اکنون
453
00:17:41,120 –> 00:17:41,919
454
00:17:41,919 –> 00:17:43,760
هر یک از متغیرهای دیگر را بررسی کنید
455
00:17:43,760 –> 00:17:46,480
متغیر اول کیفیت یکسانی
456
00:17:46,480 –> 00:17:48,160
خواهد داشت و همه متغیرهای دیگر
457
00:17:48,160 –> 00:17:50,640
در مقابل آن در محور y رسم میشوند تا
458
00:17:50,640 –> 00:17:52,799
بررسی کنید که کجا کیفیت بالا است در کجا
459
00:17:52,799 –> 00:17:54,880
کیفیت پایین است. شما ایده خوبی
460
00:17:54,880 –> 00:17:56,799
در مورد هر یک از این متغیرها دارید و
461
00:17:56,799 –> 00:17:59,200
اینکه چگونه کیفیت شراب
462
00:17:59,200 –> 00:18:02,080
به هر متغیر متصل می شود،
463
00:18:02,080 –> 00:18:04,799
اکنون اگر این را دارید، یک
464
00:18:04,799 –> 00:18:07,840
راه بسیار سریع برای ترسیم همه
465
00:18:07,840 –> 00:18:10,640
متغیرها در برابر یکدیگر به شما نشان خواهم داد و آن
466
00:18:10,640 –> 00:18:13,679
چیزی نیست جز پراکندگی شما. نمودار و
467
00:18:13,679 –> 00:18:15,840
هیستوگرام شما،
468
00:18:15,840 –> 00:18:18,160
مانند هیستوگرامای که در
469
00:18:18,160 –> 00:18:19,520
470
00:18:19,520 –> 00:18:21,840
اینجا ترسیم کردهایم، اکنون آن را برای
471
00:18:21,840 –> 00:18:25,919
هر متغیر ترسیم میکنیم، بنابراین جفت نقطه sns
472
00:18:25,919 –> 00:18:28,960
فقط یک دستور ساده را ترسیم کنید و اگر
473
00:18:28,960 –> 00:18:32,559
این برد را اجرا کنم شما نموداری را مشاهده خواهید کرد که
474
00:18:32,559 –> 00:18:36,799
اساساً برای هر متغیر است
475
00:18:36,799 –> 00:18:39,200
و در حین ترسیم، اجازه دهید یک
476
00:18:39,200 –> 00:18:42,840
جرعه از روزم را
477
00:18:44,720 –> 00:18:46,320
خوب
478
00:18:46,320 –> 00:18:47,760
بنوشم، بله، این بهترین چیز است که
479
00:18:47,760 –> 00:18:51,760
گاهی اوقات وقتی کد شما در
480
00:18:51,760 –> 00:18:54,160
حال اجرا است، کد شما برای شما اجرا
481
00:18:54,160 –> 00:18:56,320
می شود. در واقع یک جرعه از
482
00:18:56,320 –> 00:18:59,200
قهوه یا چای خود را بنوشید، مثل اینکه
483
00:18:59,200 –> 00:19:00,160
484
00:19:00,160 –> 00:19:02,240
من بخشی از این جهان هستم که
485
00:19:02,240 –> 00:19:04,480
می دانید در هند این چای را می خورید،
486
00:19:04,480 –> 00:19:06,480
اما اگر در آنجا نشسته اید، بیایید بگوییم
487
00:19:06,480 –> 00:19:08,640
کجا قهوه معروف تر از لذت بردن است.
488
00:19:08,640 –> 00:19:10,000
قهوه شما
489
00:19:10,000 –> 00:19:13,120
در حالی که این کد در حال اجرا است،
490
00:19:16,240 –> 00:19:18,320
بنابراین می توانید ببینید که در حال انجام پردازش های زیادی در
491
00:19:18,320 –> 00:19:20,160
آنجاست
492
00:19:20,160 –> 00:19:21,679
و
493
00:19:21,679 –> 00:19:24,000
امیدوارم به زودی خروجی را ارائه دهد
494
00:19:24,000 –> 00:19:26,240
تا جرعه دوم من تمام شود،
495
00:19:26,240 –> 00:19:28,720
بیایید ببینیم آیا می تواند تولید کند یا نه،
496
00:19:28,720 –> 00:19:31,039
بنابراین بستگی به
497
00:19:31,039 –> 00:19:33,440
چیز دیگری مانند مقدار زیادی دارد.
498
00:19:33,440 –> 00:19:35,600
چیزهای مختلف مانند اتصال اینترنت لپ تاپ شما
499
00:19:35,600 –> 00:19:36,880
500
00:19:36,880 –> 00:19:39,200
و واضح است که داده ها چقدر بزرگ است
501
00:19:39,200 –> 00:19:41,360
و ظرفیتی که روی آن کار می
502
00:19:41,360 –> 00:19:43,200
کنید اینقدر ظرفیت فکر می کنم
503
00:19:43,200 –> 00:19:44,880
مشکلی نیست، بنابراین اکنون
504
00:19:44,880 –> 00:19:46,480
خروجی را دارید همانطور که می بینید
505
00:19:46,480 –> 00:19:48,799
چقدر خروجی پیچیده و بزرگ است. بی است
506
00:19:48,799 –> 00:19:52,160
ng در اینجا تنها با یک دستور ساده تولید میشود،
507
00:19:52,160 –> 00:19:53,919
بنابراین میتوانید ببینید که بسیاری از چیزها از
508
00:19:53,919 –> 00:19:55,440
بین
509
00:19:55,440 –> 00:19:57,600
رفتهاند و اساساً در قسمت پشتی کار میکنند
510
00:19:57,600 –> 00:20:00,799
و میتوانید ببینید که هر متغیر به
511
00:20:00,799 –> 00:20:03,760
صورت مقطعی با اینجا است و
512
00:20:03,760 –> 00:20:05,280
نمودار پراکندگی اساساً نشان میدهد که کجا وجود دارد.
513
00:20:05,280 –> 00:20:07,360
همبستگی مثبت
514
00:20:07,360 –> 00:20:10,000
مانند هیچ همبستگی نیست، بنابراین
515
00:20:10,000 –> 00:20:11,840
مانند نموداری است که در آن می توانید
516
00:20:11,840 –> 00:20:14,320
ساعت ها به طور مشابه مشاهدات خود را بنویسید.
517
00:20:14,320 –> 00:20:17,440
518
00:20:17,440 –> 00:20:20,960
519
00:20:20,960 –> 00:20:23,679
520
00:20:23,679 –> 00:20:25,919
521
00:20:25,919 –> 00:20:27,919
این کار
522
00:20:27,919 –> 00:20:30,559
را فقط با استفاده از یک فرمان تکی انجام دهید،
523
00:20:30,559 –> 00:20:31,520
524
00:20:31,520 –> 00:20:34,159
حالا آنچه که میخواهیم انجام دهیم
525
00:20:34,159 –> 00:20:36,720
همبستگی است، بنابراین میخواهیم
526
00:20:36,720 –> 00:20:40,000
همبستگی هر متغیر را بررسی کنیم،
527
00:20:41,200 –> 00:20:42,799
بنابراین با
528
00:20:42,799 –> 00:20:45,520
یک دستور ساده
529
00:20:45,520 –> 00:20:47,760
wine dot cor،
530
00:20:47,760 –> 00:20:49,840
بنابراین کاری که دوباره انجام میدهد،
531
00:20:49,840 –> 00:20:52,400
برای هر یک همبستگی ایجاد میکند. و هر متغیر
532
00:20:52,400 –> 00:20:54,400
و این اساساً به شما کمک می کند تا
533
00:20:54,400 –> 00:20:55,679
بفهمید که آیا یک
534
00:20:55,679 –> 00:20:57,840
همبستگی منفی مانند
535
00:20:57,840 –> 00:21:00,559
اسیدیته ثابت و اکسید گوگرد کل وجود دارد یا
536
00:21:00,559 –> 00:21:02,720
یک رابطه مثبت وجود دارد. همبستگی مانند این یکی
537
00:21:02,720 –> 00:21:03,840
538
00:21:03,840 –> 00:21:07,280
دی اکسید گوگرد بسیار بالا و دی اکسید گوگرد کل
539
00:21:07,280 –> 00:21:11,039
یک همبستگی بسیار بسیار بالا است، اما
540
00:21:11,039 –> 00:21:12,960
گاهی اوقات تفسیر این مقادیر بسیار
541
00:21:12,960 –> 00:21:15,360
دشوار است،
542
00:21:15,360 –> 00:21:17,280
زیرا شما باید یک به یک به سمت
543
00:21:17,280 –> 00:21:18,720
هر عدد بروید
544
00:21:18,720 –> 00:21:21,600
در یک حالت بهتر این است
545
00:21:21,600 –> 00:21:24,400
که بدانید آن را ترسیم کنید. به عنوان یک نقشه حرارتی درست است،
546
00:21:24,400 –> 00:21:26,799
بنابراین دوباره فرض کنید که یک شکل دیگر ایجاد می کنیم
547
00:21:26,799 –> 00:21:30,240
و یک شکل بزرگ به طوری که اندازه ثابت
548
00:21:30,240 –> 00:21:32,000
برابر با
549
00:21:32,000 –> 00:21:35,760
15 کاما 10 است
550
00:21:36,240 –> 00:21:40,320
و یک نقشه حرارتی با استفاده از sns ایجاد می کنیم،
551
00:21:40,320 –> 00:21:42,080
بنابراین نقشه حرارتی
552
00:21:42,080 –> 00:21:45,039
به سادگی می گوییم y dot cor
553
00:21:45,039 –> 00:21:46,000
و
554
00:21:46,000 –> 00:21:48,320
c map برابر است با
555
00:21:48,320 –> 00:21:51,360
co 1
556
00:21:52,720 –> 00:21:56,000
و اکنون این طرح را تولید می کند،
557
00:21:56,000 –> 00:21:57,280
558
00:21:57,280 –> 00:21:59,840
بنابراین
559
00:22:01,039 –> 00:22:04,000
این طرح اساساً این چیز مشابه را به شما می گوید،
560
00:22:04,000 –> 00:22:06,799
به عنوان مثال
561
00:22:06,799 –> 00:22:08,799
همبستگی آن در اینجا همبستگی مثبت است،
562
00:22:08,799 –> 00:22:10,240
563
00:22:10,240 –> 00:22:12,080
متأسفم این همبستگی منفی است
564
00:22:12,080 –> 00:22:14,240
و این همبستگی مثبت است
565
00:22:14,240 –> 00:22:16,240
و بالاترین همبستگی مثبت در
566
00:22:16,240 –> 00:22:18,880
اینجا است. همانطور که ما
567
00:22:18,880 –> 00:22:21,280
با اکسید گوگرد آزاد و اکسید گوگرد کل
568
00:22:21,280 –> 00:22:23,440
به طور مشابه اکسید گوگرد کل را
569
00:22:23,440 –> 00:22:26,000
در اینجا و سه تجربه کرده بودیم، بنابراین مانند
570
00:22:26,000 –> 00:22:26,799
571
00:22:26,799 –> 00:22:29,120
دوم است که این یک همبستگی مثبت
572
00:22:29,120 –> 00:22:30,720
است. یک همبستگی مثبت است
573
00:22:30,720 –> 00:22:33,039
این برای یک مقدار همبستگی مثبت
574
00:22:33,039 –> 00:22:35,520
و این دو
575
00:22:35,520 –> 00:22:37,760
چگالی آبی و الکل است
576
00:22:37,760 –> 00:22:39,039
و
577
00:22:39,039 –> 00:22:41,440
در اینجا شما یک همبستگی منفی
578
00:22:41,440 –> 00:22:44,000
قوی خوب می
579
00:22:44,000 –> 00:22:46,320
580
00:22:46,320 –> 00:22:48,080
بینید، بنابراین آنچه که
581
00:22:48,080 –> 00:22:50,000
ما به طور کلی انجام می دهیم این است
582
00:22:50,000 –> 00:22:52,159
که اگر یک مقدار بسیار همبسته وجود داشته
583
00:22:52,159 –> 00:22:54,799
باشد که تمایل دارد بر مدل ما اساساً تأثیر بگذارد.
584
00:22:54,799 –> 00:22:57,760
آن را حذف کنید، اگر می
585
00:22:57,760 –> 00:22:59,120
خواهید
586
00:22:59,120 –> 00:23:02,480
یکی خاص را حذف کنید چه می شود، مثلاً
587
00:23:02,480 –> 00:23:05,039
بگوییم که این یکی را می بینیم که 0.72 بالا است
588
00:23:05,039 –> 00:23:07,200
589
00:23:07,200 –> 00:23:10,559
و دیگری
590
00:23:10,559 –> 00:23:12,400
اساساً منفی است که
591
00:23:12,400 –> 00:23:16,320
چگالی الکل و بله چگالی الکل است،
592
00:23:16,320 –> 00:23:19,520
بنابراین شما در اینجا الکل دارید
593
00:23:19,520 –> 00:23:22,640
و چگالی اینجا منهای. 0.68 بنابراین فرض
594
00:23:22,640 –> 00:23:25,120
کنید هر چیزی را حذف می کنیم که
595
00:23:25,120 –> 00:23:26,320
72
596
00:23:26,320 –> 00:23:29,600
مانند بیش از 0.7 باشد، بنابراین در آن صورت
597
00:23:29,600 –> 00:23:33,440
ما اساسا دستور drop ساده خود را می نویسیم و
598
00:23:33,440 –> 00:23:35,039
599
00:23:35,039 –> 00:23:37,679
می خواهیم
600
00:23:37,679 –> 00:23:40,400
کل دی اکسید گوگرد را حذف
601
00:23:40,400 –> 00:23:44,240
کنیم، بنابراین می گوییم که شراب زیر خط جدید است و
602
00:23:44,240 –> 00:23:46,960
نقطه شراب افت می کند
603
00:23:46,960 –> 00:23:49,120
چه کار می کنیم. میخواهم
604
00:23:49,120 –> 00:23:51,840
دیاکسید گوگرد
605
00:23:53,840 –> 00:23:57,039
کل را کاهش دهم، بنابراین کل دیاکسید
606
00:23:58,400 –> 00:24:00,080
گوگرد
607
00:24:00,080 –> 00:24:03,080
608
00:24:04,000 –> 00:24:07,760
، فرض کنیم دسترسی برابر با یک است،
609
00:24:10,000 –> 00:24:13,840
بنابراین ما این خط را
610
00:24:13,840 –> 00:24:15,760
زیر علامت نقطه جدید
611
00:24:15,760 –> 00:24:16,880
612
00:24:16,880 –> 00:24:19,520
اضافه میکنیم و
613
00:24:19,520 –> 00:24:22,000
اکنون su دی اکسید گوگرد همانطور که می بینید
614
00:24:22,000 –> 00:24:25,039
شما فقط اکسید گوگرد آزاد دارید اما
615
00:24:25,039 –> 00:24:28,480
کل دی اکسید گوگرد
616
00:24:29,360 –> 00:24:32,720
را ندارید کار دیگری که ممکن است بخواهیم انجام دهیم این است
617
00:24:32,720 –> 00:24:35,200
که شراب سفید و قرمز را به
618
00:24:35,200 –> 00:24:37,039
صفر و یک متغیر طبقه بندی کنیم تا
619
00:24:37,039 –> 00:24:41,039
بتوان از آن در مدل استفاده کرد.
620
00:24:41,039 –> 00:24:42,960
ما اکنون یک مجموعه داده زمردی ایجاد می کنیم
621
00:24:42,960 –> 00:24:45,120
تا زیر خط شراب ml و می
622
00:24:45,120 –> 00:24:49,760
گوییم با استفاده از پانداها pd dot dummies
623
00:24:49,760 –> 00:24:53,360
بگیرید بنابراین زیرخط dummies را
624
00:24:53,360 –> 00:24:55,279
بگیرید و در اینجا
625
00:24:55,279 –> 00:24:57,279
نام مجموعه داده را ارسال می کنیم
626
00:24:57,279 –> 00:24:58,840
underscore wine
627
00:24:58,840 –> 00:25:02,400
new و drop underscore
628
00:25:02,400 –> 00:25:04,480
اول برابر است با
629
00:25:04,480 –> 00:25:06,799
true
630
00:25:06,799 –> 00:25:08,880
پس این کار اساساً
631
00:25:08,880 –> 00:25:11,120
این مجموعه داده ها را تبدیل می کند
632
00:25:11,120 –> 00:25:15,279
تا زیر خط شراب میلی لیتر سر نقطه
633
00:25:15,279 –> 00:25:16,960
اکنون
634
00:25:16,960 –> 00:25:18,799
همه چیز
635
00:25:18,799 –> 00:25:19,919
درست است
636
00:25:19,919 –> 00:25:20,720
و
637
00:25:20,720 –> 00:25:23,520
ستون نوع اکنون به نوع سفید تغییر می کند
638
00:25:23,520 –> 00:25:25,919
اگر سفید است یک در غیر این صورت
639
00:25:25,919 –> 00:25:28,240
اگر قرمز باشد آنگاه صفر خواهد شد و این
640
00:25:28,240 –> 00:25:30,480
دلیل اینکه نمی خواهیم
641
00:25:30,480 –> 00:25:32,400
متغیر دیگری مانند
642
00:25:32,400 –> 00:25:34,240
underscore درست باشد زیرا اساساً
643
00:25:34,240 –> 00:25:35,840
همان اطلاعات مخالف را نشان می دهد،
644
00:25:35,840 –> 00:25:37,760
با این حال تمام اطلاعاتی که شما
645
00:25:37,760 –> 00:25:39,919
نیاز دارید در اینجا در خود یک ستون وجود
646
00:25:39,919 –> 00:25:42,919
دارد.
647
00:25:44,320 –> 00:25:47,679
خیلی خوب، پس وقتی این
648
00:25:47,679 –> 00:25:49,760
را داشتیم،
649
00:25:49,760 –> 00:25:53,120
کاری که ممکن است بخواهیم انجام دهیم این است که
650
00:25:53,120 –> 00:25:56,559
دوباره بررسی کنید که آیا هنوز
651
00:25:56,559 –> 00:25:58,720
هیچ um
652
00:25:58,720 –> 00:26:01,840
null دارد یا خیر، بنابراین خط ml
653
00:26:01,840 –> 00:26:04,559
نقطه مجموع نقطه صفر است، در غیر این صورت
654
00:26:04,559 –> 00:26:07,440
می دانید که ممکن است به ما خطا بدهد،
655
00:26:07,440 –> 00:26:09,440
بسیار خوب است. بنابراین این بدان معناست که ما واقعاً نباید
656
00:26:09,440 –> 00:26:12,240
نگران این باشیم که
657
00:26:12,240 –> 00:26:13,919
اکنون مورد بعدی این است
658
00:26:13,919 –> 00:26:16,080
که برای این متغیر کیفیتی که
659
00:26:16,080 –> 00:26:19,360
در اینجا میبینید، این چیزی است که
660
00:26:19,360 –> 00:26:20,320
اگر
661
00:26:20,320 –> 00:26:22,799
فرض کنیم تصمیم بگیریم طبقهبندی
662
00:26:22,799 –> 00:26:25,279
هر چیزی بالاتر از پنج خوب است هر چیزی
663
00:26:25,279 –> 00:26:28,720
بالاتر از پنج است. بد است یا اگر
664
00:26:28,720 –> 00:26:31,760
کمی بالاتر بروید مانند هر چیزی بزرگتر
665
00:26:31,760 –> 00:26:34,240
از هشت خوب است یا هر چیزی بزرگتر
666
00:26:34,240 –> 00:26:37,200
از هفت خوب است زیر هفت
667
00:26:37,200 –> 00:26:39,440
خوب نیست بنابراین این چیزی است که ما باید کدگذاری کنیم
668
00:26:39,440 –> 00:26:42,799
بنابراین در اینجا با کمک این دستور
669
00:26:42,799 –> 00:26:45,679
آنچه من ایجاد می کنم اساساً یک 5 است.
670
00:26:45,679 –> 00:26:47,120
در اینجا متغیر است،
671
00:26:47,120 –> 00:26:50,720
بنابراین می گوییم زیر خط شراب میلی لیتر
672
00:26:50,720 –> 00:26:53,520
و کیفیت
673
00:26:53,520 –> 00:26:55,600
داریم و از
674
00:26:55,600 –> 00:26:57,200
تابع اعمال استفاده می کنیم که در آن
675
00:26:57,200 –> 00:27:00,159
از لامبدا برای تبدیل سریع
676
00:27:00,159 –> 00:27:01,760
آن استفاده می کنیم و می گوییم
677
00:27:01,760 –> 00:27:04,799
uh y کولون
678
00:27:04,799 –> 00:27:07,520
و 1 به این معنی است که در
679
00:27:07,520 –> 00:27:10,240
صورت این مقدار کد شده است.
680
00:27:10,240 –> 00:27:13,360
e بزرگتر از 7
681
00:27:13,360 –> 00:27:14,960
درست است، بنابراین
682
00:27:14,960 –> 00:27:17,520
y چیزی نیست جز کیفیت کیفیت
683
00:27:17,520 –> 00:27:19,600
به y منتقل شده است، به این
684
00:27:19,600 –> 00:27:21,760
معنی که در اینجا
685
00:27:21,760 –> 00:27:23,919
آن را طوری تفسیر کنید یا بخوانید که
686
00:27:23,919 –> 00:27:26,720
اگر کیفیت بزرگتر از 7 است،
687
00:27:26,720 –> 00:27:29,520
آنگاه 1 خواهد بود،
688
00:27:29,520 –> 00:27:31,360
این دیگر
689
00:27:31,360 –> 00:27:35,200
0 ساده است، درست است، بنابراین
690
00:27:35,200 –> 00:27:38,080
اگر من فقط ادامه دهم و
691
00:27:38,080 –> 00:27:41,200
بعداً آن را چاپ کنید تا ببینید که
692
00:27:41,200 –> 00:27:44,080
مقادیر y اکنون یک یا صفر هستند،
693
00:27:44,080 –> 00:27:46,720
بنابراین هنگامی که این کار را انجام دادیم،
694
00:27:46,720 –> 00:27:49,039
آنچه احتمالاً
695
00:27:49,039 –> 00:27:51,600
لازم است انجام دهیم این است که می بینید مقدار اسیدیته ثابت
696
00:27:51,600 –> 00:27:53,520
697
00:27:53,520 –> 00:27:55,679
وقتی شما را مقایسه می کند بسیار بالا است.
698
00:27:55,679 –> 00:27:57,840
آن را با اسیدیته فرار مقایسه کنید،
699
00:27:57,840 –> 00:28:00,559
حتی زمانی که آن را با مقادیر اعشاری مقایسه می کنید، مقدار قند بالا است،
700
00:28:00,559 –> 00:28:02,880
701
00:28:02,880 –> 00:28:05,200
بنابراین ممکن است لازم باشد این مجموعه داده را استاندارد
702
00:28:05,200 –> 00:28:07,520
کنیم تا این مقادیر بالا
703
00:28:07,520 –> 00:28:08,799
مانند این یکی
704
00:28:08,799 –> 00:28:10,720
یا مانند الکل
705
00:28:10,720 –> 00:28:14,080
یا دی اکسید اساساً
706
00:28:14,080 –> 00:28:16,640
بر روی مدل تأثیر نگذارند.
707
00:28:16,640 –> 00:28:18,399
راهی که میخواهیم انجام دهیم این است که
708
00:28:18,399 –> 00:28:21,360
از اسکالر استاندارد استفاده میکنیم، بنابراین از
709
00:28:21,360 –> 00:28:22,799
710
00:28:22,799 –> 00:28:24,559
711
00:28:24,559 –> 00:28:26,960
پیش پردازش نقطهای sklearn sk،
712
00:28:26,960 –> 00:28:30,480
ما اسکالر استاندارد را وارد
713
00:28:30,480 –> 00:28:32,000
714
00:28:32,000 –> 00:28:33,039
715
00:28:33,039 –> 00:28:34,480
میکنیم، بنابراین ما بعد از آن میخواهیم
716
00:28:34,480 –> 00:28:37,360
استاندارد اسکالر استاندارد را مقداردهی اولیه
717
00:28:37,360 –> 00:28:38,880
718
00:28:38,880 –> 00:28:41,360
کنیم. من باید یک شی را با
719
00:28:41,360 –> 00:28:42,880
مقداردهی اولیه آن به صورت
720
00:28:42,880 –> 00:28:45,440
اسکالر استاندارد
721
00:28:45,440 –> 00:28:48,159
بسازیم و بعد از آن ما
722
00:28:48,159 –> 00:28:52,080
اسکالر نقطه فیت را برازش می کنیم، بنابراین باید متغیر x را
723