در این مطلب، ویدئو یادگیری ماشین با Scikit Learn رمزگشایی | پایتون برای یادگیری ماشین | ادورکا | ML Live – 1 با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:34:58
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:06,799 –> 00:00:08,559
سلام به همه شما به این جلسه وبینار خوش آمدید
2
00:00:08,559 –> 00:00:10,400
3
00:00:10,400 –> 00:00:11,759
نام من kalyan است و اهل ادینبورگ هستم
4
00:00:11,759 –> 00:00:13,519
و مدت زیادی است که با
5
00:00:13,519 –> 00:00:16,079
eduraka در ارتباط هستم و
6
00:00:16,079 –> 00:00:18,160
موضوع وبینار یادگیری ماشینی
7
00:00:18,160 –> 00:00:20,480
با رمزگشایی scikit-learn است، بنابراین ما
8
00:00:20,480 –> 00:00:21,920
سعی خواهیم کرد برای اینکه بفهمیم یادگیری ماشین
9
00:00:21,920 –> 00:00:23,039
چیست، سعی می کنیم بفهمیم که
10
00:00:23,039 –> 00:00:24,800
Sikit-Learn چیست، ما به سرعت به سراغ آموزش عملی می رویم،
11
00:00:24,800 –> 00:00:27,119
بنابراین دستور
12
00:00:27,119 –> 00:00:28,640
جلسه امروز،
13
00:00:28,640 –> 00:00:30,880
مقدمه ای برای
14
00:00:30,880 –> 00:00:33,040
نصب Sikit-Learn از Sikit-learn است. رگرسیون
15
00:00:33,040 –> 00:00:35,600
و طبقهبندی svm و knn و
16
00:00:35,600 –> 00:00:37,120
عملی خوب،
17
00:00:37,120 –> 00:00:38,320
بیایید سعی کنیم بفهمیم
18
00:00:38,320 –> 00:00:40,079
یادگیری ماشین چیست، بنابراین وقتی میگویم
19
00:00:40,079 –> 00:00:42,239
یادگیری ماشین دقیقاً چیست یادگیری ماشین
20
00:00:42,239 –> 00:00:44,559
خوب است، بنابراین اگر باید از شما
21
00:00:44,559 –> 00:00:46,800
بپرسم یادگیری ماشین چیست، میتوانم
22
00:00:46,800 –> 00:00:49,440
این را به عنوان زیرمجموعهای تعریف کنم بین من می توانم
23
00:00:49,440 –> 00:00:50,960
این را به عنوان زیرمجموعه ای از هوش مصنوعی تعریف کنم، بسیار
24
00:00:50,960 –> 00:00:54,480
خوب است و این
25
00:00:54,480 –> 00:00:57,360
نوعی تکنیک است که با آن
26
00:00:57,360 –> 00:01:00,559
برنامه ها خوب هستند، برنامه هایی که
27
00:01:00,559 –> 00:01:03,280
در حال نوشتن هستند به طور خودکار
28
00:01:03,280 –> 00:01:05,760
قادر به تجزیه و تحلیل خواهند بود. داده های ما
29
00:01:05,760 –> 00:01:09,520
و ایجاد نوعی تابع که
30
00:01:09,520 –> 00:01:11,920
با کمک آن
31
00:01:11,920 –> 00:01:14,799
بتوانیم نوعی پیش بینی
32
00:01:14,799 –> 00:01:16,320
درست کنیم، بنابراین
33
00:01:16,320 –> 00:01:18,880
یادگیری به طور خودکار از مجموعه داده ها اتفاق می افتد،
34
00:01:18,880 –> 00:01:21,280
بنابراین وقتی می گویم این یک
35
00:01:21,280 –> 00:01:24,080
تکنیک یادگیری ماشینی است ذاتاً
36
00:01:24,080 –> 00:01:26,560
باید یک تجارت خاص وجود داشته باشد.
37
00:01:26,560 –> 00:01:28,720
مشکلی است که ما در حال تلاش برای حل آن هستیم
38
00:01:28,720 –> 00:01:31,280
و با آن
39
00:01:31,280 –> 00:01:33,920
مشکل تجاری خاص، مجموعه داده خاصی خواهیم داشت
40
00:01:33,920 –> 00:01:35,040
،
41
00:01:35,040 –> 00:01:37,280
بنابراین وقتی می گویم یادگیری ماشین همانطور
42
00:01:37,280 –> 00:01:38,799
که قبلاً گفتم باید یک
43
00:01:38,799 –> 00:01:40,880
مشکل تجاری به آن
44
00:01:40,880 –> 00:01:42,399
مشکل تجاری مرتبط باشد، وجود دارد. یک
45
00:01:42,399 –> 00:01:45,040
مجموعه داده خاص است که با کمک
46
00:01:45,040 –> 00:01:47,119
آن دستگاه سعی می کند یاد بگیرد
47
00:01:47,119 –> 00:01:49,439
خوب است، بنابراین وقتی دستگاه در حال تلاش برای
48
00:01:49,439 –> 00:01:50,880
یادگیری است، فرض کنید می تواند هر
49
00:01:50,880 –> 00:01:54,000
چیزی مربوط به علل
50
00:01:54,000 –> 00:01:56,320
حمله قلبی برای طیف خاصی از افراد
51
00:01:56,320 –> 00:01:58,479
باشد. یک نوع سابقه پزشکی
52
00:01:58,479 –> 00:02:00,320
ضمیمه شده
53
00:02:00,320 –> 00:02:02,719
باشد که پارامترهای وابسته خاصی وجود خواهد داشت که
54
00:02:02,719 –> 00:02:05,040
منجر به حمله صدمه می شود و ما
55
00:02:05,040 –> 00:02:07,360
نوعی مجموعه داده خواهیم داشت که به
56
00:02:07,360 –> 00:02:09,360
شما می گوید سناریوهایی با
57
00:02:09,360 –> 00:02:11,360
کمک متغیرهایی که یک فرد خاص
58
00:02:11,360 –> 00:02:13,440
دچار حمله قلبی میشود یا
59
00:02:13,440 –> 00:02:15,520
او دچار حمله قلبی نمیشود خوب است،
60
00:02:15,520 –> 00:02:17,120
بنابراین میتواند مجموعه داده خاصی باشد
61
00:02:17,120 –> 00:02:20,319
که دستگاه ما سعی میکند
62
00:02:20,319 –> 00:02:22,800
یاد بگیرد و سعی میکند الگو را تجزیه و تحلیل کند.
63
00:02:22,800 –> 00:02:25,040
این چیز خاص این است که این
64
00:02:25,040 –> 00:02:26,400
یادگیری خاص همان چیزی است که شما آن را به عنوان
65
00:02:26,400 –> 00:02:28,800
آموزش آن مدل خاص می نامید، بنابراین
66
00:02:28,800 –> 00:02:31,440
مدل به طور ضمنی سعی می کند بر روی این
67
00:02:31,440 –> 00:02:34,000
داده های خاص آموزش دهد و سعی می
68
00:02:34,000 –> 00:02:36,000
کند رابطه بین دلایلی را
69
00:02:36,000 –> 00:02:38,160
که منجر به حمله قلبی می شود
70
00:02:38,160 –> 00:02:40,640
درک کند و برخی از آنها را ایجاد می کند. نوع تابعی که
71
00:02:40,640 –> 00:02:43,120
با کمک آن میتوانید
72
00:02:43,120 –> 00:02:45,599
نمونههای خاصی را در آینده پیشبینی کنید،
73
00:02:45,599 –> 00:02:48,319
این از نظر فنی کاری است که
74
00:02:48,319 –> 00:02:50,720
یادگیری ماشین انجام میدهد، این زیرمجموعهای
75
00:02:50,720 –> 00:02:53,760
از ai است، بنابراین ai است که میتوانید ai
76
00:02:53,760 –> 00:02:55,760
را زیرمجموعه بزرگتری در نظر بگیرید
77
00:02:55,760 –> 00:02:58,000
و در داخل آن
78
00:02:58,000 –> 00:02:59,440
علم داده خواهید داشت و یادگیری ماشینی خواهید داشت،
79
00:02:59,440 –> 00:03:01,840
بنابراین اساساً یادگیری ماشینی
80
00:03:01,840 –> 00:03:04,879
استفاده از تکنیک آماری
81
00:03:04,879 –> 00:03:07,760
برای یک مشکل تجاری
82
00:03:07,760 –> 00:03:10,000
خاص خوب است. با کمک آنها می توانیم
83
00:03:10,000 –> 00:03:13,200
الگوهایی را تجزیه و تحلیل کنیم که می
84
00:03:13,200 –> 00:03:16,560
توانیم پیش بینی کنیم،
85
00:03:16,560 –> 00:03:19,040
حالا انواع اساسی
86
00:03:19,040 –> 00:03:20,000
یادگیری
87
00:03:20,000 –> 00:03:22,400
ماشین چیست، سه نوع تکنیک اساسی یادگیری ماشین وجود دارد
88
00:03:22,400 –> 00:03:24,720
که ما خوب
89
00:03:24,720 –> 00:03:27,280
داریم، نظارت کرده ایم، بدون نظارت و
90
00:03:27,280 –> 00:03:29,440
ما یادگیری تقویتی داریم،
91
00:03:29,440 –> 00:03:32,319
من بیشتر بر یادگیری نظارت شده تمرکز می
92
00:03:32,319 –> 00:03:34,799
کنم، این همان موضوعی است که می خواهیم به آن بپردازیم،
93
00:03:34,799 –> 00:03:37,760
بسیار خوب است،
94
00:03:37,760 –> 00:03:39,519
تکنیک های یادگیری ماشینی بدون نظارت نیز
95
00:03:39,519 –> 00:03:41,360
وجود دارد و همچنین یادگیری تقویتی وجود
96
00:03:41,360 –> 00:03:42,959
دارد تا مثال بسیار خوبی از یادگیری تقویتی یک ماشین بدون راننده را به شما ارائه دهم.
97
00:03:42,959 –> 00:03:45,120
98
00:03:45,120 –> 00:03:46,720
نمونهای از یادگیری تقویتی است،
99
00:03:46,720 –> 00:03:48,239
من وارد
100
00:03:48,239 –> 00:03:49,440
جزئیات آن
101
00:03:49,440 –> 00:03:51,200
نمیشوم، اگر مجبور باشم در مورد یادگیری بدون نظارت
102
00:03:51,200 –> 00:03:53,439
صحبت کنم، فرض کنید میخواهید
103
00:03:53,439 –> 00:03:56,159
گروهی از افراد را بر اساس رفتار خرجکردهشان دستهبندی کنید، در
104
00:03:56,159 –> 00:03:58,080
این صورت ممکن است
105
00:03:58,080 –> 00:04:00,720
تحت آموزش نظارتشده قرار گیرد. می تواند
106
00:04:00,720 –> 00:04:02,480
یک متأسفانه بدون نظارت باشد چه می تواند
107
00:04:02,480 –> 00:04:04,799
بسیار متأسفانه یادگیری بدون نظارت باشد
108
00:04:04,799 –> 00:04:06,000
، فرض کنید می خواهید گروهی را خوشه بندی کنید
109
00:04:06,000 –> 00:04:07,680
از افراد بر اساس عادات غذایی
110
00:04:07,680 –> 00:04:09,439
یا کمتر بر اساس عادات خرج کردن،
111
00:04:09,439 –> 00:04:10,720
112
00:04:10,720 –> 00:04:13,760
یادگیری تحت نظارت میتواند چیزی باشد که
113
00:04:13,760 –> 00:04:15,280
در آن ممکن است فرض کنید میخواهید
114
00:04:15,280 –> 00:04:18,160
پیشبینی کنید
115
00:04:18,160 –> 00:04:20,399
دمای هوا برای فردا خوب است یا اینکه آیا
116
00:04:20,399 –> 00:04:22,079
میخواهید پیشبینی کنید که آیا یک
117
00:04:22,079 –> 00:04:24,720
فرد خاص ممکن است یک
118
00:04:24,720 –> 00:04:27,120
بیماری قلبی داشته باشد یا مشکلی نداشته باشد، بنابراین
119
00:04:27,120 –> 00:04:29,840
این سه نوع اصلی از
120
00:04:29,840 –> 00:04:32,000
تکنیک های یادگیری ماشینی است که ما خوب داریم و وقتی
121
00:04:32,000 –> 00:04:34,320
می گویم یادگیری با نظارت و یادگیری بدون نظارت،
122
00:04:34,320 –> 00:04:36,479
بنابراین
123
00:04:36,479 –> 00:04:38,720
این تکنیک خاص
124
00:04:38,720 –> 00:04:42,400
از اطلاعاتی
125
00:04:42,400 –> 00:04:45,600
که مجموعه داده ها نشات می گیرد. ما ماهیت نظارتی خواهیم داشت،
126
00:04:45,600 –> 00:04:47,600
127
00:04:47,600 –> 00:04:49,919
بنابراین وقتی می گویم این یک داده تحت نظارت است
128
00:04:49,919 –> 00:04:52,479
دقیقاً منظورم چیست،
129
00:04:52,479 –> 00:04:54,639
اجازه دهید یک مثال به شما بزنم
130
00:04:54,639 –> 00:04:57,520
فقط یک لحظه صبر کنید اجازه دهید
131
00:04:57,520 –> 00:04:59,280
مجموعه داده خاصی را برای شما باز کنم که
132
00:04:59,280 –> 00:05:01,520
به شما کمک می کند
133
00:05:01,520 –> 00:05:03,759
بیشتر در مورد این نظارت شده بدانید و
134
00:05:03,759 –> 00:05:05,360
135
00:05:05,360 –> 00:05:08,800
نمونه های بدون نظارت فقط برای مدتی نگه دارید،
136
00:05:08,800 –> 00:05:11,199
من یک فایل اکسل را برای شما باز کرده ام،
137
00:05:11,199 –> 00:05:13,280
اگر می توانید ببینید که
138
00:05:13,280 –> 00:05:14,080
خوب است،
139
00:05:14,080 –> 00:05:16,639
بنابراین این همان دایره خاص است. مجموعه ای از
140
00:05:16,639 –> 00:05:19,360
صنعت مخابرات است و
141
00:05:19,360 –> 00:05:21,520
اطلاعاتی در مورد نرخ ریزش به ما می دهد،
142
00:05:21,520 –> 00:05:22,960
خوب است آیا یک شخص خاص ریزش کرده است
143
00:05:22,960 –> 00:05:25,440
یا نه، بنابراین من این متغیرها را
144
00:05:25,440 –> 00:05:27,039
145
00:05:27,039 –> 00:05:28,400
دارم حالت
146
00:05:28,400 –> 00:05:31,360
وام دهنده حساب دارم،
147
00:05:31,360 –> 00:05:34,080
شماره منطقه بین المللی
148
00:05:34,080 –> 00:05:37,440
پست صوتی و غیره را دارم.
149
00:05:37,440 –> 00:05:40,080
آنها روزانه تماس می گیرند شما می گویید متاسفم
150
00:05:40,080 –> 00:05:42,720
استفاده از داده داده مصرف روزانه استفاده ماهانه
151
00:05:42,720 –> 00:05:45,280
و همه و در نهایت
152
00:05:45,280 –> 00:05:46,400
من
153
00:05:46,400 –> 00:05:49,280
متوجه شدم که آیا مشکلی اتفاق افتاده است یا خیر
154
00:05:49,280 –> 00:05:51,360
این چیزی است که من دارم در نهایت
155
00:05:51,360 –> 00:05:52,720
اکنون
156
00:05:52,720 –> 00:05:54,960
می توانید ببینید که جان یا نادرست یا
157
00:05:54,960 –> 00:05:57,199
درست است بنابراین وقتی من وقتی شما وقتی من می گویم
158
00:05:57,199 –> 00:05:59,520
churn برابر با درست است که این اساساً
159
00:05:59,520 –> 00:06:01,520
به این معنی است که یک شخص خاص
160
00:06:01,520 –> 00:06:03,280
خوب از کار درآمده است
161
00:06:03,280 –> 00:06:05,600
و من همه این متغیرهای دیگر را
162
00:06:05,600 –> 00:06:08,240
دارم اکنون می توانم این مجموعه داده خاص را
163
00:06:08,240 –> 00:06:09,440
تحت نظارت صدا
164
00:06:09,440 –> 00:06:12,720
کنم زیرا متغیرهای خاصی دارم که
165
00:06:12,720 –> 00:06:15,039
با کمک آنها می توانم
166
00:06:15,039 –> 00:06:17,280
بفهمم که خرابی
167
00:06:17,280 –> 00:06:21,199
اتفاق افتاده است یا خیر از نظر فنی
168
00:06:21,199 –> 00:06:24,160
همه این متغیرهای برجسته شده را
169
00:06:24,160 –> 00:06:26,800
به عنوان متغیر وابسته میگویم متأسفم متغیر مستقل
170
00:06:26,800 –> 00:06:28,080
171
00:06:28,080 –> 00:06:28,880
خوب است
172
00:06:28,880 –> 00:06:31,759
و من این متغیر را متغیر مینامم. e که به رنگ قرمز به
173
00:06:31,759 –> 00:06:32,800
174
00:06:32,800 –> 00:06:36,160
عنوان متغیر هدف من است، پس چرا من
175
00:06:36,160 –> 00:06:38,240
آن را به عنوان متغیر هدف می
176
00:06:38,240 –> 00:06:39,039
177
00:06:39,039 –> 00:06:41,120
نامیم یا آن را به عنوان متغیر هدف
178
00:06:41,120 –> 00:06:43,039
یا متغیر وابسته یا وابسته می نامیم،
179
00:06:43,039 –> 00:06:46,240
دلیل آن این است که اینها عوامل خاصی هستند یا
180
00:06:46,240 –> 00:06:47,919
اینها متغیرهای خاصی هستند که ما
181
00:06:47,919 –> 00:06:49,280
داریم ثبت شده
182
00:06:49,280 –> 00:06:52,160
که منجر به یک چرخش خاص می شود، بسیار
183
00:06:52,160 –> 00:06:53,919
خوب است که منجر به a به یک
184
00:06:53,919 –> 00:06:56,479
رویداد خاص می شود که در آن انحراف
185
00:06:56,479 –> 00:06:59,599
یا رخ می دهد یا اتفاق نمی افتد، خوب
186
00:06:59,599 –> 00:07:02,240
است، به همین دلیل است که من این مجموعه داده را
187
00:07:02,240 –> 00:07:04,720
به عنوان یک مجموعه داده
188
00:07:04,720 –> 00:07:06,800
نظارت شده می نامم، بنابراین یادگیری نظارت شده، بنابراین مفهوم
189
00:07:06,800 –> 00:07:09,199
یادگیری تحت نظارت، بنابراین هر زمان
190
00:07:09,199 –> 00:07:10,800
که یک تکنیک یادگیری نظارت شده
191
00:07:10,800 –> 00:07:13,759
دارید، می توانید مطمئن
192
00:07:13,759 –> 00:07:17,680
باشید که مجموعه داده خاصی
193
00:07:17,680 –> 00:07:20,479
خواهید داشت که هم متغیر مستقل و هم
194
00:07:20,479 –> 00:07:23,120
متغیر وابسته و یا متغیر
195
00:07:23,120 –> 00:07:26,319
هدف و پاسخ
196
00:07:26,319 –> 00:07:28,560
متغیر مستقل نیز دارد. به
197
00:07:28,560 –> 00:07:30,240
عنوان
198
00:07:30,240 –> 00:07:31,919
متغیر پاسخ شما نامیده می شود
199
00:07:31,919 –> 00:07:34,319
و متغیر وابسته شما نیز
200
00:07:34,319 –> 00:07:37,680
به عنوان متغیر هدف نامیده می شود اگر من
201
00:07:37,680 –> 00:07:39,120
202
00:07:39,120 –> 00:07:42,000
این ستون خاص را حذف کنم خوب است و
203
00:07:42,000 –> 00:07:43,599
اگر این کار را داشته باشم، بیایید فرض کنیم که شما
204
00:07:43,599 –> 00:07:46,240
مجموعه داده دیگری دارید، اما در آن
205
00:07:46,240 –> 00:07:48,400
مجموعه داده خاص، نمی دانید که آیا انحراف
206
00:07:48,400 –> 00:07:50,879
اتفاق افتاده است یا خیر، بنابراین هیچ
207
00:07:50,879 –> 00:07:52,879
رویداد هدف خاصی وجود ندارد که
208
00:07:52,879 –> 00:07:55,680
در واقع شما را با مرور
209
00:07:55,680 –> 00:07:58,240
متغیرهای مستقلی که دارید هدایت کند. بسیار خوب،
210
00:07:58,240 –> 00:08:01,280
بنابراین چنین مجموعه ای از داده ها همان چیزی است که
211
00:08:01,280 –> 00:08:04,720
شما آن را به عنوان یک داده بدون نظارت در یک
212
00:08:04,720 –> 00:08:06,879
داده بدون نظارت می نامید، اکنون تنها
213
00:08:06,879 –> 00:08:08,960
چیزی که آن را به عنوان
214
00:08:08,960 –> 00:08:11,919
متغیر مستقل خود می نامید خواهید داشت اگر
215
00:08:11,919 –> 00:08:15,199
کسی از من بپرسد که چگونه یک داده بدون نظارت
216
00:08:15,199 –> 00:08:16,720
می تواند مفید باشد.
217
00:08:16,720 –> 00:08:19,199
یک داده بدون نظارت ممکن
218
00:08:19,199 –> 00:08:21,120
است نتوانید تکنیک های یادگیری تحت نظارت خود را اعمال کنید،
219
00:08:21,120 –> 00:08:23,120
اما
220
00:08:23,120 –> 00:08:25,199
قطعاً می توانید تکنیک های یادگیری بدون نظارت خود را به کار ببرید.
221
00:08:25,199 –> 00:08:27,039
222
00:08:27,039 –> 00:08:29,039
223
00:08:29,039 –> 00:08:31,759
224
00:08:31,759 –> 00:08:34,799
225
00:08:34,799 –> 00:08:36,159
فرض کنید میخواهید
226
00:08:36,159 –> 00:08:38,958
مشتریان خاصی را هدف قرار دهید که بیشتر
227
00:08:38,958 –> 00:08:42,479
از تماس صوتی در طول شب استفاده میکنند یا
228
00:08:42,479 –> 00:08:44,240
میخواهید مشتریان خاصی را هدف قرار دهید
229
00:08:44,240 –> 00:08:47,200
که اکثراً
230
00:08:47,200 –> 00:08:50,640
231
00:08:50,640 –> 00:08:53,920
در آخر هفته ها در مقایسه با روزهای هفته از داده های اینترنت استفاده می کنند یا اکثراً از آنها استفاده می کنند، بنابراین
232
00:08:53,920 –> 00:08:56,480
چنین الگوهایی می توانید
233
00:08:56,480 –> 00:09:00,320
با استفاده از این مجموعه داده های نظارت نشده دریابید که خوب است
234
00:09:00,320 –> 00:09:01,360
235
00:09:01,360 –> 00:09:03,760
و با استفاده از این مجموعه داده
236
00:09:03,760 –> 00:09:06,080
می توانید با این موضوع آشنا شوید که این
237
00:09:06,080 –> 00:09:09,200
مجموعه بدون نظارت اساس
238
00:09:09,200 –> 00:09:11,519
ماشین بدون نظارت را تشکیل می دهد. یادگیری تکنیکها
239
00:09:11,519 –> 00:09:12,800
240
00:09:12,800 –> 00:09:14,800
بسیار خوب است، بنابراین این جوهرهای است که من
241
00:09:14,800 –> 00:09:17,600
سعی کردم رانندگی کنم و این
242
00:09:17,600 –> 00:09:20,480
واقعاً به شما کمک میکند تا درک
243
00:09:20,480 –> 00:09:22,080
کنید که اهمیت
244
00:09:22,080 –> 00:09:24,399
یادگیری تحت نظارت و بدون نظارت
245
00:09:24,399 –> 00:09:26,399
246
00:09:26,399 –> 00:09:28,399
چیست.
247
00:09:28,399 –> 00:09:30,880
برای جلسه امروز خوب است، اکنون چه چیزی
248
00:09:30,880 –> 00:09:32,800
است روانی یاد بگیرید
249
00:09:32,800 –> 00:09:35,440
scikit-learn یک کتابخانه خاص است،
250
00:09:35,440 –> 00:09:37,920
خوب این یک کتابخانه منبع باز است
251
00:09:37,920 –> 00:09:40,880
و
252
00:09:40,880 –> 00:09:43,200
253
00:09:43,200 –> 00:09:46,000
شما روش های زیادی خواهید داشت که می توانید تعداد زیادی از
254
00:09:46,000 –> 00:09:48,399
کتابخانه ها را در داخل scikit یاد بگیرید
255
00:09:48,399 –> 00:09:49,760
مدار خوب یاد بگیرید می توانید با این تماس بگیرید به عنوان
256
00:09:49,760 –> 00:09:51,839
نوعی چارچوب و همچنین در داخل آن
257
00:09:51,839 –> 00:09:53,760
قرار خواهید گرفت، کتابخانه های زیادی
258
00:09:53,760 –> 00:09:56,959
برای کار با
259
00:09:56,959 –> 00:09:59,519
انواع مختلف دریافت خواهید کرد تکنیکهای یادگیری نظارتشده
260
00:09:59,519 –> 00:10:02,079
برای درک شما خوب است، اجازه دهید این را
261
00:10:02,079 –> 00:10:03,680
نیز
262
00:10:03,680 –> 00:10:05,040
به شما یادآوری کنم،
263
00:10:05,040 –> 00:10:07,279
اگر من یک تکنیک یادگیری نظارت شده دارم، یک تکنیک یادگیری
264
00:10:07,279 –> 00:10:08,399
265
00:10:08,399 –> 00:10:10,959
نظارت شده در
266
00:10:10,959 –> 00:10:13,200
طبقهبندی زیر طبقهبندی به
267
00:10:13,200 –> 00:10:15,680
تکنیکهای طبقهبندی و تکنیکهای رگرسیون
268
00:10:15,680 –> 00:10:17,920
است، وقتی میگویم
269
00:10:17,920 –> 00:10:20,720
تکنیکهای طبقهبندی، اساساً یک
270
00:10:20,720 –> 00:10:22,720
متغیر هدف
271
00:10:22,720 –> 00:10:25,519
گسسته خواهد داشت. طبیعت، بنابراین وقتی میگویم
272
00:10:25,519 –> 00:10:27,600
متغیر هدف با ماهیت گسسته،
273
00:10:27,600 –> 00:10:29,440
اساساً به این معنی است
274
00:10:29,440 –> 00:10:31,760
که شما یک مجموعه داده خاص خواهید داشت
275
00:10:31,760 –> 00:10:34,399
که ما به تازگی دیدیم که آیا شما
276
00:10:34,399 –> 00:10:35,920
در آن خواهید فهمید که آیا یک
277
00:10:35,920 –> 00:10:39,120
انحراف اتفاق افتاده است یا خیر،
278
00:10:39,120 –> 00:10:41,279
بنابراین در این مجموعه داده خاص شما می تواند
279
00:10:41,279 –> 00:10:43,440
ببیند که آیا انحراف اتفاق افتاده است یا نه چندان
280
00:10:43,440 –> 00:10:45,680
درست و نادرست، بنابراین این یک
281
00:10:45,680 –> 00:10:48,640
متغیر هدف گسسته است، این در
282
00:10:48,640 –> 00:10:52,160
واقع یک مشکل مبتنی بر طبقه بندی است
283
00:10:52,160 –> 00:10:55,279
اگر داده هدف خاصی دارید که
284
00:10:55,279 –> 00:10:56,880
285
00:10:56,880 –> 00:10:58,399
طبیعتاً پیوسته است، فرض کنید می خواهید
286
00:10:58,399 –> 00:11:00,000
تعیین کنید سن یک
287
00:11:00,000 –> 00:11:02,240
فرد خاص به طوری که
288
00:11:02,240 –> 00:11:04,399
مجموعه داده های خاص در واقع یا آن بخشی خواهد بود
289
00:11:04,399 –> 00:11:06,800
متغیر متغییر در واقع یک متغیر پیوسته خواهد بود،
290
00:11:06,800 –> 00:11:09,279
بنابراین برای
291
00:11:09,279 –> 00:11:12,000
متغیر پیوسته ما چیزی داریم
292
00:11:12,000 –> 00:11:14,800
که شما آن را به عنوان تکنیک های رگرسیون می
293
00:11:14,800 –> 00:11:17,440
نامید و برای متغیرهای گسسته می توانیم
294
00:11:17,440 –> 00:11:20,480
295
00:11:20,480 –> 00:11:22,240
با استفاده از تکنیک طبقه بندی یک تکنیک طبقه بندی
296
00:11:22,240 –> 00:11:24,079
داشته باشیم، شاید دوست داشته باشید بدانید که چند
297
00:11:24,079 –> 00:11:26,160
دسته
298
00:11:26,160 –> 00:11:28,560
میوه وجود دارد. در یک مجموعه داده خاص
299
00:11:28,560 –> 00:11:30,399
ممکن است بخواهید بدانید که آیا
300
00:11:30,399 –> 00:11:32,720
یک فرد خاص دیابتی است یا خیر،
301
00:11:32,720 –> 00:11:34,640
ممکن است بخواهید با استفاده از تکنیک رگرسیون متوجه شوید که چند
302
00:11:34,640 –> 00:11:36,480
دسته گل در یک مجموعه داده خاص وجود دارد و
303
00:11:36,480 –> 00:11:38,640
304
00:11:38,640 –> 00:11:40,560
ممکن است بخواهید
305
00:11:40,560 –> 00:11:42,640
میزان بارش باران را درک کنید.
306
00:11:42,640 –> 00:11:43,760
ممکن است دوست داشته باشید
307
00:11:43,760 –> 00:11:45,360
دمای چند روز آینده را درک کنید یا
308
00:11:45,360 –> 00:11:47,839
ممکن است بخواهید پیش بینی کنید که آیا اوه،
309
00:11:47,839 –> 00:11:49,600
اگرچه ممکن است بخواهید
310
00:11:49,600 –> 00:11:51,279
قیمت یک سهم خاص را در
311
00:11:51,279 –> 00:11:53,519
چند روز آینده پیش بینی کنید خوب است، بنابراین اینها برخی از
312
00:11:53,519 –> 00:11:55,200
تکنیک هایی هستند که در آنها خواهید بود.
313
00:11:55,200 –> 00:11:57,440
اساساً با استفاده از تکنیکهای نظارت شده
314
00:11:57,440 –> 00:11:59,600
و بسته به ماهیت
315
00:11:59,600 –> 00:12:01,920
متغیر هدفی که دارید،
316
00:12:01,920 –> 00:12:04,079
میخواهید من یا در نهایت از
317
00:12:04,079 –> 00:12:06,160
تکنیکهای رگرسیون یا تکنیکهای طبقهبندی استفاده
318
00:12:06,160 –> 00:12:10,320
میکنم، حالا
319
00:12:10,320 –> 00:12:12,399
تکنیکهای آماری خاصی در تکنیکهای رگرسیون وجود دارد
320
00:12:12,399 –> 00:12:14,639
که میتوانید از آنها استفاده
321
00:12:14,639 –> 00:12:16,000
کنید، شاید در مورد رگرسیون خطی شنیده باشید
322
00:12:16,000 –> 00:12:18,000
که اولین مورد است، پس از
323
00:12:18,000 –> 00:12:20,560
آن رگرسیون لجستیک وجود دارد، پس
324
00:12:20,560 –> 00:12:22,480
شما رگرسیون پیشرفته دارید. تکنیکهایی
325
00:12:22,480 –> 00:12:24,160
مانند
326
00:12:24,160 –> 00:12:26,480
تکنیکهای تقویت،
327
00:12:26,480 –> 00:12:29,040
رگرسیون کمند دارید، رگرسیون پشتهای دارید
328
00:12:29,040 –> 00:12:30,639
خوب است و
329
00:12:30,639 –> 00:12:33,600
اگر دادههای شما ماهیت غیرخطی دارند،
330
00:12:33,600 –> 00:12:36,079
خوب است، میتوانید تکنیکهای مبتنی بر درخت
331
00:12:36,079 –> 00:12:37,519
مانند
332
00:12:37,519 –> 00:12:39,920
درخت تصمیم را نیز اعمال کنید، میتوانید یک
333
00:12:39,920 –> 00:12:42,079
جنگل تصادفی را اعمال کنید، میتوانید از ماشین بردار پشتیبان
334
00:12:42,079 –> 00:12:44,000
استفاده کنید، میتوانید k را اعمال کنید. نزدیکترین
335
00:12:44,000 –> 00:12:46,959
همسایه نیز خوب است، بنابراین اینها
336
00:12:46,959 –> 00:12:49,360
برخی از این
337
00:12:49,360 –> 00:12:50,880
تکنیک های رگرسیون هستند که می توانید آنها را
338
00:12:50,880 –> 00:12:52,399
به خوبی اعمال کنید،
339
00:12:52,399 –> 00:12:54,000
بنابراین وقتی صحبت از تکنیک های طبقه بندی می شود،
340
00:12:54,000 –> 00:12:56,560
تکنیک های خاصی وجود دارد
341
00:12:56,560 –> 00:12:58,399
که می توانند هم به عنوان
342
00:12:58,399 –> 00:13:01,040
رگرسیون و هم به عنوان طبقه بندی استفاده
343
00:13:01,040 –> 00:13:03,519
شوند.
344
00:13:03,519 –> 00:13:05,440
345
00:13:05,440 –> 00:13:07,200
346
00:13:07,200 –> 00:13:09,760
k نزدیکترین همسایه
347
00:13:09,760 –> 00:13:12,639
آنچه دارید n است قضیه aive bayes
348
00:13:12,639 –> 00:13:15,839
و سپس شما تکنیکهای تقویتی
349
00:13:15,839 –> 00:13:18,160
دارید، تکنیکهای پشتیبان دارید، بنابراین اینها
350
00:13:18,160 –> 00:13:20,320
برخی از تکنیکهایی هستند که
351
00:13:20,320 –> 00:13:22,959
میتوانند به عنوان تکنیکهای طبقهبندی و رگرسیون نیز
352
00:13:22,959 –> 00:13:25,519
استفاده شوند، اما برای اجرای
353
00:13:25,519 –> 00:13:28,079
آن چیزها میتوانید
354
00:13:28,079 –> 00:13:31,680
از نوعی apis استفاده کنید یا در واقع میتوانید استفاده کنید.
355
00:13:31,680 –> 00:13:34,320
محاسبات آماری
356
00:13:34,320 –> 00:13:36,880
را نیز برای سادگی انجام
357
00:13:36,880 –> 00:13:38,480
دهید، فرض کنید میخواهید
358
00:13:38,480 –> 00:13:40,000
آن چیزها را با استفاده از یک
359
00:13:40,000 –> 00:13:41,920
زبان برنامهنویسی خاص پیادهسازی کنید و زبان برنامهنویسی
360
00:13:41,920 –> 00:13:43,920
پایتون
361
00:13:43,920 –> 00:13:46,000
خوب است، فقط به شما اطلاع میدهد که
362
00:13:46,000 –> 00:13:48,079
میتوانید هر زبان یادگیری ماشین خاصی را
363
00:13:48,079 –> 00:13:50,480
با استفاده از c
364
00:13:50,480 –> 00:13:52,959
یا java پیادهسازی کنید. اینها ترجیح داده نمی شوند، اما
365
00:13:52,959 –> 00:13:54,480
شما هنوز هم می توانید از آن استفاده کنید.
366
00:13:54,480 –> 00:13:57,279
367
00:13:57,279 –> 00:14:01,519
368
00:14:01,519 –> 00:14:05,440
369
00:14:05,440 –> 00:14:08,880
370
00:14:08,880 –> 00:14:13,519
371
00:14:13,519 –> 00:14:16,399
ابزارهای زبان برنامه نویسی
372
00:14:16,399 –> 00:14:18,720
مجوز منبع باز که
373
00:14:18,720 –> 00:14:21,279
در واقع می توانید از آن برای اجرای هر یک از
374
00:14:21,279 –> 00:14:23,120
تکنیک های یادگیری تحت نظارت خود استفاده کنید
375
00:14:23,120 –> 00:14:24,959
در مورد هر یک از تکنیک های یادگیری ماشین شما
376
00:14:24,959 –> 00:14:26,399
377
00:14:26,399 –> 00:14:28,639
خوب است، اکنون کاملاً به شما بستگی دارد که می خواهید از کدام
378
00:14:28,639 –> 00:14:30,079
یک استفاده کنید
379
00:14:30,079 –> 00:14:31,519
اگر برای مشتری خاصی کار می کنید،
380
00:14:31,519 –> 00:14:33,839
کاملاً بستگی به زیرساخت های
381
00:14:33,839 –> 00:14:36,560
آنها دارد، اما صرف نظر از
382
00:14:36,560 –> 00:14:39,040
زیرساخت ها، هر ابزاری
383
00:14:39,040 –> 00:14:41,600
که هستید. استفاده از تکنیکها
384
00:14:41,600 –> 00:14:43,600
و مفاهیم و مفاهیم زیربنایی
385
00:14:43,600 –> 00:14:46,560
همیشه یکسان باقی میماند، زیرا
386
00:14:46,560 –> 00:14:48,480
ذاتاً اینها تکنیکهای آماری هستند،
387
00:14:48,480 –> 00:14:49,920
388
00:14:49,920 –> 00:14:50,800
389
00:14:50,800 –> 00:14:52,639
بنابراین روشی که یک تکنیک یادگیری ماشینی
390
00:14:52,639 –> 00:14:53,760
کار
391
00:14:53,760 –> 00:14:58,480
میکند کاملاً به نحوه عملکرد آمار
392
00:14:58,480 –> 00:15:00,959
در
393
00:15:00,959 –> 00:15:01,760
حال حاضر
394
00:15:01,760 –> 00:15:04,480
زمانی که من میگویم تکنیک آماری است
395
00:15:04,480 –> 00:15:06,720
بستگی دارد، اما این همچنین یکی از دلایلی که ما
396
00:15:06,720 –> 00:15:09,440
از شرکت کنندگان خود درخواست می کنیم
397
00:15:09,440 –> 00:15:12,000
حداقل اطلاعاتی در مورد آمار
398
00:15:12,000 –> 00:15:14,639
داشته باشند، حداقل اطلاعاتی
399
00:15:14,639 –> 00:15:16,720
در مورد اطلاعات اولیه در مورد
400
00:15:16,720 –> 00:15:19,120
زبان برنامه نویسی دارند که در واقع کمک می کند،
401
00:15:19,120 –> 00:15:21,120
اما حتی اگر شما
402
00:15:21,120 –> 00:15:24,240
این دانش اولیه را ندارید، ما هنوز
403
00:15:24,240 –> 00:15:26,560
در اختیار داریم. ماژول های خاصی که به شما کمک می
404
00:15:26,560 –> 00:15:28,480
کند با این موضوع کنار بیایید چیزهای خاص بسیار
405
00:15:28,480 –> 00:15:30,720
خوب
406
00:15:30,720 –> 00:15:32,399
حالا بیایید سعی کنیم در چند اسلاید بعدی ببینیم چه چیزهایی داریم،
407
00:15:32,399 –> 00:15:34,160
408
00:15:34,160 –> 00:15:37,279
خوب حالا که گفتم اینها برخی
409
00:15:37,279 –> 00:15:38,560
از تکنیک هایی هستند که شما در
410
00:15:38,560 –> 00:15:40,399
رگرسیون و طبقه بندی دارید
411
00:15:40,399 –> 00:15:42,959
، من همچنین اشاره کرده بودم که
412
00:15:42,959 –> 00:15:45,040
می توانید در نهایت مجبور به پیاده سازی
413
00:15:45,040 –> 00:15:46,399
آنها شوید. تکنیکها درست است، پس چگونه میتوانید
414
00:15:46,399 –> 00:15:48,480
آنها را پیادهسازی کنید، مثلاً
415
00:15:48,480 –> 00:15:49,920
زبان برنامهنویسی یا ابزاری که
416
00:15:49,920 –> 00:15:52,560
استفاده میکنید پایتون است، بنابراین در
417
00:15:52,560 –> 00:15:54,399
پایتون یک چارچوب خاص به نام
418
00:15:54,399 –> 00:15:57,920
scikit-learn okay داریم و در داخل مدار
419
00:15:57,920 –> 00:16:02,800
scikit-learn شما انواع مختلفی دارید.
420
00:16:02,800 –> 00:16:05,680
کتابخانه هایی برای پشتیبانی از
421
00:16:05,680 –> 00:16:07,279
طبقه بندی رگرسیون
422
00:16:07,279 –> 00:16:10,399
جنگل تصادفی k نزدیکترین همسایه پشتیبان
423
00:16:10,399 –> 00:16:12,959
ماشین بردار نه قیمت شما
424
00:16:12,959 –> 00:16:14,160
در واقع
425
00:16:14,160 –> 00:16:16,800
می توانید همه این موارد را در سیستم خود نصب
426
00:16:16,800 –> 00:16:19,360
کنید، در عرض چند ثانیه و می توانید
427
00:16:19,360 –> 00:16:22,560
از آن استفاده کنید و همچنین خوب
428
00:16:22,560 –> 00:16:25,120
scikit یاد بگیرید چگونه یک کتابخانه عالی است،
429
00:16:25,120 –> 00:16:27,680
من به شما یکی را نشان خواهم داد.
430
00:16:27,680 –> 00:16:30,560
کاری که میخواهم انجام دهم این است که من در
431
00:16:30,560 –> 00:16:31,440
432
00:16:31,440 –> 00:16:33,839
صفحه Google هستم، بگذارید بگوییم من در این مورد تازه کار هستم،
433
00:16:33,839 –> 00:16:35,120
بنابراین میخواهم
434
00:16:35,120 –> 00:16:37,680
435
00:16:37,680 –> 00:16:40,560
مستندات مربوط به یادگیری را انجام دهم. y
436
00:16:40,560 –> 00:16:43,519
437
00:16:43,519 –> 00:16:45,360
اینها بسیار غنی هستند، اینها کتابخانه های مستند بسیار غنی
438
00:16:45,360 –> 00:16:48,079
هستند که با کمک
439
00:16:48,079 –> 00:16:49,839
آنها می توانید
440
00:16:49,839 –> 00:16:52,399
چیزهای زیادی را درک کنید که چگونه از
441
00:16:52,399 –> 00:16:54,000
این کتابخانه ها استفاده کنید چه چیزهایی را
442
00:16:54,000 –> 00:16:56,079
که باید از آنها استفاده کنید خوب است
443
00:16:56,079 –> 00:16:58,320
بنابراین این صفحه مستندات
444
00:16:58,320 –> 00:17:00,480
یادگیری روانی است. شما می توانید
445
00:17:00,480 –> 00:17:02,240
بفهمید که چگونه می توانید این کتابخانه ها را نصب کنید،
446
00:17:02,240 –> 00:17:03,839
همه چیز در اینجا آورده شده است،
447
00:17:03,839 –> 00:17:05,119
حتی اگر ما این کار را انجام دهیم،
448
00:17:05,119 –> 00:17:08,160
شما یک راهنمای کاربر خواهید داشت، ببینید
449
00:17:08,160 –> 00:17:10,480
من روی یادگیری نظارت شده کلیک
450
00:17:10,480 –> 00:17:12,959
می کنم، چیزهای زیادی مانند درخت تصمیم را
451
00:17:12,959 –> 00:17:13,839
452
00:17:13,839 –> 00:17:15,439
در داخل پیدا خواهید کرد. درختان تصمیم شما
453
00:17:15,439 –> 00:17:18,000
تکنیک های رگرسیون و و و و
454
00:17:18,000 –> 00:17:19,919
بسیاری چیزهای دیگر را پیدا خواهید کرد که این
455
00:17:19,919 –> 00:17:22,480
به خودی خود نوعی کتاب مقدس برای شما است،
456
00:17:22,480 –> 00:17:24,559
من می گویم هر نوع کمکی که
457
00:17:24,559 –> 00:17:26,880
نیاز دارید می توانید در واقع
458
00:17:26,880 –> 00:17:28,880
به این صفحه خاص بازگردید. در هر نقطه از
459
00:17:28,880 –> 00:17:32,160
زمان بسیار خوب حتی ما در برخی از برهه های زمانی
460
00:17:32,160 –> 00:17:34,160
اگر شما در حال گم شدن هستید یا
461
00:17:34,160 –> 00:17:36,320
قادر به انجام کاری نیستید ما نیز
462
00:17:36,320 –> 00