در این مطلب، ویدئو scikit-multiflow: یادگیری ماشینی برای جریان داده در پایتون با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:36:41
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:04,630 –> 00:00:06,670
بنابراین اساساً چیزی که می خواهم با آن
2
00:00:06,670 –> 00:00:09,520
صحبت کنم، بله، دو چیز اصلی است: یکی
3
00:00:09,520 –> 00:00:11,590
معرفی مختصری از
4
00:00:11,590 –> 00:00:13,000
معنای انجام جریان داده های بیشتر یادگیری ماشینی
5
00:00:13,000 –> 00:00:14,610
و دومی
6
00:00:14,610 –> 00:00:16,420
معرفی چارچوبی است که
7
00:00:16,420 –> 00:00:20,020
برای این منظور داریم. بنابراین فقط برای اینکه
8
00:00:20,020 –> 00:00:23,860
زمینه مشترک یکسانی برای همه داشته باشیم و
9
00:00:23,860 –> 00:00:26,020
چیزی که امروز در مورد آن
10
00:00:26,020 –> 00:00:28,570
صحبت خواهم کرد، فقط موضوع
11
00:00:28,570 –> 00:00:30,580
یادگیری ماشینی را داریم که اکثر شما مردم اکنون با آن آشنا هستید،
12
00:00:30,580 –> 00:00:32,980
بنابراین این یک زیر شاخه از
13
00:00:32,980 –> 00:00:35,379
هوش مصنوعی و آنچه ما هستیم.
14
00:00:35,379 –> 00:00:36,969
این کار این است که به طور خودکار
15
00:00:36,969 –> 00:00:39,879
الگوهایی را در دادهها پیدا کنیم.
16
00:00:39,879 –> 00:00:41,739
فرض این است که ماشینها میتوانند
17
00:00:41,739 –> 00:00:45,010
از الگوها یاد بگیرند که میتوانند
18
00:00:45,010 –> 00:00:47,789
پیشبینی کنند و این با حداقل
19
00:00:47,789 –> 00:00:50,769
تعامل انسانها است، بنابراین
20
00:00:50,769 –> 00:00:52,539
هدفی که ما در یادگیری ماشین
21
00:00:52,539 –> 00:00:54,039
داریم اساساً این است که ما قرار است از
22
00:00:54,039 –> 00:00:56,769
دادهها برای ساختن مدلهای ریاضی استفاده کنیم که
23
00:00:56,769 –> 00:00:59,229
میتواند به ما یا توصیفی از
24
00:00:59,229 –> 00:01:02,019
ماهیت آن دادهها بدهد، بنابراین با در نظر گرفتن اینکه
25
00:01:02,019 –> 00:01:04,569
ما یادگیری ماشینی استاندارد
26
00:01:04,569 –> 00:01:07,900
داریم، منظور من بیشتر است. افرادی که
27
00:01:07,900 –> 00:01:10,240
با این رویکرد آشنا هستند، مبتنی بر
28
00:01:10,240 –> 00:01:12,549
دستهای از دادهها است که به عنوان یادگیری دستهای نیز شناخته میشود
29
00:01:12,549 –> 00:01:14,920
و این
30
00:01:14,920 –> 00:01:17,020
حالت هنر برای بسیاری از مشکلات است، بنابراین
31
00:01:17,020 –> 00:01:21,130
این نقطه شروع بسیار خوبی است
32
00:01:21,130 –> 00:01:23,710
که ما در آن قرار داریم و این همان
33
00:01:23,710 –> 00:01:25,780
Pape the خط لوله اولیه برای
34
00:01:25,780 –> 00:01:27,789
یادگیری ماشین روی دستهها، بنابراین اساساً ما
35
00:01:27,789 –> 00:01:29,320
دادههایی داریم که در جایی ذخیره
36
00:01:29,320 –> 00:01:31,899
میکنیم یا آن را یک ذخیره فیزیکی داریم یا
37
00:01:31,899 –> 00:01:33,670
حافظه داریم و سپس
38
00:01:33,670 –> 00:01:35,649
آن دادهها را برای آموزش مدلها
39
00:01:35,649 –> 00:01:37,630
میگیریم و وقتی مدلهای ریاضی را داشتیم،
40
00:01:37,630 –> 00:01:39,460
قرار است به دادهها اعمال شود
41
00:01:39,460 –> 00:01:42,100
تا پیشبینیهایی داشته باشیم که روش استانداردی
42
00:01:42,100 –> 00:01:45,700
برای انجام آن است، اما چالشهای
43
00:01:45,700 –> 00:01:47,920
اینها در واقع این است که
44
00:01:47,920 –> 00:01:50,170
یادگیری ماشینی جدید نیست،
45
00:01:50,170 –> 00:01:52,780
مدت زیادی است
46
00:01:52,780 –> 00:01:54,929
که وجود داشته است، زمینه بسیار خوبی است. با پشتوانه
47
00:01:54,929 –> 00:02:00,249
تئوری و فنی و
48
00:02:00,249 –> 00:02:04,539
تئوری بسیار قوی و اکنون با
49
00:02:04,539 –> 00:02:07,119
پدیده کلان داده می بینیم که
50
00:02:07,119 –> 00:02:09,310
این در این زمینه پاداش داده شده است بنابراین
51
00:02:09,310 –> 00:02:11,440
اکنون همه این افراد مشغول به کار هستند. در
52
00:02:11,440 –> 00:02:13,270
مورد یادگیری ماشینی و آنچه
53
00:02:13,270 –> 00:02:15,340
اکنون میدان فعال است این است که ما میخواهیم یادگیری ماشینی را انجام دهیم،
54
00:02:15,340 –> 00:02:16,569
55
00:02:16,569 –> 00:02:18,939
اساساً میخواهیم دادههای بیشتری
56
00:02:18,939 –> 00:02:22,359
را با در دسترس قرار گرفتن آنها دریافت کنیم و میخواهیم
57
00:02:22,359 –> 00:02:25,120
با دادهها همگام باشیم، بنابراین یکی از چیزها این
58
00:02:25,120 –> 00:02:27,489
است که همانطور که هستیم تولید دادههای بیشتر
59
00:02:27,489 –> 00:02:30,280
و سریعتر تولید میکنیم،
60
00:02:30,280 –> 00:02:31,930
امروز در اینجا در مورد دو عامل صحبت میکنیم،
61
00:02:31,930 –> 00:02:34,150
یکی حجم و
62
00:02:34,150 –> 00:02:39,489
دیگری سرعت، بنابراین به عنوان مثال، کشف تقلب در تجارت الکترونیک است،
63
00:02:39,489 –> 00:02:42,849
بنابراین اساساً در اینجا
64
00:02:42,849 –> 00:02:44,620
ما روزانه میلیونها عملیات
65
00:02:44,620 –> 00:02:46,689
انجام میدهیم. میخواهیم این کار را انجام دهیم این است که
66
00:02:46,689 –> 00:02:49,239
میخواهیم تقلب را به سرعت و
67
00:02:49,239 –> 00:02:52,659
به درستی شناسایی کنیم، مسئله این است که
68
00:02:52,659 –> 00:02:54,370
سیستمهای مالی تکامل مییابند و همیشه در
69
00:02:54,370 –> 00:02:56,620
حال تغییر هستند، بنابراین باید با
70
00:02:56,620 –> 00:03:00,669
آن زمینه همگام باشیم و چیز دیگر این است که
71
00:03:00,669 –> 00:03:02,799
ذخیره دادهها در این سناریو
72
00:03:02,799 –> 00:03:06,099
واقعاً امکانپذیر نیست. واقعاً مانند دادههایی
73
00:03:06,099 –> 00:03:08,260
که شاید برای برخی از سال
74
00:03:08,260 –> 00:03:10,829
گذشته بود، دیگر واقعاً مفید نیستند
75
00:03:10,829 –> 00:03:13,090
و مسئله این است که اگر قرار باشد
76
00:03:13,090 –> 00:03:15,639
زمان آموزش را از دست بدهیم، ممکن است
77
00:03:15,639 –> 00:03:18,549
فرصتهایی را نیز برای شناسایی برخی از آنها از دست بدهیم.
78
00:03:18,549 –> 00:03:20,709
کلاهبرداری، بنابراین این بسیار مهم است و
79
00:03:20,709 –> 00:03:23,109
این مانند یک عنصر بسیار کلیدی است
80
00:03:23,109 –> 00:03:27,909
که ما زمانی برای از دست دادن آن نداریم، بنابراین
81
00:03:27,909 –> 00:03:29,650
آنچه جایگزین وجود دارد این است که بتوانیم از
82
00:03:29,650 –> 00:03:32,019
جریان های داده و جریان های داده استفاده کنیم،
83
00:03:32,019 –> 00:03:33,159
مهمترین چیز این است که فرض می
84
00:03:33,159 –> 00:03:35,829
کنیم داده ها هستند. بی نهایت است، بنابراین به
85
00:03:35,829 –> 00:03:37,959
طور مداوم در حال آمدن است و کاری
86
00:03:37,959 –> 00:03:39,159
که ما می خواهیم انجام دهیم این است که
87
00:03:39,159 –> 00:03:42,340
مدل ها را به صورت آنلاین نگهداری می کنیم، بنابراین کاری
88
00:03:42,340 –> 00:03:44,979
که می خواهیم انجام دهیم این است که
89
00:03:44,979 –> 00:03:48,069
داده ها را در همان لحظه که
90
00:03:48,069 –> 00:03:49,510
بدون محدودیت در آن هستیم ترکیب کنیم. دادههای آموزشی
91
00:03:49,510 –> 00:03:51,430
اساساً ما مجموعه قطار نداریم، شما
92
00:03:51,430 –> 00:03:53,260
فقط یک جریان و جریان بینهایت دارید،
93
00:03:53,260 –> 00:03:56,709
اما با توجه به اینکه این نامحدود است، باید از
94
00:03:56,709 –> 00:04:00,459
نظر منابع بسیار کارآمد باشیم و
95
00:04:00,459 –> 00:04:01,780
نکته دیگر این است که همانطور که
96
00:04:01,780 –> 00:04:06,040
قبل از تغییر جریانهای داده اشاره کردم، بنابراین ما
97
00:04:06,040 –> 00:04:07,540
نیاز داریم برای اینکه بتوانیم خود را با آن
98
00:04:07,540 –> 00:04:11,260
تغییرات تطبیق دهیم و در نهایت ما چون در حال
99
00:04:11,260 –> 00:04:12,759
تطبیق هستیم، مدل های پویا خواهیم داشت،
100
00:04:12,759 –> 00:04:15,280
بنابراین وقتی
101
00:04:15,280 –> 00:04:16,620
در مورد جریان داده صحبت می
102
00:04:16,620 –> 00:04:19,630
کنیم، اساساً ما به دهه 40
103
00:04:19,630 –> 00:04:22,150
می رویم. قرار
104
00:04:22,150 –> 00:04:24,430
است یک نمونه را در یک زمان پردازش کنیم و وقتی این
105
00:04:24,430 –> 00:04:27,520
کار را انجام دادیم تمام شد – از بین می رود زیرا
106
00:04:27,520 –> 00:04:29,260
ما چیزی را نگه نمی داریم، بنابراین
107
00:04:29,260 –> 00:04:30,100
یک نمونه را
108
00:04:30,100 –> 00:04:33,460
که در مدل گنجانده ایم می گیریم و سپس آن را
109
00:04:33,460 –> 00:04:36,490
رها می کنیم زیرا اکنون روزهای بیشتری در
110
00:04:36,490 –> 00:04:39,100
راه است. اشاره کردم که ما
111
00:04:39,100 –> 00:04:41,410
به این دو منبع حافظه
112
00:04:41,410 –> 00:04:44,320
و زمان محدود هستیم، بنابراین
113
00:04:44,320 –> 00:04:49,660
حافظه محدودی داریم و نمیتوانیم روی بسیاری از آنها کار کنیم،
114
00:04:49,660 –> 00:04:51,130
نمیتوانیم زمان زیادی را روی
115
00:04:51,130 –> 00:04:53,050
آموزشی که میخواهیم در سریعترین زمان ممکن موقعیتها را به دست آوریم، صرف
116
00:04:53,050 –> 00:04:56,110
کنیم. شرط نهایی
117
00:04:56,110 –> 00:04:58,180
این است که ما همیشه میخواهیم برای پیشبینی دلیل آن آماده باشیم،
118
00:04:58,180 –> 00:05:00,670
زیرا جریان دادههای eStore
119
00:05:00,670 –> 00:05:02,800
بینهایت است، ما هرگز
120
00:05:02,800 –> 00:05:05,410
آموزش را به پایان نخواهیم رساند.
121
00:05:05,410 –> 00:05:07,030
122
00:05:07,030 –> 00:05:10,630
123
00:05:10,630 –> 00:05:13,000
برای پیشبینی در هر نقطه از
124
00:05:13,000 –> 00:05:14,830
زمان، بنابراین به نظر میرسد که خط لوله
125
00:05:14,830 –> 00:05:17,500
جریان داده برای یادگیری ماشین در
126
00:05:17,500 –> 00:05:18,880
جریانهای داده، کمی شبیه به
127
00:05:18,880 –> 00:05:21,460
این است، بنابراین اساساً شما جریانی از
128
00:05:21,460 –> 00:05:23,680
دادهها دارید که بی نهایت است، شما یک مدل
129
00:05:23,680 –> 00:05:26,710
در پایین صفحه دارید. at همیشه آماده است، بنابراین
130
00:05:26,710 –> 00:05:28,180
کاری که قرار است انجام شود این است که
131
00:05:28,180 –> 00:05:30,670
از جریان دادهها را بخواهد و ما
132
00:05:30,670 –> 00:05:32,770
یا دو گزینه داریم که در صورت یادگیری نظارت شده، دادههای برچسبدار را دریافت کنید
133
00:05:32,770 –> 00:05:34,890
و
134
00:05:34,890 –> 00:05:37,330
اگر دادههای برچسبدار هستند، از آن برای آموزش استفاده میکنیم.
135
00:05:37,330 –> 00:05:39,370
و سپس به حالت آماده برمی گردیم،
136
00:05:39,370 –> 00:05:41,650
اگر داده های بدون برچسب دریافت کنیم
137
00:05:41,650 –> 00:05:43,570
، اتفاقی که قرار است بیفتد این است که ما
138
00:05:43,570 –> 00:05:45,250
پیش بینی هایی ارائه می دهیم یا
139
00:05:45,250 –> 00:05:46,570
مدل قرار است پیش بینی هایی ارائه دهد
140
00:05:46,570 –> 00:05:49,840
و سپس به حالت آماده برمی گردد، بنابراین
141
00:05:49,840 –> 00:05:51,430
این کمی متفاوت است. به آنچه
142
00:05:51,430 –> 00:05:52,770
در رویکرد یادگیری دستهای دیدهایم
143
00:05:52,770 –> 00:05:55,960
و قبل از آن گفتم که
144
00:05:55,960 –> 00:05:58,840
این یک فرآیند مستمر است، همیشه
145
00:05:58,840 –> 00:06:00,640
به این شکل اتفاق میافتد
146
00:06:00,640 –> 00:06:04,270
، پایانی برای آن وجود ندارد، بنابراین چرا این مهم
147
00:06:04,270 –> 00:06:07,770
است، زیرا اساساً ما در حال سرمایهگذاری
148
00:06:07,770 –> 00:06:10,690
هستیم. سرمایه گذاری از نظر
149
00:06:10,690 –> 00:06:12,580
اندازه داده که در آن به محدودیت هایی برسیم که
150
00:06:12,580 –> 00:06:15,400
اساساً در یادگیری دسته ای چیزی
151
00:06:15,400 –> 00:06:17,740
که اکنون اتفاق می افتد این است که مشکلات IBA
152
00:06:17,740 –> 00:06:20,440
بزرگتر می شوند و مجموعه داده ها بزرگتر می شوند. ما
153
00:06:20,440 –> 00:06:22,510
باید منابع بیشتری را سرمایه گذاری کنیم.
154
00:06:22,510 –> 00:06:25,300
حافظه زمانی باشد و
155
00:06:25,300 –> 00:06:26,920
این مستلزم هزینه ای نیز خواهد بود
156
00:06:26,920 –> 00:06:28,780
زیرا با بزرگتر شدن مجموعه داده ها
157
00:06:28,780 –> 00:06:30,820
به پلتفرم های
158
00:06:30,820 –> 00:06:32,620
جدید یا سرویس های جدیدی می رویم که در آنجا
159
00:06:32,620 –> 00:06:35,710
این منابع را دریافت می کنیم، سپس در
160
00:06:35,710 –> 00:06:36,760
مقطعی به نقطه ای می رسیم
161
00:06:36,760 –> 00:06:38,950
که این واقعا غیرممکن است زیرا
162
00:06:38,950 –> 00:06:41,620
ممکن است مشکل شما این باشد که خیلی سریع مقیاس بندی می شود،
163
00:06:41,620 –> 00:06:42,390
اما
164
00:06:42,390 –> 00:06:44,190
یا بودجه به سرعت آن بزرگ نمی شود،
165
00:06:44,190 –> 00:06:47,220
بنابراین از طرف دیگر، کاری که
166
00:06:47,220 –> 00:06:48,870
ما با یادگیری جریانی انجام
167
00:06:48,870 –> 00:06:50,340
می دهیم این است که این
168
00:06:50,340 –> 00:06:53,280
منابع را تحت کنترل داشته باشیم. ما
169
00:06:53,280 –> 00:06:56,220
قصد داریم انجام دهیم این است که این سرمایه گذاری که این
170
00:06:56,220 –> 00:06:57,900
خط سرمایه گذاری معقول قرار است انجام
171
00:06:57,900 –> 00:06:59,550
شود هرگز به آن نمی رسد بنابراین ما
172
00:06:59,550 –> 00:07:02,550
می خواهیم آن را ثابت نگه داریم که هدف
173
00:07:02,550 –> 00:07:07,050
این است بنابراین محدودیت های بالاتر از نظر
174
00:07:07,050 –> 00:07:09,720
منابع ابتدا در حافظه ما چیست؟
175
00:07:09,720 –> 00:07:12,810
با افزایش اندازه دادهها کنترل میشود، بنابراین
176
00:07:12,810 –> 00:07:15,120
اساساً این یک جریان بینهایت است، بنابراین
177
00:07:15,120 –> 00:07:16,770
آنچه ما نمیخواهیم انجام دهیم این است
178
00:07:16,770 –> 00:07:18,690
که نمیخواهیم مدل به رشد خود ادامه دهد،
179
00:07:18,690 –> 00:07:20,160
زیرا در نهایت
180
00:07:20,160 –> 00:07:23,010
حافظه ما در اندازه دیگر محدود میشود.
181
00:07:23,010 –> 00:07:25,980
برای زمان این است که ما می خواهیم به زودی
182
00:07:25,980 –> 00:07:29,670
فقط زمان زیر خطی داشته باشیم زیرا همانطور که
183
00:07:29,670 –> 00:07:31,830
قبلاً گفتم اگر زمان زیادی را برای
184
00:07:31,830 –> 00:07:33,720
چاپ برای یادگیری آنچه قرار است
185
00:07:33,720 –> 00:07:35,070
اتفاق بیفتد سرمایه گذاری کنیم این است که شروع به
186
00:07:35,070 –> 00:07:36,660
از دست دادن داده خواهیم کرد زیرا جریان به
187
00:07:36,660 –> 00:07:39,420
طور مداوم در حال آمدن است بنابراین اگر ما
188
00:07:39,420 –> 00:07:41,550
زمان زیادی را صرف آموزش آنچه که قرار است باشیم میکنیم،
189
00:07:41,550 –> 00:07:43,110
190
00:07:43,110 –> 00:07:44,670
در عوض نمونهها را از دست میدهیم
191
00:07:44,670 –> 00:07:47,460
و سپس مدل
192
00:07:47,460 –> 00:07:53,060
شما اساساً منسوخ میشود، بنابراین این
193
00:07:53,060 –> 00:07:55,560
کمی از آنچه به نظر میرسد زمانی است
194
00:07:55,560 –> 00:07:57,750
شما یادگیرندگان دسته ای و یادگیرندگان جریانی را
195
00:07:57,750 –> 00:08:01,320
در این مثال مقایسه کنید، این داده ها که
196
00:08:01,320 –> 00:08:05,010
به طور خاص گفته شد شامل سه دریفت است، آنچه که
197
00:08:05,010 –> 00:08:07,200
ما در مورد آنچه که اشاره می
198
00:08:07,200 –> 00:08:09,660
کنیم وقتی می گوییم دریفت به چه معناست، اساساً
199
00:08:09,660 –> 00:08:12,660
تغییری در مفهوم است که چگونه ممکن است این
200
00:08:12,660 –> 00:08:15,090
اتفاق بیفتد، برای مثال اگر داده های شما
201
00:08:15,090 –> 00:08:17,280
همانطور که قبلاً گفتم در
202
00:08:17,280 –> 00:08:19,590
دادههای مالی که در حال تغییر هستند و سپس
203
00:08:19,590 –> 00:08:21,120
آنچه در تنظیمات دستهای اتفاق میافتد تکامل مییابد این است که
204
00:08:21,120 –> 00:08:23,370
شما اساساً مدلی دارید
205
00:08:23,370 –> 00:08:25,650
که در دادههای متفاوتی استفاده میشود.
206
00:08:25,650 –> 00:08:28,230
اکنون
207
00:08:28,230 –> 00:08:31,050
در مورد دیگری استفاده می شود، بنابراین همانطور
208
00:08:31,050 –> 00:08:32,850
که می بینید در این مورد ما فقط
209
00:08:32,850 –> 00:08:35,520
سعی می کنیم جبران کنیم لیسانس
210
00:08:35,520 –> 00:08:37,350
سعی می کند پیش بینی هایی ارائه دهد اما
211
00:08:37,350 –> 00:08:39,870
واقعاً اینطور نیست که در اولین
212
00:08:39,870 –> 00:08:41,970
صرفه جویی باید آن را ببندد فقط
213
00:08:41,970 –> 00:08:44,010
نمی داند در
214
00:08:44,010 –> 00:08:45,660
طرف دیگر چه اتفاقی می افتد اگر در استریم
215
00:08:45,660 –> 00:08:47,190
آموز ببینید پایین می آید زیرا تغییری وجود دارد
216
00:08:47,190 –> 00:08:49,590
اما به سرعت بالا می رود و
217
00:08:49,590 –> 00:08:52,320
این یک مشکل بسیار چالش برانگیز
218
00:08:52,320 –> 00:08:54,170
برای روش دسته ای است.
219
00:08:54,170 –> 00:08:56,329
برخی از تکنیک ها وجود دارد که در آن شما
220
00:08:56,329 –> 00:08:58,430
اساساً همان چیزی هستید که هستید انجام یا کاری که
221
00:08:58,430 –> 00:09:00,290
همه ما در حال حاضر انجام می دهیم این است که اگر شاهد
222
00:09:00,290 –> 00:09:02,300
تعقیب و گریز یا کاهش عملکرد باشیم،
223
00:09:02,300 –> 00:09:03,829
کاری که انجام می دهیم این است که در حال سرمایه گذاری زمان
224
00:09:03,829 –> 00:09:06,560
برای نظارت بر مدل و سپس
225
00:09:06,560 –> 00:09:08,930
راه اندازی آموزش های جدید هستیم و باید
226
00:09:08,930 –> 00:09:11,750
تا پایان آموزش صبر کنیم. تمام شد و
227
00:09:11,750 –> 00:09:14,269
بعد مثل این است که باید دوباره تمام خط لوله را آزمایش کنیم
228
00:09:14,269 –> 00:09:17,630
و این مانند یک
229
00:09:17,630 –> 00:09:21,199
مثال است که اگر نگاه کنید اگر با استریم آموز مقایسه کنید چگونه به نظر می رسد،
230
00:09:21,199 –> 00:09:22,940
231
00:09:22,940 –> 00:09:30,110
بنابراین در این قسمت من فقط
232
00:09:30,110 –> 00:09:32,240
به طور خلاصه در مورد آن صحبت می کنم در مورد نحوه انجام
233
00:09:32,240 –> 00:09:34,040
یادگیری ماشینی و برای این کار من
234
00:09:34,040 –> 00:09:36,260
بر روی یادگیری نظارت شده تمرکز می کنم.
235
00:09:36,260 –> 00:09:40,399
در مورد طبقه بندی صحبت می کنم یک
236
00:09:40,399 –> 00:09:42,230
مثال در طبقه بندی من می
237
00:09:42,230 –> 00:09:43,760
خواهم کمی بیشتر در مورد اینکه
238
00:09:43,760 –> 00:09:46,670
مفهوم رانش به چه معناست و چگونه ما صحبت می کنم ما میتوانیم
239
00:09:46,670 –> 00:09:49,339
از آن بهره ببریم و در نهایت چگونه
240
00:09:49,339 –> 00:09:52,370
مدلها یا مدلهای جریانی را ارزیابی میکنیم
241
00:09:52,370 –> 00:09:54,079
که این با
242
00:09:54,079 –> 00:09:58,640
نحوه انجام آن در یادگیری دستهای کمی متفاوت است، بنابراین اولین
243
00:09:58,640 –> 00:10:00,350
چیزی که میخواهم در مورد این طبقهبندی صحبت کنم،
244
00:10:00,350 –> 00:10:03,800
این یک کار بسیار اساسی
245
00:10:03,800 –> 00:10:07,190
یا بسیار رایج است. وظایف امروزی که ما
246
00:10:07,190 –> 00:10:08,839
اساساً یک مجموعه آموزشی داریم وقتی
247
00:10:08,839 –> 00:10:11,149
دادههای برچسبگذاری شده داریم،
248
00:10:11,149 –> 00:10:12,709
ویژگیهایی داریم و کلاسهایی برای آن
249
00:10:12,709 –> 00:10:14,990
ویژگیها داریم و پس هدف این است
250
00:10:14,990 –> 00:10:18,410
که میخواهیم دادههای جدیدی دریافت کنیم که
251
00:10:18,410 –> 00:10:20,720
بدون برچسب هستند و فقط میخواهیم بدهیم.
252
00:10:20,720 –> 00:10:22,370
پیش بینی یک مثال برای
253
00:10:22,370 –> 00:10:26,000
مثال در فیلترهای هرزنامه و یکی از
254
00:10:26,000 –> 00:10:28,370
روش های اصلی برای انجام این کار است یا اینکه
255
00:10:28,370 –> 00:10:31,060
درخت تصمیم چه روش بسیار محبوبی است
256
00:10:31,060 –> 00:10:33,740
شاید اکثر مردم با نحوه
257
00:10:33,740 –> 00:10:35,990
کار درخت تصمیم آشنا باشند اما در هر صورت
258
00:10:35,990 –> 00:10:39,050
اساساً این است که شما
259
00:10:39,050 –> 00:10:41,690
فضای ویژگی را به قسمتهای مختلف تقسیم میکنید، به
260
00:10:41,690 –> 00:10:45,440
عنوان مثال این یک درخت برای مشکلی است
261
00:10:45,440 –> 00:10:47,390
که در آن میخواهید ماشین بخرید یا نه،
262
00:10:47,390 –> 00:10:50,180
بنابراین کاری که میخواهید انجام دهید این است که
263
00:10:50,180 –> 00:10:53,120
ابتدا میخواهید تقسیم کنید.
264
00:10:53,120 –> 00:10:56,089
شروع از بهترین ویژگی پس در
265
00:10:56,089 –> 00:10:59,420
این مورد این است که اگر ماشین را تست شده آورده باشم
266
00:10:59,420 –> 00:11:02,390
یا می توانم این کار را انجام دهم یا نه اگر نه
267
00:11:02,390 –> 00:11:04,370
و قصد رد کردن آن را ندارم
268
00:11:04,370 –> 00:11:06,920
بعد از خرید آن را مدیریت کنم
269
00:11:06,920 –> 00:11:10,550
و مورد بعدی این است که اساساً
270
00:11:10,550 –> 00:11:13,010
شما یک بازگشتی در استقرا دارید که در آن
271
00:11:13,010 –> 00:11:15,260
همه داده ها را می گیرید و سپس درخت را می سازید،
272
00:11:15,260 –> 00:11:20,150
بنابراین این یک روش بسیار خوب است،
273
00:11:20,150 –> 00:11:22,670
روش بسیار محبوب، اما
274
00:11:22,670 –> 00:11:24,770
مشکل دوباره این است که ما به همه
275
00:11:24,770 –> 00:11:28,730
داده ها برای آموزش نیاز داریم. درخت، بنابراین یک راه حل
276
00:11:28,730 –> 00:11:31,670
که در واقع بر این اساس است،
277
00:11:31,670 –> 00:11:34,040
درخت تصمیم گیری بسیار سریع یا درخت نگهدارنده نامیده می شود
278
00:11:34,040 –> 00:11:38,300
و این بر اساس
279
00:11:38,300 –> 00:11:41,510
همان ایده است که شما می توانید یک درخت ایجاد کنید، اما
280
00:11:41,510 –> 00:11:43,370
در این مورد بر اساس این
281
00:11:43,370 –> 00:11:45,560
فرض است که شما فقط به نمونه کوچکی نیاز دارید.
282
00:11:45,560 –> 00:11:51,320
اندازه ها را برای انتخاب تصمیمات تقسیم بندی انتخاب کنید،
283
00:11:51,320 –> 00:11:53,780
بنابراین چگونه این اتفاق می افتد ng
284
00:11:53,780 –> 00:11:56,120
این است که در ابتدا شما فقط
285
00:11:56,120 –> 00:11:58,850
یک گره دارید و سپس باید منتظر
286
00:11:58,850 –> 00:12:00,860
بمانید تا نمونه های کافی را ببینید و
287
00:12:00,860 –> 00:12:03,380
سپس آن گره را تقسیم کنید بنابراین
288
00:12:03,380 –> 00:12:04,610
اساساً
289
00:12:04,610 –> 00:12:06,170
اولین گره را می گیرید و می خواهید
290
00:12:06,170 –> 00:12:08,570
آن را تبدیل کنید. به یک گره تقسیم میشوید و سپس
291
00:12:08,570 –> 00:12:10,630
دو گره برگ دارید، توزیعها را تقسیم میکنید
292
00:12:10,630 –> 00:12:13,310
و سپس شروع به دریافت
293
00:12:13,310 –> 00:12:18,440
یک درخت واقعی میکنید و این مناطق میروند چون دادههای بیشتری دریافت میکنیم،
294
00:12:18,440 –> 00:12:20,720
اما بخش مشکل اینجاست که
295
00:12:20,720 –> 00:12:24,050
چگونه تصمیم میگیرید چه زمانی باید تقسیم را انجام دهید
296
00:12:24,050 –> 00:12:26,270
و که میخواهید
297
00:12:26,270 –> 00:12:27,950
از کل چیز به خوبی استفاده کنید، این
298
00:12:27,950 –> 00:12:32,000
پسزمینه ریاضی است که
299
00:12:32,000 –> 00:12:35,690
مبنای این کار برای درختهای تصمیمگیری است
300
00:12:35,690 –> 00:12:38,450
و اساساً این به شما کمک میکند
301
00:12:38,450 –> 00:12:41,630
تا نقطه درستی را که
302
00:12:41,630 –> 00:12:43,760
میخواهید تقسیم را انجام دهید، تعریف
303
00:12:43,760 –> 00:12:45,380
کنید. آمار
304
00:12:45,380 –> 00:12:47,450
و میخواهم بگویم خوب است در این مرحله من
305
00:12:47,450 –> 00:12:49,340
به اندازه کافی مطمئن هستم که میتوان سرعت را
306
00:12:49,340 –> 00:12:51,940
انجام داد و سپس شما
307
00:12:51,940 –> 00:12:54,740
درخت را رشد
308
00:12:54,740 –> 00:12:56,980
309
00:12:56,980 –> 00:13:00,350
خواهید داد. درختان تصمیم گیری
310
00:13:00,350 –> 00:13:02,510
و شما بلوک بیش از حد برازش دارید
311
00:13:02,510 –> 00:13:04,900
اساساً آنچه ما داریم این است
312
00:13:04,900 –> 00:13:08,120
که ما تئوری های ریاضی داریم که
313
00:13:08,120 –> 00:13:10,550
به فلز یادگیرنده دسته ای بسیار نزدیک هستیم، بنابراین
314
00:13:10,550 –> 00:13:11,800
این راه حل بسیار خوبی
315
00:13:11,800 –> 00:13:13,839
است که بر اساس
316
00:13:13,839 –> 00:13:17,339
درخت های تصمیم است و با آن اقتباس شده است.
317
00:13:17,339 –> 00:13:22,839
جریان دو بعدی یک سناریو از طرف دیگر
318
00:13:22,839 –> 00:13:28,450
ما شکاف مفهومی داریم آنچه اتفاق میافتد
319
00:13:28,450 –> 00:13:30,850
مفهومی است که اساساً
320
00:13:30,850 –> 00:13:33,880
ما محیطهای غیر ثابت پویا داریم
321
00:13:33,880 –> 00:13:35,769
بنابراین اساساً آنچه در حال
322
00:13:35,769 –> 00:13:38,079
رخ دادن است این است که توزیع دادهها
323
00:13:38,079 –> 00:13:40,870
در حال تغییر است بنابراین اگر میخواهیم اجازه دهیم
324
00:13:40,870 –> 00:13:44,230
توزیع دادهها تغییر کند. کاری
325
00:13:44,230 –> 00:13:46,839
که ما در تمرکز درون نگر انجام
326
00:13:46,839 –> 00:13:48,399
می دهیم این است که
327
00:13:48,399 –> 00:13:51,430
وقتی تغییری را می بینیم سیگنال می دهیم و چرا
328
00:13:51,430 –> 00:13:54,100
این خوب است در واقع
329
00:13:54,100 –> 00:13:56,350
این مشکلی است که ما در جریان داده با آن روبرو هستیم
330
00:13:56,350 –> 00:13:58,620
اما در واقع می تواند بسیار خوب باشد.
331
00:13:58,620 –> 00:14:01,510
دارایی زیرا کاربرد
332
00:14:01,510 –> 00:14:03,339
آشکارسازهای صخره ای مفهومی این است که می توانیم
333
00:14:03,339 –> 00:14:05,589
تغییرات در عملکرد مدل های خود را تشخیص دهیم
334
00:14:05,589 –> 00:14:10,149
و این به طور خودکار انجام می شود، به
335
00:14:10,149 –> 00:14:11,950
عنوان مثال یکی از پربازدیدترین ها lar
336
00:14:11,950 –> 00:14:16,420
متاسفم ابتدا این برخی از الگوهایی است
337
00:14:16,420 –> 00:14:18,730
که می توانید پیدا کنید زمانی که ما در
338
00:14:18,730 –> 00:14:20,980
مورد شکاف مفهومی صحبت می کنیم اساساً در
339
00:14:20,980 –> 00:14:23,589
تغییر ناگهانی که از یک مفهوم به مفهوم دیگر تغییر می کنیم
340
00:14:23,589 –> 00:14:26,500
انتخاب کنید در یک لحظه
341
00:14:26,500 –> 00:14:28,570
نمونه بعدی که در راه است با یک
342
00:14:28,570 –> 00:14:31,029
مفهوم جدید مطابقت دارد. و سپس در
343
00:14:31,029 –> 00:14:32,850
حالت افزایشی ما
344
00:14:32,850 –> 00:14:37,709
مفهوم میانی در طول انتقال یکپارچه
345
00:14:37,709 –> 00:14:40,510
دریفت داریم آن چیزی که داریم این است که ما دو
346
00:14:40,510 –> 00:14:42,490
مفهوم داریم و آنها در یک دوره زمانی در حال تغییر هستند
347
00:14:42,490 –> 00:14:44,520
و در حال
348
00:14:44,520 –> 00:14:46,390
مبادله بین یکدیگر هستند و
349
00:14:46,390 –> 00:14:49,329
سپس یکی از آنها را انتخاب می کنیم. مفهوم تکرارشونده
350
00:14:49,329 –> 00:14:50,800
این بیشتر شبیه
351
00:14:50,800 –> 00:14:52,390
مفاهیم فصلی است که تکرار
352
00:14:52,390 –> 00:14:54,220
میشوند و دوباره میآیند،
353
00:14:54,220 –> 00:14:56,350
شاید پدیدهای باشد که مربوط به
354
00:14:56,350 –> 00:14:58,449
محیطهایی باشد که چرخههایی را
355
00:14:58,449 –> 00:15:00,370
داریم، فصلها را داریم و شاید
356
00:15:00,370 –> 00:15:03,279
چیزی شبیه به اتفاقی در تابستان باشد و
357
00:15:03,279 –> 00:15:04,810
بعد ما اتفاق متفاوتی
358
00:15:04,810 –> 00:15:06,190
در زمستان رخ می دهد، اما
359
00:15:06,190 –> 00:15:07,270
تابستان آینده ما می خواهیم چیزی مشابه را ببینیم،
360
00:15:07,270 –> 00:15:10,510
بنابراین
361
00:15:10,510 –> 00:15:12,760
چیز جالب در مورد این یا بخش چالش برانگیز
362
00:15:12,760 –> 00:15:14,980
این است که ما نمیخواهیم
363
00:15:14,980 –> 00:15:18,880
نقاط پرت را بهعنوان تغییر یافته شناسایی کنیم، زیرا
364
00:15:18,880 –> 00:15:22,029
نقاط پرت در دادههای شما نویز هستند، بنابراین
365
00:15:22,029 –> 00:15:24,520
دادههای ما میتوانند نویز داشته باشند، اما ما نمیخواهیم
366
00:15:24,520 –> 00:15:25,630
بگوییم خوب است
367
00:15:25,630 –> 00:15:29,380
این نویز را انجام دهید، ما تغییری داریم، بنابراین باید این کار را انجام دهیم.
368
00:15:29,380 –> 00:15:30,730
مطمئناً وقتی در مورد مفهومی صحبت
369
00:15:30,730 –> 00:15:33,550
می کنیم این است که ما واقعاً
370
00:15:33,550 –> 00:15:37,930
یک تغییر را به درستی شناسایی می کنیم و یکی
371
00:15:37,930 –> 00:15:40,060
از روش های رایج برای انجام
372
00:15:40,060 –> 00:15:42,459
آن آشکارساز تغییر odwin یا
373
00:15:42,459 –> 00:15:45,910
پنجره تطبیقی است در این روش کاری که انجام می دهد به طو
374
00:15:45,910 –> 00:15:51,579
کلی این است که فقط یک پنجره از
375
00:15:51,579 –> 00:15:53,949
اده ها را می گیرد و کاری که قرار است انجام شود این
376
00:15:53,949 –> 00:15:55,600
است که دو پنجره فرعی داشته باشد
377
00:15:55,600 –> 00:15:57,490
و
378
00:15:57,490 –> 00:16:00,459
توزیع آن پنجره ها را مشابه نگه دارد، بنابراین
379
00:16:00,459 –> 00:16:02,410
این دو پنجره را زیر نظر خواهد گرفت و
380
00:16:02,410 –> 00:16:05,230
در حالی که داده ها هستند در حالی که داده
381
00:16:05,230 –> 00:16:07,860
ها با همان توزیع مطابقت دارد.
382
00:16:07,860 –> 00:16:10,240
این دو پنجره تغییر نمیکنند،
383
00:16:10,240 –> 00:16:12,790
اتفاقی که میافتد این است که وقتی
384
00:16:12,790 –> 00:16:14,980
توزیع جدیدی را مشاهده میکنید
385
00:16:14,980 –> 00:16:16,810
، یکی از پنجرهها
386
00:16:16,810 –> 00:16:19,930
تغییر میکند و یکی از زمانی که این اتفاق میافتد،
387
00:16:19,930 –> 00:16:21,459
علامت خوبی میدهد. تغییری
388
00:16:21,459 –> 00:16:23,259
در توزیع دادههای شما وجود دارد
389
00:16:23,259 –> 00:16:26,139
که اولین پنجره فرعی را حذف میکند و
390
00:16:26,139 –> 00:16:28,000
سپس پنجره دیگری ایجاد میکند، بنابراین
391
00:16:28,000 –> 00:16:31,630
همیشه دو پنجره فرعی را نگه میدارد،
392
00:16:31,630 –> 00:16:34,209
از نظر زمان
393
00:16:34,209 –> 00:16:37,480
و از نظر منابع بسیار کارآمد
394
00:16:37,480 –> 00:16:39,850
است. تئوری متضاد تضمین
395
00:16:39,850 –> 00:16:42,639
می کند که این دو
396
00:16:42,639 –> 00:16:43,720
پنجره فرعی را با توزیع یکسان حفظ می کند
397
00:16:43,720 –> 00:16:46,439
و یکی از محبوب ترین
398
00:16:46,439 –> 00:16:49,420
الگوریتم هایی است که در جریان داده ها استفاده
399
00:16:49,420 –> 00:16:52,290
می شود و اساساً برای
400
00:16:52,290 –> 00:16:59,199
نظارت خودکار عملکرد مدل ها
401
00:16:59,199 –> 00:17:00,550
مورد استفاده قرار
402
00:17:00,550 –> 00:17:05,319
می گیرد. در مورد ارزیابی است زیرا همانطور
403
00:17:05,319 –> 00:17:07,089
که قبلاً اشاره کردم وقتی
404
00:17:07,089 –> 00:17:12,189
آموزش و ارزیابی را انجام می دهید
405
00:17:12,189 –> 00:17:14,230
تفاوت های کوچکی وجود دارد