فیلم آموزشی: scikit-multiflow: یادگیری ماشینی برای جریان داده در پایتون با زیرنویس فارسی

در این مطلب، ویدئو scikit-multiflow: یادگیری ماشینی برای جریان داده در پایتون با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:36:41

تصاویر این ویدئو:

قسمتی از زیرنویس این فیلم:

1
00:00:04,630 –> 00:00:06,670
بنابراین اساساً چیزی که می خواهم با آن

2
00:00:06,670 –> 00:00:09,520
صحبت کنم، بله، دو چیز اصلی است: یکی

3
00:00:09,520 –> 00:00:11,590
معرفی مختصری از

4
00:00:11,590 –> 00:00:13,000
معنای انجام جریان داده های بیشتر یادگیری ماشینی

5
00:00:13,000 –> 00:00:14,610
و دومی

6
00:00:14,610 –> 00:00:16,420
معرفی چارچوبی است که

7
00:00:16,420 –> 00:00:20,020
برای این منظور داریم. بنابراین فقط برای اینکه

8
00:00:20,020 –> 00:00:23,860
زمینه مشترک یکسانی برای همه داشته باشیم و

9
00:00:23,860 –> 00:00:26,020
چیزی که امروز در مورد آن

10
00:00:26,020 –> 00:00:28,570
صحبت خواهم کرد، فقط موضوع

11
00:00:28,570 –> 00:00:30,580
یادگیری ماشینی را داریم که اکثر شما مردم اکنون با آن آشنا هستید،

12
00:00:30,580 –> 00:00:32,980
بنابراین این یک زیر شاخه از

13
00:00:32,980 –> 00:00:35,379
هوش مصنوعی و آنچه ما هستیم.

14
00:00:35,379 –> 00:00:36,969
این کار این است که به طور خودکار

15
00:00:36,969 –> 00:00:39,879
الگوهایی را در داده‌ها پیدا کنیم.

16
00:00:39,879 –> 00:00:41,739
فرض این است که ماشین‌ها می‌توانند

17
00:00:41,739 –> 00:00:45,010
از الگوها یاد بگیرند که می‌توانند

18
00:00:45,010 –> 00:00:47,789
پیش‌بینی کنند و این با حداقل

19
00:00:47,789 –> 00:00:50,769
تعامل انسان‌ها است، بنابراین

20
00:00:50,769 –> 00:00:52,539
هدفی که ما در یادگیری ماشین

21
00:00:52,539 –> 00:00:54,039
داریم اساساً این است که ما قرار است از

22
00:00:54,039 –> 00:00:56,769
داده‌ها برای ساختن مدل‌های ریاضی استفاده کنیم که

23
00:00:56,769 –> 00:00:59,229
می‌تواند به ما یا توصیفی از

24
00:00:59,229 –> 00:01:02,019
ماهیت آن داده‌ها بدهد، بنابراین با در نظر گرفتن اینکه

25
00:01:02,019 –> 00:01:04,569
ما یادگیری ماشینی استاندارد

26
00:01:04,569 –> 00:01:07,900
داریم، منظور من بیشتر است. افرادی که

27
00:01:07,900 –> 00:01:10,240
با این رویکرد آشنا هستند، مبتنی بر

28
00:01:10,240 –> 00:01:12,549
دسته‌ای از داده‌ها است که به عنوان یادگیری دسته‌ای نیز شناخته می‌شود

29
00:01:12,549 –> 00:01:14,920
و این

30
00:01:14,920 –> 00:01:17,020
حالت هنر برای بسیاری از مشکلات است، بنابراین

31
00:01:17,020 –> 00:01:21,130
این نقطه شروع بسیار خوبی است

32
00:01:21,130 –> 00:01:23,710
که ما در آن قرار داریم و این همان

33
00:01:23,710 –> 00:01:25,780
Pape the خط لوله اولیه برای

34
00:01:25,780 –> 00:01:27,789
یادگیری ماشین روی دسته‌ها، بنابراین اساساً ما

35
00:01:27,789 –> 00:01:29,320
داده‌هایی داریم که در جایی ذخیره

36
00:01:29,320 –> 00:01:31,899
می‌کنیم یا آن را یک ذخیره فیزیکی داریم یا

37
00:01:31,899 –> 00:01:33,670
حافظه داریم و سپس

38
00:01:33,670 –> 00:01:35,649
آن داده‌ها را برای آموزش مدل‌ها

39
00:01:35,649 –> 00:01:37,630
می‌گیریم و وقتی مدل‌های ریاضی را داشتیم،

40
00:01:37,630 –> 00:01:39,460
قرار است به داده‌ها اعمال شود

41
00:01:39,460 –> 00:01:42,100
تا پیش‌بینی‌هایی داشته باشیم که روش استانداردی

42
00:01:42,100 –> 00:01:45,700
برای انجام آن است، اما چالش‌های

43
00:01:45,700 –> 00:01:47,920
اینها در واقع این است که

44
00:01:47,920 –> 00:01:50,170
یادگیری ماشینی جدید نیست،

45
00:01:50,170 –> 00:01:52,780
مدت زیادی است

46
00:01:52,780 –> 00:01:54,929
که وجود داشته است، زمینه بسیار خوبی است. با پشتوانه

47
00:01:54,929 –> 00:02:00,249
تئوری و فنی و

48
00:02:00,249 –> 00:02:04,539
تئوری بسیار قوی و اکنون با

49
00:02:04,539 –> 00:02:07,119
پدیده کلان داده می بینیم که

50
00:02:07,119 –> 00:02:09,310
این در این زمینه پاداش داده شده است بنابراین

51
00:02:09,310 –> 00:02:11,440
اکنون همه این افراد مشغول به کار هستند. در

52
00:02:11,440 –> 00:02:13,270
مورد یادگیری ماشینی و آنچه

53
00:02:13,270 –> 00:02:15,340
اکنون میدان فعال است این است که ما می‌خواهیم یادگیری ماشینی را انجام دهیم،

54
00:02:15,340 –> 00:02:16,569

55
00:02:16,569 –> 00:02:18,939
اساساً می‌خواهیم داده‌های بیشتری

56
00:02:18,939 –> 00:02:22,359
را با در دسترس قرار گرفتن آن‌ها دریافت کنیم و می‌خواهیم

57
00:02:22,359 –> 00:02:25,120
با داده‌ها همگام باشیم، بنابراین یکی از چیزها این

58
00:02:25,120 –> 00:02:27,489
است که همانطور که هستیم تولید داده‌های بیشتر

59
00:02:27,489 –> 00:02:30,280
و سریع‌تر تولید می‌کنیم،

60
00:02:30,280 –> 00:02:31,930
امروز در اینجا در مورد دو عامل صحبت می‌کنیم،

61
00:02:31,930 –> 00:02:34,150
یکی حجم و

62
00:02:34,150 –> 00:02:39,489
دیگری سرعت، بنابراین به عنوان مثال، کشف تقلب در تجارت الکترونیک است،

63
00:02:39,489 –> 00:02:42,849
بنابراین اساساً در اینجا

64
00:02:42,849 –> 00:02:44,620
ما روزانه میلیون‌ها عملیات

65
00:02:44,620 –> 00:02:46,689
انجام می‌دهیم. می‌خواهیم این کار را انجام دهیم این است که

66
00:02:46,689 –> 00:02:49,239
می‌خواهیم تقلب را به سرعت و

67
00:02:49,239 –> 00:02:52,659
به درستی شناسایی کنیم، مسئله این است که

68
00:02:52,659 –> 00:02:54,370
سیستم‌های مالی تکامل می‌یابند و همیشه در

69
00:02:54,370 –> 00:02:56,620
حال تغییر هستند، بنابراین باید با

70
00:02:56,620 –> 00:03:00,669
آن زمینه همگام باشیم و چیز دیگر این است که

71
00:03:00,669 –> 00:03:02,799
ذخیره داده‌ها در این سناریو

72
00:03:02,799 –> 00:03:06,099
واقعاً امکان‌پذیر نیست. واقعاً مانند داده‌هایی

73
00:03:06,099 –> 00:03:08,260
که شاید برای برخی از سال

74
00:03:08,260 –> 00:03:10,829
گذشته بود، دیگر واقعاً مفید نیستند

75
00:03:10,829 –> 00:03:13,090
و مسئله این است که اگر قرار باشد

76
00:03:13,090 –> 00:03:15,639
زمان آموزش را از دست بدهیم، ممکن است

77
00:03:15,639 –> 00:03:18,549
فرصت‌هایی را نیز برای شناسایی برخی از آنها از دست بدهیم.

78
00:03:18,549 –> 00:03:20,709
کلاهبرداری، بنابراین این بسیار مهم است و

79
00:03:20,709 –> 00:03:23,109
این مانند یک عنصر بسیار کلیدی است

80
00:03:23,109 –> 00:03:27,909
که ما زمانی برای از دست دادن آن نداریم، بنابراین

81
00:03:27,909 –> 00:03:29,650
آنچه جایگزین وجود دارد این است که بتوانیم از

82
00:03:29,650 –> 00:03:32,019
جریان های داده و جریان های داده استفاده کنیم،

83
00:03:32,019 –> 00:03:33,159
مهمترین چیز این است که فرض می

84
00:03:33,159 –> 00:03:35,829
کنیم داده ها هستند. بی نهایت است، بنابراین به

85
00:03:35,829 –> 00:03:37,959
طور مداوم در حال آمدن است و کاری

86
00:03:37,959 –> 00:03:39,159
که ما می خواهیم انجام دهیم این است که

87
00:03:39,159 –> 00:03:42,340
مدل ها را به صورت آنلاین نگهداری می کنیم، بنابراین کاری

88
00:03:42,340 –> 00:03:44,979
که می خواهیم انجام دهیم این است که

89
00:03:44,979 –> 00:03:48,069
داده ها را در همان لحظه که

90
00:03:48,069 –> 00:03:49,510
بدون محدودیت در آن هستیم ترکیب کنیم. داده‌های آموزشی

91
00:03:49,510 –> 00:03:51,430
اساساً ما مجموعه قطار نداریم، شما

92
00:03:51,430 –> 00:03:53,260
فقط یک جریان و جریان بی‌نهایت دارید،

93
00:03:53,260 –> 00:03:56,709
اما با توجه به اینکه این نامحدود است، باید از

94
00:03:56,709 –> 00:04:00,459
نظر منابع بسیار کارآمد باشیم و

95
00:04:00,459 –> 00:04:01,780
نکته دیگر این است که همانطور که

96
00:04:01,780 –> 00:04:06,040
قبل از تغییر جریان‌های داده اشاره کردم، بنابراین ما

97
00:04:06,040 –> 00:04:07,540
نیاز داریم برای اینکه بتوانیم خود را با آن

98
00:04:07,540 –> 00:04:11,260
تغییرات تطبیق دهیم و در نهایت ما چون در حال

99
00:04:11,260 –> 00:04:12,759
تطبیق هستیم، مدل های پویا خواهیم داشت،

100
00:04:12,759 –> 00:04:15,280
بنابراین وقتی

101
00:04:15,280 –> 00:04:16,620
در مورد جریان داده صحبت می

102
00:04:16,620 –> 00:04:19,630
کنیم، اساساً ما به دهه 40

103
00:04:19,630 –> 00:04:22,150
می رویم. قرار

104
00:04:22,150 –> 00:04:24,430
است یک نمونه را در یک زمان پردازش کنیم و وقتی این

105
00:04:24,430 –> 00:04:27,520
کار را انجام دادیم تمام شد – از بین می رود زیرا

106
00:04:27,520 –> 00:04:29,260
ما چیزی را نگه نمی داریم، بنابراین

107
00:04:29,260 –> 00:04:30,100
یک نمونه را

108
00:04:30,100 –> 00:04:33,460
که در مدل گنجانده ایم می گیریم و سپس آن را

109
00:04:33,460 –> 00:04:36,490
رها می کنیم زیرا اکنون روزهای بیشتری در

110
00:04:36,490 –> 00:04:39,100
راه است. اشاره کردم که ما

111
00:04:39,100 –> 00:04:41,410
به این دو منبع حافظه

112
00:04:41,410 –> 00:04:44,320
و زمان محدود هستیم، بنابراین

113
00:04:44,320 –> 00:04:49,660
حافظه محدودی داریم و نمی‌توانیم روی بسیاری از آن‌ها کار کنیم،

114
00:04:49,660 –> 00:04:51,130
نمی‌توانیم زمان زیادی را روی

115
00:04:51,130 –> 00:04:53,050
آموزشی که می‌خواهیم در سریع‌ترین زمان ممکن موقعیت‌ها را به دست آوریم، صرف

116
00:04:53,050 –> 00:04:56,110
کنیم. شرط نهایی

117
00:04:56,110 –> 00:04:58,180
این است که ما همیشه می‌خواهیم برای پیش‌بینی دلیل آن آماده باشیم،

118
00:04:58,180 –> 00:05:00,670
زیرا جریان داده‌های eStore

119
00:05:00,670 –> 00:05:02,800
بی‌نهایت است، ما هرگز

120
00:05:02,800 –> 00:05:05,410
آموزش را به پایان نخواهیم رساند.

121
00:05:05,410 –> 00:05:07,030

122
00:05:07,030 –> 00:05:10,630

123
00:05:10,630 –> 00:05:13,000
برای پیش‌بینی در هر نقطه از

124
00:05:13,000 –> 00:05:14,830
زمان، بنابراین به نظر می‌رسد که خط لوله

125
00:05:14,830 –> 00:05:17,500
جریان داده برای یادگیری ماشین در

126
00:05:17,500 –> 00:05:18,880
جریان‌های داده، کمی شبیه به

127
00:05:18,880 –> 00:05:21,460
این است، بنابراین اساساً شما جریانی از

128
00:05:21,460 –> 00:05:23,680
داده‌ها دارید که بی نهایت است، شما یک مدل

129
00:05:23,680 –> 00:05:26,710
در پایین صفحه دارید. at همیشه آماده است، بنابراین

130
00:05:26,710 –> 00:05:28,180
کاری که قرار است انجام شود این است که

131
00:05:28,180 –> 00:05:30,670
از جریان داده‌ها را بخواهد و ما

132
00:05:30,670 –> 00:05:32,770
یا دو گزینه داریم که در صورت یادگیری نظارت شده، داده‌های برچسب‌دار را دریافت کنید

133
00:05:32,770 –> 00:05:34,890
و

134
00:05:34,890 –> 00:05:37,330
اگر داده‌های برچسب‌دار هستند، از آن برای آموزش استفاده می‌کنیم.

135
00:05:37,330 –> 00:05:39,370
و سپس به حالت آماده برمی گردیم،

136
00:05:39,370 –> 00:05:41,650
اگر داده های بدون برچسب دریافت کنیم

137
00:05:41,650 –> 00:05:43,570
، اتفاقی که قرار است بیفتد این است که ما

138
00:05:43,570 –> 00:05:45,250
پیش بینی هایی ارائه می دهیم یا

139
00:05:45,250 –> 00:05:46,570
مدل قرار است پیش بینی هایی ارائه دهد

140
00:05:46,570 –> 00:05:49,840
و سپس به حالت آماده برمی گردد، بنابراین

141
00:05:49,840 –> 00:05:51,430
این کمی متفاوت است. به آنچه

142
00:05:51,430 –> 00:05:52,770
در رویکرد یادگیری دسته‌ای دیده‌ایم

143
00:05:52,770 –> 00:05:55,960
و قبل از آن گفتم که

144
00:05:55,960 –> 00:05:58,840
این یک فرآیند مستمر است، همیشه

145
00:05:58,840 –> 00:06:00,640
به این شکل اتفاق می‌افتد

146
00:06:00,640 –> 00:06:04,270
، پایانی برای آن وجود ندارد، بنابراین چرا این مهم

147
00:06:04,270 –> 00:06:07,770
است، زیرا اساساً ما در حال سرمایه‌گذاری

148
00:06:07,770 –> 00:06:10,690
هستیم. سرمایه گذاری از نظر

149
00:06:10,690 –> 00:06:12,580
اندازه داده که در آن به محدودیت هایی برسیم که

150
00:06:12,580 –> 00:06:15,400
اساساً در یادگیری دسته ای چیزی

151
00:06:15,400 –> 00:06:17,740
که اکنون اتفاق می افتد این است که مشکلات IBA

152
00:06:17,740 –> 00:06:20,440
بزرگتر می شوند و مجموعه داده ها بزرگتر می شوند. ما

153
00:06:20,440 –> 00:06:22,510
باید منابع بیشتری را سرمایه گذاری کنیم.

154
00:06:22,510 –> 00:06:25,300
حافظه زمانی باشد و

155
00:06:25,300 –> 00:06:26,920
این مستلزم هزینه ای نیز خواهد بود

156
00:06:26,920 –> 00:06:28,780
زیرا با بزرگتر شدن مجموعه داده ها

157
00:06:28,780 –> 00:06:30,820
به پلتفرم های

158
00:06:30,820 –> 00:06:32,620
جدید یا سرویس های جدیدی می رویم که در آنجا

159
00:06:32,620 –> 00:06:35,710
این منابع را دریافت می کنیم، سپس در

160
00:06:35,710 –> 00:06:36,760
مقطعی به نقطه ای می رسیم

161
00:06:36,760 –> 00:06:38,950
که این واقعا غیرممکن است زیرا

162
00:06:38,950 –> 00:06:41,620
ممکن است مشکل شما این باشد که خیلی سریع مقیاس بندی می شود،

163
00:06:41,620 –> 00:06:42,390
اما

164
00:06:42,390 –> 00:06:44,190
یا بودجه به سرعت آن بزرگ نمی شود،

165
00:06:44,190 –> 00:06:47,220
بنابراین از طرف دیگر، کاری که

166
00:06:47,220 –> 00:06:48,870
ما با یادگیری جریانی انجام

167
00:06:48,870 –> 00:06:50,340
می دهیم این است که این

168
00:06:50,340 –> 00:06:53,280
منابع را تحت کنترل داشته باشیم. ما

169
00:06:53,280 –> 00:06:56,220
قصد داریم انجام دهیم این است که این سرمایه گذاری که این

170
00:06:56,220 –> 00:06:57,900
خط سرمایه گذاری معقول قرار است انجام

171
00:06:57,900 –> 00:06:59,550
شود هرگز به آن نمی رسد بنابراین ما

172
00:06:59,550 –> 00:07:02,550
می خواهیم آن را ثابت نگه داریم که هدف

173
00:07:02,550 –> 00:07:07,050
این است بنابراین محدودیت های بالاتر از نظر

174
00:07:07,050 –> 00:07:09,720
منابع ابتدا در حافظه ما چیست؟

175
00:07:09,720 –> 00:07:12,810
با افزایش اندازه داده‌ها کنترل می‌شود، بنابراین

176
00:07:12,810 –> 00:07:15,120
اساساً این یک جریان بی‌نهایت است، بنابراین

177
00:07:15,120 –> 00:07:16,770
آنچه ما نمی‌خواهیم انجام دهیم این است

178
00:07:16,770 –> 00:07:18,690
که نمی‌خواهیم مدل به رشد خود ادامه دهد،

179
00:07:18,690 –> 00:07:20,160
زیرا در نهایت

180
00:07:20,160 –> 00:07:23,010
حافظه ما در اندازه دیگر محدود می‌شود.

181
00:07:23,010 –> 00:07:25,980
برای زمان این است که ما می خواهیم به زودی

182
00:07:25,980 –> 00:07:29,670
فقط زمان زیر خطی داشته باشیم زیرا همانطور که

183
00:07:29,670 –> 00:07:31,830
قبلاً گفتم اگر زمان زیادی را برای

184
00:07:31,830 –> 00:07:33,720
چاپ برای یادگیری آنچه قرار است

185
00:07:33,720 –> 00:07:35,070
اتفاق بیفتد سرمایه گذاری کنیم این است که شروع به

186
00:07:35,070 –> 00:07:36,660
از دست دادن داده خواهیم کرد زیرا جریان به

187
00:07:36,660 –> 00:07:39,420
طور مداوم در حال آمدن است بنابراین اگر ما

188
00:07:39,420 –> 00:07:41,550
زمان زیادی را صرف آموزش آنچه که قرار است باشیم می‌کنیم،

189
00:07:41,550 –> 00:07:43,110

190
00:07:43,110 –> 00:07:44,670
در عوض نمونه‌ها را از دست می‌دهیم

191
00:07:44,670 –> 00:07:47,460
و سپس مدل

192
00:07:47,460 –> 00:07:53,060
شما اساساً منسوخ می‌شود، بنابراین این

193
00:07:53,060 –> 00:07:55,560
کمی از آنچه به نظر می‌رسد زمانی است

194
00:07:55,560 –> 00:07:57,750
شما یادگیرندگان دسته ای و یادگیرندگان جریانی را

195
00:07:57,750 –> 00:08:01,320
در این مثال مقایسه کنید، این داده ها که

196
00:08:01,320 –> 00:08:05,010
به طور خاص گفته شد شامل سه دریفت است، آنچه که

197
00:08:05,010 –> 00:08:07,200
ما در مورد آنچه که اشاره می

198
00:08:07,200 –> 00:08:09,660
کنیم وقتی می گوییم دریفت به چه معناست، اساساً

199
00:08:09,660 –> 00:08:12,660
تغییری در مفهوم است که چگونه ممکن است این

200
00:08:12,660 –> 00:08:15,090
اتفاق بیفتد، برای مثال اگر داده های شما

201
00:08:15,090 –> 00:08:17,280
همانطور که قبلاً گفتم در

202
00:08:17,280 –> 00:08:19,590
داده‌های مالی که در حال تغییر هستند و سپس

203
00:08:19,590 –> 00:08:21,120
آنچه در تنظیمات دسته‌ای اتفاق می‌افتد تکامل می‌یابد این است که

204
00:08:21,120 –> 00:08:23,370
شما اساساً مدلی دارید

205
00:08:23,370 –> 00:08:25,650
که در داده‌های متفاوتی استفاده می‌شود.

206
00:08:25,650 –> 00:08:28,230
اکنون

207
00:08:28,230 –> 00:08:31,050
در مورد دیگری استفاده می شود، بنابراین همانطور

208
00:08:31,050 –> 00:08:32,850
که می بینید در این مورد ما فقط

209
00:08:32,850 –> 00:08:35,520
سعی می کنیم جبران کنیم لیسانس

210
00:08:35,520 –> 00:08:37,350
سعی می کند پیش بینی هایی ارائه دهد اما

211
00:08:37,350 –> 00:08:39,870
واقعاً اینطور نیست که در اولین

212
00:08:39,870 –> 00:08:41,970
صرفه جویی باید آن را ببندد فقط

213
00:08:41,970 –> 00:08:44,010
نمی داند در

214
00:08:44,010 –> 00:08:45,660
طرف دیگر چه اتفاقی می افتد اگر در استریم

215
00:08:45,660 –> 00:08:47,190
آموز ببینید پایین می آید زیرا تغییری وجود دارد

216
00:08:47,190 –> 00:08:49,590
اما به سرعت بالا می رود و

217
00:08:49,590 –> 00:08:52,320
این یک مشکل بسیار چالش برانگیز

218
00:08:52,320 –> 00:08:54,170
برای روش دسته ای است.

219
00:08:54,170 –> 00:08:56,329
برخی از تکنیک ها وجود دارد که در آن شما

220
00:08:56,329 –> 00:08:58,430
اساساً همان چیزی هستید که هستید انجام یا کاری که

221
00:08:58,430 –> 00:09:00,290
همه ما در حال حاضر انجام می دهیم این است که اگر شاهد

222
00:09:00,290 –> 00:09:02,300
تعقیب و گریز یا کاهش عملکرد باشیم،

223
00:09:02,300 –> 00:09:03,829
کاری که انجام می دهیم این است که در حال سرمایه گذاری زمان

224
00:09:03,829 –> 00:09:06,560
برای نظارت بر مدل و سپس

225
00:09:06,560 –> 00:09:08,930
راه اندازی آموزش های جدید هستیم و باید

226
00:09:08,930 –> 00:09:11,750
تا پایان آموزش صبر کنیم. تمام شد و

227
00:09:11,750 –> 00:09:14,269
بعد مثل این است که باید دوباره تمام خط لوله را آزمایش کنیم

228
00:09:14,269 –> 00:09:17,630
و این مانند یک

229
00:09:17,630 –> 00:09:21,199
مثال است که اگر نگاه کنید اگر با استریم آموز مقایسه کنید چگونه به نظر می رسد،

230
00:09:21,199 –> 00:09:22,940

231
00:09:22,940 –> 00:09:30,110
بنابراین در این قسمت من فقط

232
00:09:30,110 –> 00:09:32,240
به طور خلاصه در مورد آن صحبت می کنم در مورد نحوه انجام

233
00:09:32,240 –> 00:09:34,040
یادگیری ماشینی و برای این کار من

234
00:09:34,040 –> 00:09:36,260
بر روی یادگیری نظارت شده تمرکز می کنم.

235
00:09:36,260 –> 00:09:40,399
در مورد طبقه بندی صحبت می کنم یک

236
00:09:40,399 –> 00:09:42,230
مثال در طبقه بندی من می

237
00:09:42,230 –> 00:09:43,760
خواهم کمی بیشتر در مورد اینکه

238
00:09:43,760 –> 00:09:46,670
مفهوم رانش به چه معناست و چگونه ما صحبت می کنم ما می‌توانیم

239
00:09:46,670 –> 00:09:49,339
از آن بهره ببریم و در نهایت چگونه

240
00:09:49,339 –> 00:09:52,370
مدل‌ها یا مدل‌های جریانی را ارزیابی می‌کنیم

241
00:09:52,370 –> 00:09:54,079
که این با

242
00:09:54,079 –> 00:09:58,640
نحوه انجام آن در یادگیری دسته‌ای کمی متفاوت است، بنابراین اولین

243
00:09:58,640 –> 00:10:00,350
چیزی که می‌خواهم در مورد این طبقه‌بندی صحبت کنم،

244
00:10:00,350 –> 00:10:03,800
این یک کار بسیار اساسی

245
00:10:03,800 –> 00:10:07,190
یا بسیار رایج است. وظایف امروزی که ما

246
00:10:07,190 –> 00:10:08,839
اساساً یک مجموعه آموزشی داریم وقتی

247
00:10:08,839 –> 00:10:11,149
داده‌های برچسب‌گذاری شده داریم،

248
00:10:11,149 –> 00:10:12,709
ویژگی‌هایی داریم و کلاس‌هایی برای آن

249
00:10:12,709 –> 00:10:14,990
ویژگی‌ها داریم و پس هدف این است

250
00:10:14,990 –> 00:10:18,410
که می‌خواهیم داده‌های جدیدی دریافت کنیم که

251
00:10:18,410 –> 00:10:20,720
بدون برچسب هستند و فقط می‌خواهیم بدهیم.

252
00:10:20,720 –> 00:10:22,370
پیش بینی یک مثال برای

253
00:10:22,370 –> 00:10:26,000
مثال در فیلترهای هرزنامه و یکی از

254
00:10:26,000 –> 00:10:28,370
روش های اصلی برای انجام این کار است یا اینکه

255
00:10:28,370 –> 00:10:31,060
درخت تصمیم چه روش بسیار محبوبی است

256
00:10:31,060 –> 00:10:33,740
شاید اکثر مردم با نحوه

257
00:10:33,740 –> 00:10:35,990
کار درخت تصمیم آشنا باشند اما در هر صورت

258
00:10:35,990 –> 00:10:39,050
اساساً این است که شما

259
00:10:39,050 –> 00:10:41,690
فضای ویژگی را به قسمت‌های مختلف تقسیم می‌کنید، به

260
00:10:41,690 –> 00:10:45,440
عنوان مثال این یک درخت برای مشکلی است

261
00:10:45,440 –> 00:10:47,390
که در آن می‌خواهید ماشین بخرید یا نه،

262
00:10:47,390 –> 00:10:50,180
بنابراین کاری که می‌خواهید انجام دهید این است که

263
00:10:50,180 –> 00:10:53,120
ابتدا می‌خواهید تقسیم کنید.

264
00:10:53,120 –> 00:10:56,089
شروع از بهترین ویژگی پس در

265
00:10:56,089 –> 00:10:59,420
این مورد این است که اگر ماشین را تست شده آورده باشم

266
00:10:59,420 –> 00:11:02,390
یا می توانم این کار را انجام دهم یا نه اگر نه

267
00:11:02,390 –> 00:11:04,370
و قصد رد کردن آن را ندارم

268
00:11:04,370 –> 00:11:06,920
بعد از خرید آن را مدیریت کنم

269
00:11:06,920 –> 00:11:10,550
و مورد بعدی این است که اساساً

270
00:11:10,550 –> 00:11:13,010
شما یک بازگشتی در استقرا دارید که در آن

271
00:11:13,010 –> 00:11:15,260
همه داده ها را می گیرید و سپس درخت را می سازید،

272
00:11:15,260 –> 00:11:20,150
بنابراین این یک روش بسیار خوب است،

273
00:11:20,150 –> 00:11:22,670
روش بسیار محبوب، اما

274
00:11:22,670 –> 00:11:24,770
مشکل دوباره این است که ما به همه

275
00:11:24,770 –> 00:11:28,730
داده ها برای آموزش نیاز داریم. درخت، بنابراین یک راه حل

276
00:11:28,730 –> 00:11:31,670
که در واقع بر این اساس است،

277
00:11:31,670 –> 00:11:34,040
درخت تصمیم گیری بسیار سریع یا درخت نگهدارنده نامیده می شود

278
00:11:34,040 –> 00:11:38,300
و این بر اساس

279
00:11:38,300 –> 00:11:41,510
همان ایده است که شما می توانید یک درخت ایجاد کنید، اما

280
00:11:41,510 –> 00:11:43,370
در این مورد بر اساس این

281
00:11:43,370 –> 00:11:45,560
فرض است که شما فقط به نمونه کوچکی نیاز دارید.

282
00:11:45,560 –> 00:11:51,320
اندازه ها را برای انتخاب تصمیمات تقسیم بندی انتخاب کنید،

283
00:11:51,320 –> 00:11:53,780
بنابراین چگونه این اتفاق می افتد ng

284
00:11:53,780 –> 00:11:56,120
این است که در ابتدا شما فقط

285
00:11:56,120 –> 00:11:58,850
یک گره دارید و سپس باید منتظر

286
00:11:58,850 –> 00:12:00,860
بمانید تا نمونه های کافی را ببینید و

287
00:12:00,860 –> 00:12:03,380
سپس آن گره را تقسیم کنید بنابراین

288
00:12:03,380 –> 00:12:04,610
اساساً

289
00:12:04,610 –> 00:12:06,170
اولین گره را می گیرید و می خواهید

290
00:12:06,170 –> 00:12:08,570
آن را تبدیل کنید. به یک گره تقسیم می‌شوید و سپس

291
00:12:08,570 –> 00:12:10,630
دو گره برگ دارید، توزیع‌ها را تقسیم می‌کنید

292
00:12:10,630 –> 00:12:13,310
و سپس شروع به دریافت

293
00:12:13,310 –> 00:12:18,440
یک درخت واقعی می‌کنید و این مناطق می‌روند چون داده‌های بیشتری دریافت می‌کنیم،

294
00:12:18,440 –> 00:12:20,720
اما بخش مشکل اینجاست که

295
00:12:20,720 –> 00:12:24,050
چگونه تصمیم می‌گیرید چه زمانی باید تقسیم را انجام دهید

296
00:12:24,050 –> 00:12:26,270
و که می‌خواهید

297
00:12:26,270 –> 00:12:27,950
از کل چیز به خوبی استفاده کنید، این

298
00:12:27,950 –> 00:12:32,000
پس‌زمینه ریاضی است که

299
00:12:32,000 –> 00:12:35,690
مبنای این کار برای درخت‌های تصمیم‌گیری است

300
00:12:35,690 –> 00:12:38,450
و اساساً این به شما کمک می‌کند

301
00:12:38,450 –> 00:12:41,630
تا نقطه درستی را که

302
00:12:41,630 –> 00:12:43,760
می‌خواهید تقسیم را انجام دهید، تعریف

303
00:12:43,760 –> 00:12:45,380
کنید. آمار

304
00:12:45,380 –> 00:12:47,450
و می‌خواهم بگویم خوب است در این مرحله من

305
00:12:47,450 –> 00:12:49,340
به اندازه کافی مطمئن هستم که می‌توان سرعت را

306
00:12:49,340 –> 00:12:51,940
انجام داد و سپس شما

307
00:12:51,940 –> 00:12:54,740
درخت را رشد

308
00:12:54,740 –> 00:12:56,980

309
00:12:56,980 –> 00:13:00,350
خواهید داد. درختان تصمیم گیری

310
00:13:00,350 –> 00:13:02,510
و شما بلوک بیش از حد برازش دارید

311
00:13:02,510 –> 00:13:04,900
اساساً آنچه ما داریم این است

312
00:13:04,900 –> 00:13:08,120
که ما تئوری های ریاضی داریم که

313
00:13:08,120 –> 00:13:10,550
به فلز یادگیرنده دسته ای بسیار نزدیک هستیم، بنابراین

314
00:13:10,550 –> 00:13:11,800
این راه حل بسیار خوبی

315
00:13:11,800 –> 00:13:13,839
است که بر اساس

316
00:13:13,839 –> 00:13:17,339
درخت های تصمیم است و با آن اقتباس شده است.

317
00:13:17,339 –> 00:13:22,839
جریان دو بعدی یک سناریو از طرف دیگر

318
00:13:22,839 –> 00:13:28,450
ما شکاف مفهومی داریم آنچه اتفاق می‌افتد

319
00:13:28,450 –> 00:13:30,850
مفهومی است که اساساً

320
00:13:30,850 –> 00:13:33,880
ما محیط‌های غیر ثابت پویا داریم

321
00:13:33,880 –> 00:13:35,769
بنابراین اساساً آنچه در حال

322
00:13:35,769 –> 00:13:38,079
رخ دادن است این است که توزیع داده‌ها

323
00:13:38,079 –> 00:13:40,870
در حال تغییر است بنابراین اگر می‌خواهیم اجازه دهیم

324
00:13:40,870 –> 00:13:44,230
توزیع داده‌ها تغییر کند. کاری

325
00:13:44,230 –> 00:13:46,839
که ما در تمرکز درون نگر انجام

326
00:13:46,839 –> 00:13:48,399
می دهیم این است که

327
00:13:48,399 –> 00:13:51,430
وقتی تغییری را می بینیم سیگنال می دهیم و چرا

328
00:13:51,430 –> 00:13:54,100
این خوب است در واقع

329
00:13:54,100 –> 00:13:56,350
این مشکلی است که ما در جریان داده با آن روبرو هستیم

330
00:13:56,350 –> 00:13:58,620
اما در واقع می تواند بسیار خوب باشد.

331
00:13:58,620 –> 00:14:01,510
دارایی زیرا کاربرد

332
00:14:01,510 –> 00:14:03,339
آشکارسازهای صخره ای مفهومی این است که می توانیم

333
00:14:03,339 –> 00:14:05,589
تغییرات در عملکرد مدل های خود را تشخیص دهیم

334
00:14:05,589 –> 00:14:10,149
و این به طور خودکار انجام می شود، به

335
00:14:10,149 –> 00:14:11,950
عنوان مثال یکی از پربازدیدترین ها lar

336
00:14:11,950 –> 00:14:16,420
متاسفم ابتدا این برخی از الگوهایی است

337
00:14:16,420 –> 00:14:18,730
که می توانید پیدا کنید زمانی که ما در

338
00:14:18,730 –> 00:14:20,980
مورد شکاف مفهومی صحبت می کنیم اساساً در

339
00:14:20,980 –> 00:14:23,589
تغییر ناگهانی که از یک مفهوم به مفهوم دیگر تغییر می کنیم

340
00:14:23,589 –> 00:14:26,500
انتخاب کنید در یک لحظه

341
00:14:26,500 –> 00:14:28,570
نمونه بعدی که در راه است با یک

342
00:14:28,570 –> 00:14:31,029
مفهوم جدید مطابقت دارد. و سپس در

343
00:14:31,029 –> 00:14:32,850
حالت افزایشی ما

344
00:14:32,850 –> 00:14:37,709
مفهوم میانی در طول انتقال یکپارچه

345
00:14:37,709 –> 00:14:40,510
دریفت داریم آن چیزی که داریم این است که ما دو

346
00:14:40,510 –> 00:14:42,490
مفهوم داریم و آنها در یک دوره زمانی در حال تغییر هستند

347
00:14:42,490 –> 00:14:44,520
و در حال

348
00:14:44,520 –> 00:14:46,390
مبادله بین یکدیگر هستند و

349
00:14:46,390 –> 00:14:49,329
سپس یکی از آنها را انتخاب می کنیم. مفهوم تکرارشونده

350
00:14:49,329 –> 00:14:50,800
این بیشتر شبیه

351
00:14:50,800 –> 00:14:52,390
مفاهیم فصلی است که تکرار

352
00:14:52,390 –> 00:14:54,220
می‌شوند و دوباره می‌آیند،

353
00:14:54,220 –> 00:14:56,350
شاید پدیده‌ای باشد که مربوط به

354
00:14:56,350 –> 00:14:58,449
محیط‌هایی باشد که چرخه‌هایی را

355
00:14:58,449 –> 00:15:00,370
داریم، فصل‌ها را داریم و شاید

356
00:15:00,370 –> 00:15:03,279
چیزی شبیه به اتفاقی در تابستان باشد و

357
00:15:03,279 –> 00:15:04,810
بعد ما اتفاق متفاوتی

358
00:15:04,810 –> 00:15:06,190
در زمستان رخ می دهد، اما

359
00:15:06,190 –> 00:15:07,270
تابستان آینده ما می خواهیم چیزی مشابه را ببینیم،

360
00:15:07,270 –> 00:15:10,510
بنابراین

361
00:15:10,510 –> 00:15:12,760
چیز جالب در مورد این یا بخش چالش برانگیز

362
00:15:12,760 –> 00:15:14,980
این است که ما نمی‌خواهیم

363
00:15:14,980 –> 00:15:18,880
نقاط پرت را به‌عنوان تغییر یافته شناسایی کنیم، زیرا

364
00:15:18,880 –> 00:15:22,029
نقاط پرت در داده‌های شما نویز هستند، بنابراین

365
00:15:22,029 –> 00:15:24,520
داده‌های ما می‌توانند نویز داشته باشند، اما ما نمی‌خواهیم

366
00:15:24,520 –> 00:15:25,630
بگوییم خوب است

367
00:15:25,630 –> 00:15:29,380
این نویز را انجام دهید، ما تغییری داریم، بنابراین باید این کار را انجام دهیم.

368
00:15:29,380 –> 00:15:30,730
مطمئناً وقتی در مورد مفهومی صحبت

369
00:15:30,730 –> 00:15:33,550
می کنیم این است که ما واقعاً

370
00:15:33,550 –> 00:15:37,930
یک تغییر را به درستی شناسایی می کنیم و یکی

371
00:15:37,930 –> 00:15:40,060
از روش های رایج برای انجام

372
00:15:40,060 –> 00:15:42,459
آن آشکارساز تغییر odwin یا

373
00:15:42,459 –> 00:15:45,910
پنجره تطبیقی است در این روش کاری که انجام می دهد به طو

374
00:15:45,910 –> 00:15:51,579
کلی این است که فقط یک پنجره از

375
00:15:51,579 –> 00:15:53,949
اده ها را می گیرد و کاری که قرار است انجام شود این

376
00:15:53,949 –> 00:15:55,600
است که دو پنجره فرعی داشته باشد

377
00:15:55,600 –> 00:15:57,490
و

378
00:15:57,490 –> 00:16:00,459
توزیع آن پنجره ها را مشابه نگه دارد، بنابراین

379
00:16:00,459 –> 00:16:02,410
این دو پنجره را زیر نظر خواهد گرفت و

380
00:16:02,410 –> 00:16:05,230
در حالی که داده ها هستند در حالی که داده

381
00:16:05,230 –> 00:16:07,860
ها با همان توزیع مطابقت دارد.

382
00:16:07,860 –> 00:16:10,240
این دو پنجره تغییر نمی‌کنند،

383
00:16:10,240 –> 00:16:12,790
اتفاقی که می‌افتد این است که وقتی

384
00:16:12,790 –> 00:16:14,980
توزیع جدیدی را مشاهده می‌کنید

385
00:16:14,980 –> 00:16:16,810
، یکی از پنجره‌ها

386
00:16:16,810 –> 00:16:19,930
تغییر می‌کند و یکی از زمانی که این اتفاق می‌افتد،

387
00:16:19,930 –> 00:16:21,459
علامت خوبی می‌دهد. تغییری

388
00:16:21,459 –> 00:16:23,259
در توزیع داده‌های شما وجود دارد

389
00:16:23,259 –> 00:16:26,139
که اولین پنجره فرعی را حذف می‌کند و

390
00:16:26,139 –> 00:16:28,000
سپس پنجره دیگری ایجاد می‌کند، بنابراین

391
00:16:28,000 –> 00:16:31,630
همیشه دو پنجره فرعی را نگه می‌دارد،

392
00:16:31,630 –> 00:16:34,209
از نظر زمان

393
00:16:34,209 –> 00:16:37,480
و از نظر منابع بسیار کارآمد

394
00:16:37,480 –> 00:16:39,850
است. تئوری متضاد تضمین

395
00:16:39,850 –> 00:16:42,639
می کند که این دو

396
00:16:42,639 –> 00:16:43,720
پنجره فرعی را با توزیع یکسان حفظ می کند

397
00:16:43,720 –> 00:16:46,439
و یکی از محبوب ترین

398
00:16:46,439 –> 00:16:49,420
الگوریتم هایی است که در جریان داده ها استفاده

399
00:16:49,420 –> 00:16:52,290
می شود و اساساً برای

400
00:16:52,290 –> 00:16:59,199
نظارت خودکار عملکرد مدل ها

401
00:16:59,199 –> 00:17:00,550
مورد استفاده قرار

402
00:17:00,550 –> 00:17:05,319
می گیرد. در مورد ارزیابی است زیرا همانطور

403
00:17:05,319 –> 00:17:07,089
که قبلاً اشاره کردم وقتی

404
00:17:07,089 –> 00:17:12,189
آموزش و ارزیابی را انجام می دهید

405
00:17:12,189 –> 00:17:14,230
تفاوت های کوچکی وجود دارد

پاسخ دهید لغو پاسخ

اکانت vip

دوره آموزش پایتون

مطالب تصادفی

فیلم آموزشی: Ozaria Spirited Away فصل 1.17 آموزش پایتون با راه حل با زیرنویس فارسی

فیلم آموزشی: حل تمرین های برنامه نویسی با پایتون – کد آخر شب با ادواردو با زیرنویس فارسی

فیلم آموزشی: مقایسه دیکشنری ها در پایتون با زیرنویس فارسی

فیلم آموزشی: One Day Builds: اتوماسیون اینستاگرام با استفاده از پایتون با زیرنویس فارسی

فیلم آموزشی: نمایش کدگذاری: شناسایی موجودیت و استخراج شبکه اجتماعی (پایتون) با زیرنویس فارسی

فیلم آموزشی: مقدمه ای بر چارچوب وب بطری برای پایتون با زیرنویس فارسی

فیلم آموزشی: طرح اجرای BIM در پایتون با زیرنویس فارسی

فیلم آموزشی: با استفاده از پایتون یک نمونه کار سهام قاتل بسازید با زیرنویس فارسی

فیلم آموزشی: چاپ زیبای داده های JSON با استفاده از پایتون

فیلم آموزشی: آموزش پوسته معکوس پایتون – 13 – ایجاد موضوعات با زیرنویس فارسی

فیلم آموزشی: پایتون در قسمت جلویی؟ چگونه یک برنامه وب کامل فقط با پایتون بسازیم با زیرنویس فارسی

فیلم آموزشی: مقدمه ای بر علوم کامپیوتر با پایتون – حلقه while با زیرنویس فارسی

فیلم آموزشی: مقدمه ای بر پایتون: فهرست های پایتون با زیرنویس فارسی

فیلم آموزشی: تجزیه و تحلیل داده های اکتشافی (EDA) سری زمانی مالی با استفاده از پایتون | تجسم سری های زمانی با زیرنویس فارسی

فیلم آموزشی: TCS IPA 25 دسامبر 2021 سوال کدگذاری | راه حل پایتون | کدگذار پایتون

فیلم آموزشی: یادگیری ماشین در Power BI با زیرنویس فارسی

پشتیبانی سایت

نماد اعتماد اینماد و زیبال

برای دانلود این فیلم ، عضو vip سایت شوید.

دانلود 17000 فیلم پایتون با پرداخت 15 هزار تومان (عضویت یک ماهه)

مطالب مرتبط: