در این مطلب، ویدئو دارت برای پیشبینی سریهای زمانی (کتابخانه پایتون برای پیشبینی) با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:28:16
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:04,480 –> 00:00:07,759
سلام و خوش آمدید به pi data global 2021
2
00:00:07,759 –> 00:00:10,080
نام من ناتالی است و بسیار خوشحالم
3
00:00:10,080 –> 00:00:11,679
که اینجا هستم و میزبان شما برای این
4
00:00:11,679 –> 00:00:12,719
5
00:00:12,719 –> 00:00:16,400
جلسه هستم. اکنون می خواهم به
6
00:00:16,400 –> 00:00:19,520
اوم فرانچسکو لس لیزیگ در جلسه ما خوش آمد بگویم و او
7
00:00:19,520 –> 00:00:21,439
در مورد دارت صحبت خواهد کرد.
8
00:00:21,439 –> 00:00:23,119
9
00:00:23,119 –> 00:00:26,400
فرانچسکو یک دانشمند داده در واحد 8
10
00:00:26,400 –> 00:00:29,199
با تجربه در پروژه های ml ai در
11
00:00:29,199 –> 00:00:30,480
صنایع
12
00:00:30,480 –> 00:00:33,440
مختلف مانند فاینانس داروسازی و انرژی
13
00:00:33,440 –> 00:00:35,520
در طول مدت حضور خود در واحد 8 است و
14
00:00:35,520 –> 00:00:37,680
همچنین این فرصت را داشته است که به یکی از
15
00:00:37,680 –> 00:00:39,680
مشارکت کنندگان اصلی منبع باز dac تبدیل شود.
16
00:00:39,680 –> 00:00:41,280
17
00:00:41,280 –> 00:00:43,120
کتابخانه و با آن، من به
18
00:00:43,120 –> 00:00:44,879
فرانچسکو صحبت خواهم کرد از شما بسیار سپاسگزارم که امروز به ما ملحق شدید، بسیار
19
00:00:44,879 –> 00:00:46,239
20
00:00:46,239 –> 00:00:49,039
خوب سلام به همه، آه، امروز
21
00:00:49,039 –> 00:00:52,000
قرار است من و جولیان دارت را ارائه کنیم و
22
00:00:52,000 –> 00:00:55,840
اجازه دهید من مستقیماً وارد مقدمه شوم،
23
00:00:55,840 –> 00:00:59,199
بنابراین قبل از اینکه شروع به ارائه دارت کنیم من
24
00:00:59,199 –> 00:01:00,800
در واقع می
25
00:01:00,800 –> 00:01:02,160
خواهم به طور خلاصه چند چیز در مورد
26
00:01:02,160 –> 00:01:04,479
پیش بینی به طور کلی بگویم، بنابراین
27
00:01:04,479 –> 00:01:06,720
چرا پیش بینی برای
28
00:01:06,720 –> 00:01:09,040
تأکید بر جهانی بودن این دسته
29
00:01:09,040 –> 00:01:11,360
از مشکلات مهم است، اجازه دهید
30
00:01:11,360 –> 00:01:13,280
سه مثال ساده را برای شما شرح دهم. از صنایع مختلف
31
00:01:13,280 –> 00:01:14,640
، به
32
00:01:14,640 –> 00:01:16,880
عنوان مثال،
33
00:01:16,880 –> 00:01:18,000
یک
34
00:01:18,000 –> 00:01:19,439
سوال مهم که یک
35
00:01:19,439 –> 00:01:21,840
شرکت خردهفروشی باید به آن پاسخ دهد این است که چه مقدار
36
00:01:21,840 –> 00:01:23,759
از هر محصول را باید بخرد تا مطمئن شود
37
00:01:23,759 –> 00:01:26,159
که خواستههای مشتریان
38
00:01:26,159 –> 00:01:27,040
برآورده میشود
39
00:01:27,040 –> 00:01:30,400
یا به طور مشابه با توجه به اینکه
40
00:01:30,400 –> 00:01:32,640
ذخیرهسازی انرژی هنوز در مراحل ابتدایی خود یک
41
00:01:32,640 –> 00:01:34,880
شرکت انرژی است. باید تقاضای انرژی
42
00:01:34,880 –> 00:01:35,759
43
00:01:35,759 –> 00:01:37,600
را تا حد امکان با تولید آن مطابقت
44
00:01:37,600 –> 00:01:40,000
دهد، بنابراین آنها باید بدانند که
45
00:01:40,000 –> 00:01:42,079
تقاضا چگونه خواهد بود، اما همچنین
46
00:01:42,079 –> 00:01:44,560
تخمینی از آنچه نیروگاه های مختلف
47
00:01:44,560 –> 00:01:46,399
قادر به تولید خواهند بود
48
00:01:46,399 –> 00:01:47,119
و
49
00:01:47,119 –> 00:01:49,600
این همیشه روشن نیست برای مثال برای انرژی خورشیدی فکر کنید.
50
00:01:49,600 –> 00:01:51,520
51
00:01:51,520 –> 00:01:54,000
در نهایت یک ارائهدهنده خدمات اینترنت
52
00:01:54,000 –> 00:01:55,920
باید زیرساخت کافی
53
00:01:55,920 –> 00:01:58,719
برای پشتیبانی از حداکثر استفاده از شبکه
54
00:01:58,719 –> 00:02:00,320
را داشته باشد، منابع جدید را نمیتوان در عرض چند ثانیه نصب کرد،
55
00:02:00,320 –> 00:02:03,119
بنابراین آنها دوباره نیاز به
56
00:02:03,119 –> 00:02:05,119
تخمینی از
57
00:02:05,119 –> 00:02:07,439
آینده دارند و در
58
00:02:07,439 –> 00:02:09,758
این مورد از نظر ترافیک شبکه
59
00:02:09,758 –> 00:02:12,800
و در همه این زمینه ها ما
60
00:02:12,800 –> 00:02:14,720
اطلاعات زیادی در مورد گذشته داریم، اما باید
61
00:02:14,720 –> 00:02:16,480
بدانیم که آینده چگونه خواهد بود.
62
00:02:16,480 –> 00:02:19,200
به عبارت دیگر ما پیشبینیهایی میخواهیم
63
00:02:19,200 –> 00:02:21,440
و به طور دقیقتر، این مشکلات را
64
00:02:21,440 –> 00:02:23,840
میتوان بهعنوان مسائل پیشبینی سریهای زمانی در نظر گرفت،
65
00:02:23,840 –> 00:02:25,280
66
00:02:25,280 –> 00:02:27,680
بنابراین همانطور
67
00:02:27,680 –> 00:02:30,560
که بیشتر شما احتمالاً از قبل میدانید یک
68
00:02:30,560 –> 00:02:33,040
سری زمانی صرفاً فهرستی از مقادیر است که
69
00:02:33,040 –> 00:02:35,360
به ترتیب زمانی نمایهسازی شدهاند که در آن
70
00:02:35,360 –> 00:02:37,920
فاصله بین زمان وجود دارد. شاخصها ثابت هستند
71
00:02:37,920 –> 00:02:39,519
و این مقادیر میتوانند
72
00:02:39,519 –> 00:02:42,239
هر چیزی را از جمعیت جهان در سال گرفته
73
00:02:42,239 –> 00:02:42,959
تا
74
00:02:42,959 –> 00:02:45,680
نرخ مبادله ساعتی بین
75
00:02:45,680 –> 00:02:47,840
دلار و یورو نشان دهند، به عنوان مثال
76
00:02:47,840 –> 00:02:50,319
سری زمانی که در اینجا میبینید در
77
00:02:50,319 –> 00:02:52,720
واقع تولید انرژی
78
00:02:52,720 –> 00:02:56,720
روزانه یک نیروگاه برق
79
00:02:56,720 –> 00:02:59,280
آبی را نشان میدهد. انواع دادهها
80
00:02:59,280 –> 00:03:01,840
تا لحظه حال گسترش مییابند و
81
00:03:01,840 –> 00:03:03,760
حدس زدن در مورد مسیر
82
00:03:03,760 –> 00:03:05,680
سری زمانی فراتر از زمان حال
83
00:03:05,680 –> 00:03:08,879
، پیشبینی سریهای زمانی است،
84
00:03:08,879 –> 00:03:11,519
بنابراین راهحل همه مشکلاتی که
85
00:03:11,519 –> 00:03:13,760
قبلاً در مورد آنها صحبت کردیم، میتواند به شکلی
86
00:03:13,760 –> 00:03:16,879
حل شود، اگر بتوانیم
87
00:03:16,879 –> 00:03:19,599
پیش بینی سری های زمانی دقیق را انجام دهید و
88
00:03:19,599 –> 00:03:21,599
فقط برای اینکه
89
00:03:21,599 –> 00:03:23,920
در مورد مدلی که تولید می کند صحبت کنید کمی دقیق تر باشیم به عنوان یک
90
00:03:23,920 –> 00:03:26,080
پیشبینی، به تابعی اشاره میکنیم
91
00:03:26,080 –> 00:03:28,400
که میتواند هم تاریخچه
92
00:03:28,400 –> 00:03:31,360
خود متغیر هدف و هم سایر
93
00:03:31,360 –> 00:03:34,000
دادههای خارجی را در نظر
94
00:03:34,000 –> 00:03:36,720
بگیرد، اما در حالی که بسیاری از مشکلات را میتوان به
95
00:03:36,720 –> 00:03:38,799
راحتی بهعنوان مسائل پیشبینی سری زمانی در
96
00:03:38,799 –> 00:03:40,959
نظر گرفت، همه آنها لزوما
97
00:03:40,959 –> 00:03:42,080
قابل حل نیستند،
98
00:03:42,080 –> 00:03:42,799
99
00:03:42,799 –> 00:03:44,720
بنابراین سری زمانی که میخواهید پیشبینی کنید
100
00:03:44,720 –> 00:03:47,280
باید حاوی یک سیگنال واقعی باشد و
101
00:03:47,280 –> 00:03:49,040
مهم است بدانید
102
00:03:49,040 –> 00:03:51,120
که چه عواملی بر سیگنال تأثیر میگذارند،
103
00:03:51,120 –> 00:03:54,480
خواه این خود هدف باشد یا
104
00:03:54,480 –> 00:03:58,080
سایر عواملی که میتوانند بر آن تأثیر بگذارند،
105
00:03:58,080 –> 00:04:01,519
اگر میدانید که
106
00:04:01,519 –> 00:04:03,760
متغیرهای لازم را دارید، پس وجود دارد. شانس خوبی است
107
00:04:03,760 –> 00:04:05,280
که با استفاده از
108
00:04:05,280 –> 00:04:07,360
مدل پیشبینی درست، حداقل برخی از
109
00:04:07,360 –> 00:04:09,439
انواع دادههای شما را بتوان در آینده پیشبینی کرد
110
00:04:09,439 –> 00:04:11,360
و مردم دهها سال است
111
00:04:11,360 –> 00:04:13,439
که روی این نوع مدلها کار میکنند
112
00:04:13,439 –> 00:04:15,519
و طیف وسیعی از
113
00:04:15,519 –> 00:04:18,079
رویکردهای ممکن وجود دارد و خوشبختانه برای
114
00:04:18,079 –> 00:04:21,040
شما ما کتابخانه ای ایجاد کرده ایم
115
00:04:21,040 –> 00:04:22,960
که بسیاری از بهترین رویکردهای
116
00:04:22,960 –> 00:04:26,720
امروزی را در یک اکوسیستم یکپارچه ادغام می کند،
117
00:04:26,720 –> 00:04:30,080
بنابراین کتابخانه پایتون ما را وارد دارت کنید.
118
00:04:30,080 –> 00:04:32,160
دستکاری و پیشبینی آسان
119
00:04:32,160 –> 00:04:33,919
سریهای زمانی
120
00:04:33,919 –> 00:04:36,160
و تمرکز کتابخانه و
121
00:04:36,160 –> 00:04:38,479
بهویژه این
122
00:04:38,479 –> 00:04:41,280
ارائه، بخش پیشبینی است، بنابراین
123
00:04:41,280 –> 00:04:42,720
کارکرد اصلی دارت این است که از یک
124
00:04:42,720 –> 00:04:44,800
سری زمانی تاریخی مانند آنچه
125
00:04:44,800 –> 00:04:47,600
قبلا دیدید به پیشبینی آن
126
00:04:47,600 –> 00:04:49,919
کمیت به البته در آینده
127
00:04:49,919 –> 00:04:51,919
تغییرات بیشماری از این مشکل
128
00:04:51,919 –> 00:04:53,759
و راههای متعددی برای رویارویی با آن وجود دارد، اما
129
00:04:53,759 –> 00:04:55,520
قبل از اینکه به تمام روشهای مختلف بپردازیم
130
00:04:55,520 –> 00:04:57,680
که میتوانید از دارت برای مقابله با این
131
00:04:57,680 –> 00:05:00,080
مشکلات پیشبینی استفاده کنید، اجازه دهید برخی
132
00:05:00,080 –> 00:05:02,560
از اصول کلیدی را که راهنمایی میکنند و هنوز هم هدایت میکنند، بیان
133
00:05:02,560 –> 00:05:04,880
کنم. روشی که ما هنر را توسعه دادیم،
134
00:05:04,880 –> 00:05:06,400
بنابراین
135
00:05:06,400 –> 00:05:08,639
دارت های اول حول یک کلاس سری زمانی ساخته می
136
00:05:08,639 –> 00:05:11,759
شوند، این واحد پول دارت است
137
00:05:11,759 –> 00:05:13,199
که می توان گفت و رابطی را ارائه می
138
00:05:13,199 –> 00:05:16,080
دهد که برای
139
00:05:16,080 –> 00:05:18,160
پیش
140
00:05:18,160 –> 00:05:20,639
بینی مدل های پیش بینی دوم بهینه شده است و دارت ها
141
00:05:20,639 –> 00:05:22,479
با یک رابط ساده و پیش بینی یکسان می
142
00:05:22,479 –> 00:05:23,680
143
00:05:23,680 –> 00:05:26,479
شوند. به عنوان مثال در یادگیری دوم مشاهده می شود، بنابراین
144
00:05:26,479 –> 00:05:28,320
این بدان معنی است که درهای داخلی خطوط لوله
145
00:05:28,320 –> 00:05:30,080
بسیار مدولار هستند و
146
00:05:30,080 –> 00:05:32,240
مدل های مختلف پیش بینی می توانند آسان باشند. در
147
00:05:32,240 –> 00:05:33,840
148
00:05:33,840 –> 00:05:36,560
مرحله سوم، ما فکر می کنیم ارائه
149
00:05:36,560 –> 00:05:39,600
مدل های پیچیده پیشرفته
150
00:05:39,600 –> 00:05:42,400
و همگام شدن
151
00:05:42,400 –> 00:05:44,639
با تحقیقات فعلی مهم است، اما در عین
152
00:05:44,639 –> 00:05:47,199
حال رویکردهای آماری محکمی را حفظ می
153
00:05:47,199 –> 00:05:49,840
کنیم، زیرا ما معتقدیم
154
00:05:49,840 –> 00:05:51,600
مدل ها یا مدل ها قدرتمند هستند، اما همیشه باید
155
00:05:51,600 –> 00:05:55,039
در کنار
156
00:05:55,039 –> 00:05:57,280
خطوط باس معقول که سادهتر هستند استفاده شود
157
00:05:57,280 –> 00:05:58,560
و در آخر
158
00:05:58,560 –> 00:06:00,880
ما واقعاً میخواهیم استفاده از دارت آسان باشد،
159
00:06:00,880 –> 00:06:02,960
دو مثال برای این کار،
160
00:06:02,960 –> 00:06:04,880
رابطهای بصری
161
00:06:04,880 –> 00:06:07,039
و پارامترهای پیشفرض معقول هستند و
162
00:06:07,039 –> 00:06:10,560
163
00:06:10,560 –> 00:06:13,039
بعداً قبل از پایان دادن به این موضوع، اطلاعات بیشتری در مورد معنای آن خواهید دید. مقدمه
164
00:06:13,039 –> 00:06:15,039
میخواهم یک ایده کلی از تمام
165
00:06:15,039 –> 00:06:17,520
ابزارهایی که دارت ارائه میدهد به شما ارائه
166
00:06:17,520 –> 00:06:19,280
دهم، زیرا امروز زمانی برای صحبت در مورد همه
167
00:06:19,280 –> 00:06:21,440
آنها نخواهیم داشت و نگران
168
00:06:21,440 –> 00:06:23,919
خواندن تک تک کادرهای متنی در اینجا نباشید، فقط میخواهم
169
00:06:23,919 –> 00:06:25,680
به این نکته اشاره کنم. که
170
00:06:25,680 –> 00:06:27,520
در حالی که قلب دارت قطعا
171
00:06:27,520 –> 00:06:29,840
بخش پیش بینی است، اما همچنین
172
00:06:29,840 –> 00:06:32,240
با سایر عملکردهای مرتبط
173
00:06:32,240 –> 00:06:34,880
مورد نیاز قبل و بعد از پیش بینی
174
00:06:34,880 –> 00:06:37,600
ارائه می شود که اساسا بسته ما یک
175
00:06:37,600 –> 00:06:40,000
جعبه ابزار انتها به انتها که از
176
00:06:40,000 –> 00:06:42,160
کشف داده تا پیش پردازش تا
177
00:06:42,160 –> 00:06:45,199
پیشبینی و تا ارزیابی مدل میرود،
178
00:06:45,199 –> 00:06:47,600
179
00:06:47,600 –> 00:06:49,759
بنابراین اکنون میخواهم یک
180
00:06:49,759 –> 00:06:52,000
نمای کلی از
181
00:06:52,000 –> 00:06:54,639
گردش کار اصلی دارت به شما ارائه دهم
182
00:06:54,639 –> 00:06:56,880
و اجازه دهید اساسیترین
183
00:06:56,880 –> 00:06:59,440
عملکردهای کتابخانه را با استفاده از آن بررسی کنیم. به
184
00:06:59,440 –> 00:07:02,160
عنوان مثال، این سری زمانی
185
00:07:02,160 –> 00:07:04,880
تولید حالت ماهانه به ازای هر گاو را بر حسب
186
00:07:04,880 –> 00:07:06,000
پوند نشان می دهد
187
00:07:06,000 –> 00:07:09,039
و ما می خواهیم مدلی ایجاد کنیم که
188
00:07:09,039 –> 00:07:10,960
سری آموزشی را که به رنگ سیاه نشان داده شده است را در نظر گرفته
189
00:07:10,960 –> 00:07:13,680
و پیش بینی
190
00:07:13,680 –> 00:07:16,960
سری اعتبار سنجی را به رنگ آبی تولید کند، بنابراین هدف این است
191
00:07:16,960 –> 00:07:19,360
که یک پیش بینی تولید کنیم که
192
00:07:19,360 –> 00:07:21,280
تا حد امکان به سری
193
00:07:21,280 –> 00:07:22,720
اصلی نزدیک
194
00:07:22,720 –> 00:07:23,919
است
195
00:07:23,919 –> 00:07:25,919
و در اسلایدهای بعدی با قدم گذاشتن در عملکردهای اصلی مختلف دارت،
196
00:07:25,919 –> 00:07:27,840
به آن هدف نزدیکتر و نزدیکتر خواهیم شد،
197
00:07:27,840 –> 00:07:29,599
198
00:07:29,599 –> 00:07:33,120
199
00:07:33,120 –> 00:07:34,880
بنابراین اول از همه
200
00:07:34,880 –> 00:07:37,360
شی سری زمانی،
201
00:07:37,360 –> 00:07:39,520
انتزاع اصلی ارائه شده توسط دارت و ما میتوانیم
202
00:07:39,520 –> 00:07:41,759
به راحتی یکی را
203
00:07:41,759 –> 00:07:44,160
به عنوان مثال از یک فایل csv نمونهسازی کنیم، اما
204
00:07:44,160 –> 00:07:46,080
بسیاری از نقاط شروع دیگر نیز وجود دارد که میتوانیم به
205
00:07:46,080 –> 00:07:47,840
206
00:07:47,840 –> 00:07:50,479
عنوان مثال فریمهای داده آرایههای numpy و
207
00:07:50,479 –> 00:07:51,440
208
00:07:51,440 –> 00:07:54,080
غیره استفاده کنیم. این کلاس روشهای مفید زیادی را
209
00:07:54,080 –> 00:07:56,240
برای دستکاری و تجسم
210
00:07:56,240 –> 00:07:59,520
اشیاء سری زمانی در زیر پوشش ارائه میکند، ما
211
00:07:59,520 –> 00:08:02,160
از یک شی آرایه داده اشعه ایکس برای
212
00:08:02,160 –> 00:08:05,199
ذخیره دادههای واقعی استفاده میکنیم
213
00:08:05,440 –> 00:08:07,199
تا دنبالههایی را ایجاد کنیم تا
214
00:08:07,199 –> 00:08:09,280
مدل خود را برازش و اعتبار سنجی کنیم.
215
00:08:09,280 –> 00:08:11,360
از کلاس سری زمانی،
216
00:08:11,360 –> 00:08:13,120
217
00:08:13,120 –> 00:08:14,800
یکی از راههای پارامتری کردن این تابع،
218
00:08:14,800 –> 00:08:16,319
ارائه کسری از نقاطی است که
219
00:08:16,319 –> 00:08:19,840
در دنباله اول
220
00:08:20,319 –> 00:08:23,360
میخواهیم و اکنون که یک دنباله آموزشی
221
00:08:23,360 –> 00:08:25,680
داریم، میتوانیم از یکی
222
00:08:25,680 –> 00:08:27,440
از مدلهای پیشبینی متعددی که دارس
223
00:08:27,440 –> 00:08:28,560
ارائه میکند، استفاده کنیم.
224
00:08:28,560 –> 00:08:30,960
یک مدل کلاسیک هموارسازی نمایی است
225
00:08:30,960 –> 00:08:33,760
که میتوانیم به راحتی
226
00:08:33,760 –> 00:08:36,240
مدل خود را متناسب با آن نمونهسازی کنیم و یک پیشبینی در
227
00:08:36,240 –> 00:08:38,159
سه خط کد ساده ایجاد کنیم،
228
00:08:38,159 –> 00:08:40,320
تابع پیشبینی به سادگی
229
00:08:40,320 –> 00:08:42,880
تعداد مراحل زمانی را پس از پایان
230
00:08:42,880 –> 00:08:44,720
سری ورودی که میخواهیم برای آن
231
00:08:44,720 –> 00:08:46,160
ایجاد کنیم، میپذیرد. پیش بینی
232
00:08:46,160 –> 00:08:47,040
و
233
00:08:47,040 –> 00:08:49,519
با بررسی بصری پیش بینی ما در
234
00:08:49,519 –> 00:08:51,760
سمت راست می بینیم که
235
00:08:51,760 –> 00:08:54,560
مدلی داریم که اگرچه کامل
236
00:08:54,560 –> 00:08:57,120
نیست از روند و فصلی بودن آن استفاده می کند.
237
00:08:57,120 –> 00:08:59,279
دنباله ورودی و برون یابی آنها
238
00:08:59,279 –> 00:09:01,519
در آینده
239
00:09:01,519 –> 00:09:03,279
یکی از مزایای اصلی استفاده از
240
00:09:03,279 –> 00:09:06,720
دارت این است که ما طیف گسترده ای از
241
00:09:06,720 –> 00:09:08,320
مدل های پیش بینی مختلف را برای انتخاب ارائه می
242
00:09:08,320 –> 00:09:09,360
243
00:09:09,360 –> 00:09:12,640
دهیم، بنابراین بیایید جلو برویم و مدل دیگری را امتحان کنیم تا
244
00:09:12,640 –> 00:09:14,480
این مدل تتا مرجانی باشد
245
00:09:14,480 –> 00:09:17,279
و مانند صاف کردن نمایی
246
00:09:17,279 –> 00:09:19,680
مرتب سازی شود. در دسته
247
00:09:19,680 –> 00:09:22,240
مدلهای پیشبینی آماری سادهتر قرار میگیرد
248
00:09:22,240 –> 00:09:25,200
و مانند قبل در سه
249
00:09:25,200 –> 00:09:26,640
خط کد میتوانیم پیشبینیای
250
00:09:26,640 –> 00:09:29,120
بهدست آوریم که حداقل از نظر بصری نسبتاً مناسب به نظر میرسد.
251
00:09:29,120 –> 00:09:31,360
252
00:09:31,360 –> 00:09:32,800
253
00:09:32,800 –> 00:09:34,800
254
00:09:34,800 –> 00:09:36,880
یا پارامترهای هایپر برای
255
00:09:36,880 –> 00:09:40,160
مدل ها همانطور که قبلاً ذکر شد هنگام
256
00:09:40,160 –> 00:09:41,519
صحبت در مورد اصول پشت
257
00:09:41,519 –> 00:09:43,519
دارت، ما تأکید زیادی بر
258
00:09:43,519 –> 00:09:45,680
اختصاص پارامترهای پیش فرض معقول
259
00:09:45,680 –> 00:09:47,760
به مدل ها داریم، بنابراین معمولاً حتی بدون
260
00:09:47,760 –> 00:09:50,800
تعیین چیزی در مورد یک مدل هنگام
261
00:09:50,800 –> 00:09:53,279
ایجاد آن، شانس خوبی وجود دارد که از
262
00:09:53,279 –> 00:09:55,680
قبل بتوانید آن را بدست آورید. یک نتیجه
263
00:09:55,680 –> 00:09:57,760
خوب از
264
00:09:57,760 –> 00:09:59,760
265
00:09:59,760 –> 00:10:02,399
266
00:10:02,399 –> 00:10:04,959
جعبه به عنوان مثال، مدل تتا را
267
00:10:04,959 –> 00:10:07,519
میتوانیم به صورت دستی پارامتر تتا را تنظیم کنیم
268
00:10:07,519 –> 00:10:09,760
که منجر به رفتار مدل متفاوتی میشود
269
00:10:09,760 –> 00:10:10,880
270
00:10:10,880 –> 00:10:14,240
و در اینجا میتوانیم آن را به صورت دستی روی یک تنظیم کنیم
271
00:10:14,240 –> 00:10:16,959
و دوباره پیشبینی را از نظر بصری قضاوت کنیم
272
00:10:16,959 –> 00:10:19,600
، حدس میزنم که به نظر خیلی خوب است اما
273
00:10:19,600 –> 00:10:21,440
در واقع کمی بدتر از مدل پیشفرض
274
00:10:21,440 –> 00:10:23,519
است. به مدل
275
00:10:23,519 –> 00:10:24,480
قبلی میماند،
276
00:10:24,480 –> 00:10:26,079
اما البته
277
00:10:26,079 –> 00:10:28,000
در اینجا هنگام قضاوت در مورد کیفیت پیشبینیها باید کمی دقیقتر باشیم،
278
00:10:28,000 –> 00:10:30,880
بنابراین چگونه میتوانیم بگوییم کدام
279
00:10:30,880 –> 00:10:33,600
مدل بهتر است و برای این دارت
280
00:10:33,600 –> 00:10:34,640
281
00:10:34,640 –> 00:10:37,120
طیف گستردهای از معیارهای مختلف را
282
00:10:37,120 –> 00:10:39,600
ارائه میکند که با توجه به یک پیشبینی و حقیقت زمینی
283
00:10:39,600 –> 00:10:41,920
به یک اسکالر یک مقدار اسکالر می
284
00:10:41,920 –> 00:10:44,000
دهد که کیفیت یک پیش بینی را نشان می دهد، به
285
00:10:44,000 –> 00:10:46,399
عنوان مثال می توانیم از متریک نقشه
286
00:10:46,399 –> 00:10:47,839
که مخفف میانگین
287
00:10:47,839 –> 00:10:50,600
درصد مطلق خطا است استفاده کنیم که حدس می زنم باید به
288
00:10:50,600 –> 00:10:52,959
خودی خود توضیح دهد که چیست
289
00:10:52,959 –> 00:10:56,560
و یا می توانیم از متریک masc استفاده کنیم.
290
00:10:56,560 –> 00:10:58,160
مخفف
291
00:10:58,160 –> 00:11:00,320
میانگین خطای مقیاس شده مطلق است، بنابراین این یک
292
00:11:00,320 –> 00:11:02,880
متریک uh با بسیاری از ویژگی های مطلوب
293
00:11:02,880 –> 00:11:05,519
برای پیش بینی سری های زمانی به ویژه
294
00:11:05,519 –> 00:11:07,360
uh است و در واقع به یک اضافه نیاز دارد.
295
00:11:07,360 –> 00:11:09,680
پارامتر l نیز بنابراین
296
00:11:09,680 –> 00:11:11,680
تغییراتی در این معیارها و
297
00:11:11,680 –> 00:11:13,600
نحوه استفاده از آنها وجود دارد،
298
00:11:13,600 –> 00:11:16,880
اما اجازه دهید فعلاً به نقشه پایبند باشیم،
299
00:11:16,880 –> 00:11:18,720
بنابراین پس از
300
00:11:18,720 –> 00:11:21,200
محاسبه امتیاز برای هر دو پیش بینی، می توانیم ببینیم
301
00:11:21,200 –> 00:11:22,800
که تتا کمی بهتر از
302
00:11:22,800 –> 00:11:24,880
هموارسازی نمایی است، به این معنی که
303
00:11:24,880 –> 00:11:28,399
تا کنون این برنده
304
00:11:28,399 –> 00:11:30,000
ما است،
305
00:11:30,000 –> 00:11:31,920
ما باید در اینجا مراقب باشیم، اگرچه اگر به آزمایش
306
00:11:31,920 –> 00:11:33,519
مدلها و پارامترهای مختلف برای
307
00:11:33,519 –> 00:11:36,160
این تنظیمات ادامه دهیم، به
308
00:11:36,160 –> 00:11:38,800
این تقسیم اعتبار قطار خاص اضافه میشویم، اما
309
00:11:38,800 –> 00:11:40,720
خوشبختانه راه بهتری در دارت
310
00:11:40,720 –> 00:11:42,480
برای ارزیابی مدلها و هایپرپارامترهای مختلف
311
00:11:42,480 –> 00:11:44,079
312
00:11:44,079 –> 00:11:46,959
وجود دارد. یک تنظیم میلی لیتری کلاسیک، میتوانیم
313
00:11:46,959 –> 00:11:48,560
کاری شبیه اعتبارسنجی متقاطع تصادفی انجام دهیم،
314
00:11:48,560 –> 00:11:50,399
اما در یک الگوی پیشبینی سریهای زمانی،
315
00:11:50,399 –> 00:11:53,760
این به
316
00:11:53,760 –> 00:11:56,560
دلایل مختلفی مشکلساز است، بنابراین آنچه
317
00:11:56,560 –> 00:11:58,320
باید انجام دهیم چیزی به نام پیشبینی تاریخی است که
318
00:11:58,320 –> 00:12:00,000
319
00:12:00,000 –> 00:12:03,120
در اصل از خود این سوال را میپرسیم
320
00:12:03,120 –> 00:12:05,760
که یک مدل چگونه عمل میکند.
321
00:12:05,760 –> 00:12:07,680
اگر در گذشته مکرراً برای
322
00:12:07,680 –> 00:12:09,839
تولید پیشبینی استفاده شده باشد،
323
00:12:09,839 –> 00:12:11,519
دارت دو تابع
324
00:12:11,519 –> 00:12:13,839
تاریخی است پیشبینیها و آزمایشهای برگشتی
325
00:12:13,839 –> 00:12:16,160
تنها تفاوت اینجا این است که اولی
326
00:12:16,160 –> 00:12:18,560
پیشبینی واقعی را برمیگرداند در حالی که
327
00:12:18,560 –> 00:12:21,120
این پیشبینی یک قدم جلوتر میرود و
328
00:12:21,120 –> 00:12:22,639
معیارهای خطا را
329
00:12:22,639 –> 00:12:25,200
مستقیماً تولید میکند، اما در حال حاضر فقط از
330
00:12:25,200 –> 00:12:28,240
روش پیشبینی تاریخی استفاده میکنیم، بنابراین
331
00:12:28,240 –> 00:12:30,079
روش کار به این صورت است، بنابراین شروع میکنیم. با یک
332
00:12:30,079 –> 00:12:31,760
333
00:12:31,760 –> 00:12:34,000
دنباله در شروع سری زمانی ما به عنوان دنباله آموزشی اولیه
334
00:12:34,000 –> 00:12:35,920
و پیش بینی چند عنصر بعدی،
335
00:12:35,920 –> 00:12:38,079
سپس دنباله آموزشی خود را با
336
00:12:38,079 –> 00:12:40,240
تعدادی گام زمانی ارسال می کنیم و دوباره پیش بینی ای تولید می کنیم
337
00:12:40,240 –> 00:12:42,079
که در آینده کمی بیشتر
338
00:12:42,079 –> 00:12:44,880
از قبلی است. و
339
00:12:44,880 –> 00:12:47,200
اساساً این کار را تکرار می کنیم تا به پایان سری زمانی برسیم،
340
00:12:47,200 –> 00:12:49,519
341
00:12:49,519 –> 00:12:51,440
بنابراین هر مدل پیش بینی در دارت
342
00:12:51,440 –> 00:12:54,720
این روش پیش بینی تاریخی را دارد و همانطور
343
00:12:54,720 –> 00:12:56,880
که در سمت چپ می بینید
344
00:12:56,880 –> 00:12:59,440
استفاده از آن و تولید
345
00:12:59,440 –> 00:13:01,839
پیش بینی های تاریخی همانطور که در تصویر مشاهده می شود بسیار ساده است.
346
00:13:01,839 –> 00:13:03,120
سمت راست،
347
00:13:03,120 –> 00:13:03,839
بنابراین
348
00:13:03,839 –> 00:13:05,440
ما میتوانیم از این روش برای
349
00:13:05,440 –> 00:13:06,800
ارزیابی بهتر مدلهای مختلف و
350
00:13:06,800 –> 00:13:10,000
ترکیبهای فراپارامتر استفاده
351
00:13:10,000 –> 00:13:10,880
352
00:13:10,880 –> 00:13:13,279
کنیم و میخواهیم از این قابلیت برای آزمایش
353
00:13:13,279 –> 00:13:14,399
354
00:13:14,399 –> 00:13:16,720
کامهای مختلف استفاده کنیم. بایناسیون ها و همچنین
355
00:13:16,720 –> 00:13:19,120
مدل های مختلف، اما به جای انجام
356
00:13:19,120 –> 00:13:20,720
دستی این کار
357
00:13:20,720 –> 00:13:23,040
، حداقل قسمت پارامترهایپر، می
358
00:13:23,040 –> 00:13:25,120
توانیم از روش جستجوی شبکه ای خود برای خودکارسازی
359
00:13:25,120 –> 00:13:26,880
این فرآیند استفاده کنیم،
360
00:13:26,880 –> 00:13:28,959
بنابراین برای انجام این کار، به سادگی
361
00:13:28,959 –> 00:13:31,040
فضای پارامتری را که می خواهیم
362
00:13:31,040 –> 00:13:34,320
در یک فرهنگ لغت جستجو کنیم، تعریف می کنیم
363
00:13:34,320 –> 00:13:35,680
و سپس ما تابع جستجوی شبکه
364
00:13:35,680 –> 00:13:37,760
ای را کلاس مدلی می نامیم که می خواهیم
365
00:13:37,760 –> 00:13:40,480
در اینجا بهینه سازی کنیم، ما فقط سری آموزشی را
366
00:13:40,480 –> 00:13:42,480
به تابع جستجوی شبکه می دهیم تا
367
00:13:42,480 –> 00:13:46,639
از تطبیق بیش از حد در مجموعه اعتبار سنجی جلوگیری کنیم،
368
00:13:46,639 –> 00:13:47,440
بنابراین
369
00:13:47,440 –> 00:13:49,519
در سمت چپ، پیش بینی ای را
370
00:13:49,519 –> 00:13:52,000
که از مدل داده پیش فرض به دست آوردیم، مشاهده می کنید.
371
00:13:52,000 –> 00:13:54,560
و در سمت راست
372
00:13:54,560 –> 00:13:56,800
عملکرد بهدستآمده توسط مدل داده بهینهشده را میبینید
373
00:13:56,800 –> 00:13:58,160
374
00:13:58,160 –> 00:14:00,000
که توسط تابع جستجوی شبکه برگردانده شده است،
375
00:14:00,000 –> 00:14:01,040
376
00:14:01,040 –> 00:14:03,199
بنابراین میتوانید ببینید که ما میتوانیم
377
00:14:03,199 –> 00:14:05,440
عملکرد را بدون
378
00:14:05,440 –> 00:14:07,519
نگاه کردن به مجموعه اعتبار سنجی بیشتر بهبود دهیم، بنابراین
379
00:14:07,519 –> 00:14:10,079
این برنده نهایی ما خواهد بود.
380
00:14:10,079 –> 00:14:13,519
این نمایش بسیار کوتاه و
381
00:14:13,519 –> 00:14:15,839
همه اینها البته یک مثال بسیار ساده و
382
00:14:15,839 –> 00:14:18,079
ایده آل در بیشتر
383
00:14:18,079 –> 00:14:20,480
موقعیت های دنیای واقعی بود، رسیدگی به آن به این آسانی نخواهد بود.
384
00:14:20,480 –> 00:14:21,440
385
00:14:21,440 –> 00:14:24,160
با پیشبینیها، بنابراین ممکن است به ابزارهای اضافی نیاز داشته باشید
386
00:14:24,160 –> 00:14:25,600
387
00:14:25,600 –> 00:14:27,680