در این مطلب، ویدئو ARIMA در پایتون End to End | پیاده سازی ARIMA برای پیش بینی سری های زمانی در پایتون با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:16:28
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,000 –> 00:00:01,760
سلام بچه ها به بازگشایی علم داده خوش آمدید
2
00:00:01,760 –> 00:00:03,520
، اینجا امان است و من یک دانشمند داده هستم
3
00:00:03,520 –> 00:00:04,799
4
00:00:04,799 –> 00:00:07,279
همانطور که می توانید روی صفحه نمایش خود ببینید، بچه ها
5
00:00:07,279 –> 00:00:08,639
امروز می خواهم یک اجرای سرتاسری از سری های زمانی را به شما نشان دهم که
6
00:00:08,639 –> 00:00:11,360
7
00:00:11,360 –> 00:00:13,840
اساساً با استفاده از روش arima استفاده می
8
00:00:13,840 –> 00:00:15,839
شود. شنیده می
9
00:00:15,839 –> 00:00:17,760
شود که در مورد روش arima
10
00:00:17,760 –> 00:00:20,080
که مخفف
11
00:00:20,080 –> 00:00:22,160
میانگین متحرک یکپارچه رگرسیون خودکار یا میانگین متحرک یکپارچه رگرسیون خودکار است شنیده اید،
12
00:00:22,160 –> 00:00:22,800
13
00:00:22,800 –> 00:00:25,119
بنابراین سه جزء arima وجود دارد که
14
00:00:25,119 –> 00:00:28,160
یکی ar
15
00:00:28,160 –> 00:00:31,359
بعدی i است و این m a r مخفف
16
00:00:31,359 –> 00:00:33,200
رگرسیون خودکار m a برای متحرک است. میانگین
17
00:00:33,200 –> 00:00:35,360
و i برای تفاوت عبارت
18
00:00:35,360 –> 00:00:38,480
من قبلاً
19
00:00:38,480 –> 00:00:38,960
20
00:00:38,960 –> 00:00:40,719
در همان لیست پخش در ویدیوهای قبلی خود، ar و m a را در
21
00:00:40,719 –> 00:00:42,800
من توضیح داده ام، پیوند را می دهم شما می
22
00:00:42,800 –> 00:00:44,000
توانید آن فیلم ها را نیز تماشا کنید،
23
00:00:44,000 –> 00:00:46,480
اما در این ویدیو شاهد
24
00:00:46,480 –> 00:00:48,719
اجرای انتها به انتها خواهیم بود. arima به عنوان یک
25
00:00:48,719 –> 00:00:50,160
مدل خوب است،
26
00:00:50,160 –> 00:00:51,680
بنابراین کاری که من اینجا انجام می دهم این است که من فقط
27
00:00:51,680 –> 00:00:53,920
دایرکتوری کاری خود را در اینجا تنظیم می کنم،
28
00:00:53,920 –> 00:00:56,640
همانطور که می بینید این تصویر
29
00:00:56,640 –> 00:00:58,559
در آخرین ویدیوی
30
00:00:58,559 –> 00:01:00,960
من استفاده شده است و همچنین من پاک کردن داده ها را وارد می کنم و
31
00:01:00,960 –> 00:01:02,640
برخی از وضعیت ها را انجام می دهم narity check
32
00:01:02,640 –> 00:01:05,119
من کوک می کنم مدل arima را آموزش
33
00:01:05,119 –> 00:01:05,760
34
00:01:05,760 –> 00:01:07,760
می دهم سپس مقداری پیش بینی انجام می دهم و
35
00:01:07,760 –> 00:01:09,439
سپس مدل را تنظیم
36
00:01:09,439 –> 00:01:11,200
می کنم همه این کارها را مرحله به مرحله انجام می دهیم این
37
00:01:11,200 –> 00:01:13,200
ویدیو ممکن است کمی طولانی تر شود
38
00:01:13,200 –> 00:01:15,200
اما از شما می خواهم که تا آخر تماشا کنید
39
00:01:15,200 –> 00:01:16,400
تا شما یک
40
00:01:16,400 –> 00:01:18,880
درک کلی از نحوه تطبیق یک
41
00:01:18,880 –> 00:01:21,040
مدل سری زمانی به دست می آورید،
42
00:01:21,040 –> 00:01:22,880
بنابراین اولین چیز این است که بچه ها داده ها را وارد
43
00:01:22,880 –> 00:01:25,360
کنند، بنابراین
44
00:01:25,360 –> 00:01:28,000
من داده ها را از کجا گرفته ام، خوب است،
45
00:01:28,000 –> 00:01:28,640
46
00:01:28,640 –> 00:01:32,320
بنابراین اعتباری برای Kaggle و در اعتبار Kaggle
47
00:01:32,320 –> 00:01:35,200
برای آقای bhupani که آپلود کرده است. این دادهها،
48
00:01:35,200 –> 00:01:37,840
بنابراین این دادهها دادههای بازار سهام را
49
00:01:37,840 –> 00:01:39,600
اساساً دادههای بسیار خوبی
50
00:01:39,600 –> 00:01:42,000
برای سهامهای مختلف به شما میدهد، خوب است، بنابراین
51
00:01:42,000 –> 00:01:44,000
شما میتوانید دادهها را از اینجا دانلود کنید،
52
00:01:44,000 –> 00:01:45,600
من پیوند را به شما میدهم و میتوانم
53
00:01:45,600 –> 00:01:48,000
دادهها را نیز
54
00:01:48,000 –> 00:01:50,399
در این دادههایی که میگیرم به شما بدهم. یک
55
00:01:50,399 –> 00:01:51,920
شرکت خاص hcl tech
56
00:01:51,920 –> 00:01:55,280
خوب است، بنابراین hcl یک شرکت نرم افزاری است که
57
00:01:55,280 –> 00:01:57,119
داده های فناوری hcl را می گیرم
58
00:01:57,119 –> 00:01:59,520
و من فقط 30
59
00:01:59,520 –> 00:02:00,640
رکورد اول
60
00:02:00,640 –> 00:02:03,840
داده های فناوری hcl را چاپ می کنم، بنابراین می توانید بچه
61
00:02:03,840 –> 00:02:07,840
ها را در سال 2000 ببینید
62
00:02:07,840 –> 00:02:10,080
نماد okay hcl tech hcl فن آوری نام است e
63
00:02:10,080 –> 00:02:11,200
از شرکت
64
00:02:11,200 –> 00:02:12,959
بسته قبلی این است که قیمت بازار سهام
65
00:02:12,959 –> 00:02:14,319
باز است بالا
66
00:02:14,319 –> 00:02:16,879
پایین آخرین همه این موارد درست چه چیزی
67
00:02:16,879 –> 00:02:18,160
بسته قبلی
68
00:02:18,160 –> 00:02:20,000
بود چه روز بالا بود چه روز
69
00:02:20,000 –> 00:02:21,920
پایین بود همه این اطلاعات قیمت این سهام
70
00:02:21,920 –> 00:02:22,480
71
00:02:22,480 –> 00:02:25,200
درست است بنابراین ما از این قبلی استفاده خواهیم کرد
72
00:02:25,200 –> 00:02:25,840
بستن
73
00:02:25,840 –> 00:02:28,879
ستون به عنوان ستون اصلی ما
74
00:02:28,879 –> 00:02:32,000
برای چه هدف یا چه عددی
75
00:02:32,000 –> 00:02:33,920
این قیمت سهام برای آن روز خاص بسته خواهد شد، بسیار
76
00:02:33,920 –> 00:02:35,120
77
00:02:35,120 –> 00:02:37,760
خوب، بنابراین در آینده من فقط از این ستون استفاده خواهم کرد،
78
00:02:37,760 –> 00:02:39,440
79
00:02:39,440 –> 00:02:41,760
بنابراین کاری که من در اینجا انجام می دهم این است که
80
00:02:41,760 –> 00:02:43,120
تمام ستون ها را رها
81
00:02:43,120 –> 00:02:45,680
می کنم تا ما تجزیه و تحلیل مختل نمی شود من
82
00:02:45,680 –> 00:02:47,760
رکوردهای زیادی دارم بنابراین می توانم برخی از
83
00:02:47,760 –> 00:02:48,640
این ns ها را رها
84
00:02:48,640 –> 00:02:50,959
کنم نکته بعدی نکته بسیار مهم
85
00:02:50,959 –> 00:02:53,040
بچه ها شما باید
86
00:02:53,040 –> 00:02:55,280
در هر یک از تجزیه و تحلیل سری های زمانی خود یک ستون شاخص ایجاد کنید
87
00:02:55,280 –> 00:02:56,800
88
00:02:56,800 –> 00:02:58,560
تا همانطور که می بینید یک ستون
89
00:02:58,560 –> 00:03:00,159
به نام تاریخ
90
00:03:00,159 –> 00:03:02,959
وجود دارد. ستون تاریخ من آن را به عنوان
91
00:03:02,959 –> 00:03:05,440
ستون شاخص برای این تجزیه و تحلیل درست
92
00:03:05,440 –> 00:03:07,920
می کنم، بنابراین می گویم شاخص نقطه داده های سهام hcl
93
00:03:07,920 –> 00:03:08,800
94
00:03:08,800 –> 00:03:11,840
برابر است با pd dot تاریخ زمان این تاریخ،
95
00:03:11,840 –> 00:03:13,840
بنابراین این تاریخ را به عنوان ستون تاریخ
96
00:03:13,840 –> 00:03:15,280
97
00:03:15,280 –> 00:03:16,959
من در نظر می گیرد. همانطور که به شما گفتم من
98
00:03:16,959 –> 00:03:18,720
فقط از یک ستون استفاده می
99
00:03:18,720 –> 00:03:21,840
کنم و داده های سال 2013 را به عنوان یک
100
00:03:21,840 –> 00:03:22,319
سال در نظر
101
00:03:22,319 –> 00:03:25,440
می گیرم، سال 2013 از ژانویه
102
00:03:25,440 –> 00:03:28,959
تا دسامبر، همانطور که می توانید همین الان اینجا را ببینید
103
00:03:28,959 –> 00:03:31,760
اگر پایین بیایید بچه ها، بنابراین من فقط
104
00:03:31,760 –> 00:03:33,680
یک چاپ می کنم داده های من را شرح دهید،
105
00:03:33,680 –> 00:03:35,760
بنابراین شما
106
00:03:35,760 –> 00:03:37,360
حدود 230
107
00:03:37,360 –> 00:03:40,319
ورودی Uh خواهید دید، دلیل آن این است که
108
00:03:40,319 –> 00:03:42,319
شنبه و یکشنبه تعطیلات بورس
109
00:03:42,319 –> 00:03:44,239
وجود دارد و برخی تعطیلات دیگر درست است،
110
00:03:44,239 –> 00:03:47,599
بنابراین تقریباً 230 ورودی میانگین 852 است
111
00:03:47,599 –> 00:03:49,760
و صدک های دیگر را می توانید ببینید. در اینجا
112
00:03:49,760 –> 00:03:51,760
اکنون اجازه دهید این داده ها را رسم کنیم و ببینیم که چگونه
113
00:03:51,760 –> 00:03:53,280
به نظر می رسد خوب است،
114
00:03:53,280 –> 00:03:55,360
بنابراین این نمودار
115
00:03:55,360 –> 00:03:56,799
داده های سهام فناوری hcl برای
116
00:03:56,799 –> 00:04:00,000
سال 2013 کل سال است، خوب این اولین
117
00:04:00,000 –> 00:04:03,040
ماه است 2013، این ماه یازدهم است
118
00:04:03,040 –> 00:04:05,840
و سپس ماه دوازدهم خوب است.
119
00:04:05,840 –> 00:04:06,879
می توانم ببینم
120
00:04:06,879 –> 00:04:08,720
که من آگاهانه این داده ها را گرفته ام،
121
00:04:08,720 –> 00:04:12,400
دلیل آن این است که نوعی از آن نشان داده
122
00:04:12,400 –> 00:04:14,720
می شود، می توانم بگویم این یک سری زمانی آسان نیست،
123
00:04:14,720 –> 00:04:15,519
خوب است،
124
00:04:15,519 –> 00:04:18,160
بنابراین روند مشخصی وجود ندارد، گاهی اوقات
125
00:04:18,160 –> 00:04:19,358
بالا می رود
126
00:04:19,358 –> 00:04:21,519
گاهی دوباره پایین می
127
00:04:21,519 –> 00:04:22,479
128
00:04:22,479 –> 00:04:25,360
آید. پایین، بنابراین چیزی که شما ثابت است وجود ندارد
129
00:04:25,360 –> 00:04:27,440
مولفه فصلی یا
130
00:04:27,440 –> 00:04:29,520
روند روند صعودی وجود دارد اما
131
00:04:29,520 –> 00:04:31,360
مولفه های فصلی را نمی توانیم
132
00:04:31,360 –> 00:04:33,360
به وضوح در این تصویر ببینیم، خوب است،
133
00:04:33,360 –> 00:04:35,840
بنابراین چیز بعدی را در مورد
134
00:04:35,840 –> 00:04:37,120
این سری های زمانی چگونه
135
00:04:37,120 –> 00:04:38,720
می بینیم، اولین نکته این است که باید بدانیم
136
00:04:38,720 –> 00:04:41,360
آیا این یک سری زمانی ثابت است یا خیر.
137
00:04:41,360 –> 00:04:43,120
آیا می بینید که آیا سری زمانی
138
00:04:43,120 –> 00:04:44,720
ثابت است یا نه،
139
00:04:44,720 –> 00:04:47,440
من یک ویدیو ایجاد کرده ام که می
140
00:04:47,440 –> 00:04:49,040
توانید آن ویدیو را
141
00:04:49,040 –> 00:04:51,520
برای ساده نگه داشتن آن تماشا کنید، می توانید از دو
142
00:04:51,520 –> 00:04:54,240
143
00:04:54,240 –> 00:04:55,840
144
00:04:55,840 –> 00:04:58,400
روش استفاده کنید. تست کاملتر
145
00:04:58,400 –> 00:04:58,800
146
00:04:58,800 –> 00:05:00,479
هر دو این روش ها را که در
147
00:05:00,479 –> 00:05:02,720
این ویدئو به شما نشان دادم لینک درست اینجاست، شما
148
00:05:02,720 –> 00:05:04,479
باید این ویدئو را نیز تماشا کنید،
149
00:05:04,479 –> 00:05:08,000
خوب است و سپس کاری که من در اینجا سعی می کنم انجام دهم این
150
00:05:08,000 –> 00:05:09,600
است که
151
00:05:09,600 –> 00:05:10,479
152
00:05:10,479 –> 00:05:13,199
اگر می بینید که معنی رول شدن را می بینید، سعی می کنم آماری را ایجاد کنم برابر با hcl
153
00:05:13,199 –> 00:05:15,360
استواک داده نقطه نورد 12 میانگین است
154
00:05:15,360 –> 00:05:17,039
که به این معنی است که من یک میانگین متحرک
155
00:05:17,039 –> 00:05:20,400
از آخرین را می گیرم من یک میانگین متحرک 12 ورودی را می گیرم بسیار
156
00:05:20,400 –> 00:05:23,840
خوب به طور مشابه آمار چرخشی
157
00:05:23,840 –> 00:05:26,560
انحراف استاندارد 12 ورودی و
158
00:05:26,560 –> 00:05:28,320
نگران نباشید در مورد این چیزهای طرح
159
00:05:28,320 –> 00:05:30,160
بچه ها این فقط در مورد ترسیم
160
00:05:30,160 –> 00:05:32,080
این دو عدد است خوب
161
00:05:32,080 –> 00:05:34,880
حالا من دارم سریال اصلی را
162
00:05:34,880 –> 00:05:35,440
163
00:05:35,440 –> 00:05:38,400
با رول اوکی رسم می کنم بنابراین رنگ اصلی آبی
164
00:05:38,400 –> 00:05:39,199
165
00:05:39,199 –> 00:05:41,360
است که میانگین رنگ آن قرمز است و
166
00:05:41,360 –> 00:05:43,440
انحراف استاندارد چرخشی به رنگ سیاه
167
00:05:43,440 –> 00:05:44,960
است تا می توانید ببینید
168
00:05:44,960 –> 00:05:46,880
انحراف استاندارد غلتشی در
169
00:05:46,880 –> 00:05:49,600
طول زمان کم و بیش ثابت است، بسیار خوب است، بنابراین آنچه
170
00:05:49,600 –> 00:05:50,400
که
171
00:05:50,400 –> 00:05:52,320
پیش نیاز سری 2 به نام
172
00:05:52,320 –> 00:05:53,440
173
00:05:53,440 –> 00:05:55,360
میانگین ثابت است باید در یک زمان ثابت باشد و
174
00:05:55,360 –> 00:05:56,880
انحراف استاندارد باید
175
00:05:56,880 –> 00:05:58,080
در یک زمان ثابت باشد،
176
00:05:58,080 –> 00:05:59,440
اکنون میتوانیم ببینیم
177
00:05:59,440 –> 00:06:01,120
انحراف استاندارد غلتشی نوعی ثابت اما
178
00:06:01,120 –> 00:06:02,160
میانگین نورد ثابت نیست
179
00:06:02,160 –> 00:06:05,039
که قطعاً به این معنی است که
180
00:06:05,039 –> 00:06:06,080
این سری
181
00:06:06,080 –> 00:06:09,199
یک سری ثابت نیست در حال
182
00:06:09,199 –> 00:06:10,000
حاضر به
183
00:06:10,000 –> 00:06:13,600
نحوه ساخت این سری ثابت برمی
184
00:06:13,600 –> 00:06:16,160
گردم اندازه نمودار نقطه ای برابر با 16
185
00:06:16,160 –> 00:06:17,360
186
00:06:17,360 –> 00:06:18,880
است. اندازه شکل 7 برابر است بنابراین من فقط
187
00:06:18,880 –> 00:06:20,479
اندازه شکل
188
00:06:20,479 –> 00:06:22,720
و سپس اولین کاری که میتوانیم انجام دهیم این است
189
00:06:22,720 –> 00:06:24,639
که سریها را ثابت نگه داریم این است
190
00:06:24,639 –> 00:06:27,039
که میتوانیم یک تبدیل log از
191
00:06:27,039 –> 00:06:27,680
سری
192
00:06:27,680 –> 00:06:29,840
بگیریم یا میتوانیم بسیاری از تبدیلها را انجام دهیم.
193
00:06:29,840 –> 00:06:32,160
در اینجا من یک تبدیل لاگ
194
00:06:32,160 –> 00:06:33,440
میگیرم، شما میتوانید تبدیل مکعبی تبدیل ریشه مربع بگیرید،
195
00:06:33,440 –> 00:06:35,600
196
00:06:35,600 –> 00:06:37,360
بسیاری از تبدیلها ما
197
00:06:37,360 –> 00:06:40,000
نمیدانیم چه تبدیلی باعث میشود سری ما
198
00:06:40,000 –> 00:06:40,479
199
00:06:40,479 –> 00:06:42,880
ثابت بماند، بنابراین من فقط با تبدیل log تلاش میکنم
200
00:06:42,880 –> 00:06:44,400
201
00:06:44,400 –> 00:06:46,560
np dot log تبدیل log را انجام میدهد.
202
00:06:46,560 –> 00:06:48,479
از سری من
203
00:06:48,479 –> 00:06:52,000
و من دارم طرح می کنم که وقتی طرح می کنم که
204
00:06:52,000 –> 00:06:54,240
این سری زمانی ثابت نمی شود
205
00:06:54,240 –> 00:06:56,160
همانطور که می بینید
206
00:06:56,160 –> 00:06:57,759
تقویت سری های زمانی
207
00:06:57,759 –> 00:06:59,680
روندی مانند این را نشان نمی دهد
208
00:06:59,680 –> 00:07:01,759
تا مطمئن شویم این سری زمانی
209
00:07:01,759 –> 00:07:03,199
ثابت نیست
210
00:07:03,199 –> 00:07:05,680
ما فقط آن را تجزیه می کنیم. به
211
00:07:05,680 –> 00:07:06,800
مولفه های فصلی خوب است
212
00:07:06,800 –> 00:07:09,599
چگونه می توان این کار را از مدل آمار tsa یا
213
00:07:09,599 –> 00:07:11,840
واردات فصلی تجزیه فصلی تجزیه فصلی
214
00:07:11,840 –> 00:07:14,800
برابر با ts log است و
215
00:07:14,800 –> 00:07:16,960
کاری که انجام می دهد این است که
216
00:07:16,960 –> 00:07:19,039
مولفه های مختلف سری زمانی شما را به شما می دهد
217
00:07:19,039 –> 00:07:22,000
که آیا روند فصلی است
218
00:07:22,000 –> 00:07:25,440
خوب است، بنابراین اگر شما این نمودار را در اینجا ببینید
219
00:07:25,440 –> 00:07:28,240
که آن سری زمانی خاص
220
00:07:28,240 –> 00:07:30,560
به چهار جزء تقسیم شده
221
00:07:30,560 –> 00:07:33,919
222
00:07:33,919 –> 00:07:35,599
است. یکی از
223
00:07:35,599 –> 00:07:37,199
آن سری خاص،
224
00:07:37,199 –> 00:07:40,080
سومین مولفه
225
00:07:40,080 –> 00:07:41,759
فصلی آن سری خاص است
226
00:07:41,759 –> 00:07:43,680
و چهارمی جزء
227
00:07:43,680 –> 00:07:45,599
باقیمانده آن سری خاص است،
228
00:07:45,599 –> 00:07:48,240
بنابراین از اینجا کاملاً مشهود است که
229
00:07:48,240 –> 00:07:50,639
جزء روند بیشتر به
230
00:07:50,639 –> 00:07:52,319
سری زمانی اصلی کمک می کند در
231
00:07:52,319 –> 00:07:55,520
حال حاضر می دانیم که سریال
232
00:07:55,520 –> 00:07:57,199
حتی پس از
233
00:07:57,199 –> 00:08:00,000
تبدیل log ثابت نیست، بنابراین من یک کار دیگر انجام می دهم
234
00:08:00,000 –> 00:08:01,120
235
00:08:01,120 –> 00:08:04,080
که آن چیز دیگری است، بنابراین من
236
00:08:04,080 –> 00:08:06,240
تفاوتی را به سری زمانی ایجاد می کنم که تفاوت به سری
237
00:08:06,240 –> 00:08:08,639
زمانی است، سری زمانی را 1 تغییر می
238
00:08:08,639 –> 00:08:10,400
239
00:08:10,400 –> 00:08:12,319