در این مطلب، ویدئو پیش پردازش داده های سری زمانی چند متغیره با پانداها در پایتون | آموزش یادگیری ماشین با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:30:24
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,240 –> 00:00:02,720
سلام بچه ها در این ویدیو ما می خواهیم
2
00:00:02,720 –> 00:00:03,520
ببینیم که چگونه
3
00:00:03,520 –> 00:00:05,759
می توانیم پیش پردازش داده های سری های زمانی را انجام
4
00:00:05,759 –> 00:00:06,960
5
00:00:06,960 –> 00:00:09,920
دهیم و یک
6
00:00:09,920 –> 00:00:12,559
فریم داده پانداها را به مجموعه ای از دنباله
7
00:00:12,559 –> 00:00:15,360
ها تبدیل می کنیم که قرار است در
8
00:00:15,360 –> 00:00:16,400
ویدیوهای بعدی برای
9
00:00:16,400 –> 00:00:19,279
پیش بینی سری های زمانی استفاده شود. طبقه بندی
10
00:00:19,279 –> 00:00:19,920
و
11
00:00:19,920 –> 00:00:23,279
احتمالاً تشخیص ناهنجاری در مورد
12
00:00:23,279 –> 00:00:25,119
ما می خواهیم برخی از
13
00:00:25,119 –> 00:00:28,080
داده های چند متغیره را به دنباله های سری زمانی تبدیل کنیم
14
00:00:28,080 –> 00:00:29,359
15
00:00:29,359 –> 00:00:31,760
و داده ها اساساً
16
00:00:31,760 –> 00:00:33,600
حاوی چندین ویژگی هستند،
17
00:00:33,600 –> 00:00:35,120
بنابراین من برخی از ترفندهایی را که برای تبدیل این نوع استفاده می کنم به شما نشان می دهم.
18
00:00:35,120 –> 00:00:37,440
19
00:00:37,440 –> 00:00:39,520
دادهها را به دنبالههایی
20
00:00:39,520 –> 00:00:41,920
که بعداً
21
00:00:41,920 –> 00:00:45,120
به مجموعه دادههای پایتورچ تبدیل میکنیم
22
00:00:45,120 –> 00:00:47,760
، نشان میدهم که چگونه میتوانید
23
00:00:47,760 –> 00:00:50,000
دادههای سریهای زمانی یا
24
00:00:50,000 –> 00:00:52,719
برخی مدلهای سری زمانی را که بر اساس
25
00:00:52,719 –> 00:00:53,039
26
00:00:53,039 –> 00:00:55,680
شبکههای عصبی هستند، البته با استفاده از رعد و برق پایتورچ، آموزش دهید، پس با ما همراه
27
00:00:55,680 –> 00:00:56,320
28
00:00:56,320 –> 00:00:58,000
باشید. دو
29
00:00:58,000 –> 00:00:59,359
ویدیوی بعدی نیز
30
00:00:59,359 –> 00:01:01,440
بیایید شروع کنیم و به شما نشان خواهم داد که چگونه
31
00:01:01,440 –> 00:01:03,520
میتوانید پیشپردازش دادههای سری زمانی را انجام دهید
32
00:01:03,520 –> 00:01:05,600
،
33
00:01:05,600 –> 00:01:08,159
بنابراین در اینجا یک نوت بوک خالی در
34
00:01:08,159 –> 00:01:09,280
google co-op داریم
35
00:01:09,280 –> 00:01:13,040
و من با doi شروع میکنم. در
36
00:01:13,040 –> 00:01:16,479
برخی از نصبهای کتابخانه
37
00:01:16,479 –> 00:01:18,320
، نوتبوک را وصل میکنم
38
00:01:18,320 –> 00:01:18,880
39
00:01:18,880 –> 00:01:22,479
، حداقل در حال حاضر واقعاً به gpu نیاز نداریم و میخواهم
40
00:01:22,479 –> 00:01:23,200
41
00:01:23,200 –> 00:01:27,119
نسخه خاصی از
42
00:01:27,119 –> 00:01:31,040
tqgm را نصب کنم که اساساً به ما امکان میدهد تا مقداری
43
00:01:31,040 –> 00:01:34,640
تجسم پیشرفت و
44
00:01:34,640 –> 00:01:37,840
چیز جالبی را انجام دهیم. من حداقل اخیراً در مورد
45
00:01:37,840 –> 00:01:40,960
این موارد همکاری گوگل متوجه شده
46
00:01:40,960 –> 00:01:44,399
ام که ما
47
00:01:44,399 –> 00:01:48,560
اساساً آمار اعدام را داریم
48
00:01:48,560 –> 00:01:50,640
و هنگامی که شما در حال انجام یک کار طولانی مدت
49
00:01:50,640 –> 00:01:52,479
هستید، اساساً به شما می گوید که
50
00:01:52,479 –> 00:01:54,640
چه اتفاقی می افتد و من این
51
00:01:54,640 –> 00:01:55,680
را به شما نشان خواهم داد.
52
00:01:55,680 –> 00:01:58,960
بعداً وقتی
53
00:01:58,960 –> 00:02:01,759
این وظایف طولانی مدت را انجام میدهیم،
54
00:02:01,759 –> 00:02:03,040
55
00:02:03,040 –> 00:02:06,399
در واقع به واردات زیاد ادامه میدهم و در
56
00:02:06,399 –> 00:02:09,758
اینجا خواب matpot و seabourn را
57
00:02:09,758 –> 00:02:11,920
58
00:02:11,920 –> 00:02:13,840
برای تجسمیهایی که احتمالاً در این
59
00:02:13,840 –> 00:02:15,120
ویدیوی
60
00:02:15,120 –> 00:02:18,560
بعدی انجام نمیدهیم وارد میکنم. انجام پانداها در numpy من
61
00:02:18,560 –> 00:02:20,160
میخواهم cqdm را
62
00:02:20,160 –> 00:02:22,959
برای نوارهای پیشرفت با سفید کردن مشعل
63
00:02:22,959 –> 00:02:24,400
وارد کنم و میخواهیم
64
00:02:24,400 –> 00:02:27,599
مقداری حداکثر مقیاسبندی را انجام دهیم و سپس
65
00:02:27,599 –> 00:02:28,879
اساساً
66
00:02:28,879 –> 00:02:32,000
تمام موارد مربوط
67
00:02:32,000 –> 00:02:34,879
به pytorch را وارد میکنم و در این مثال خاص
68
00:02:34,879 –> 00:02:35,680
69
00:02:35,680 –> 00:02:38,000
ما نمیخواهیم o از بسیاری از آن ها استفاده کنید،
70
00:02:38,000 –> 00:02:39,440
اما در ویدیوهای بعدی،
71
00:02:39,440 –> 00:02:42,959
من فقط از برخی از آن ها استفاده
72
00:02:42,959 –> 00:02:46,720
می کنم و اساساً به
73
00:02:46,720 –> 00:02:50,000
بالا پیمایش نمی کنم و دوباره وارد کردن را انجام نمی دهم،
74
00:02:50,000 –> 00:02:52,879
بنابراین ما اساساً یک سری واردات
75
00:02:52,879 –> 00:02:53,760
را در اینجا انجام می دهیم
76
00:02:53,760 –> 00:02:56,959
و این در حال اجرا است،
77
00:02:56,959 –> 00:03:00,879
بنابراین من همچنین
78
00:03:00,879 –> 00:03:05,200
کتابخانه تلنگر ماکرو و تنظیمات مختلف
79
00:03:05,200 –> 00:03:07,040
برای پالتهای رنگی
80
00:03:07,040 –> 00:03:09,280
و استایل صفحه کلید را درست در اینجا راهاندازی
81
00:03:09,280 –> 00:03:12,640
میکنم و سپس پانداهای tkdm را وارد یا فراخوانی
82
00:03:12,640 –> 00:03:15,680
میکنم که به ما
83
00:03:15,680 –> 00:03:18,959
امکان میدهد اساساً
84
00:03:18,959 –> 00:03:20,959
روش اعمال را برای پانداها وصله کنیم. که
85
00:03:20,959 –> 00:03:22,080
ما تا
86
00:03:22,080 –> 00:03:25,120
چند دقیقه دیگر از آن استفاده خواهیم کرد
87
00:03:25,120 –> 00:03:28,239
و در نهایت من همه چیز را به نام
88
00:03:28,239 –> 00:03:32,239
uh pl dot seed صدا می کنم، بنابراین این
89
00:03:32,239 –> 00:03:34,319
از pytorch lightning است
90
00:03:34,319 –> 00:03:36,159
و اساساً
91
00:03:36,159 –> 00:03:39,040
همه چیز از جمله
92
00:03:39,040 –> 00:03:40,400
مراحل چند پردازشی را
93
00:03:40,400 –> 00:03:43,760
که ممکن است بخواهید مشاهده کنید. برای انجام و
94
00:03:43,760 –> 00:03:47,280
سپس به این می پردازم
95
00:03:47,280 –> 00:03:49,680
که داده هایی که قرار است استفاده کنیم و
96
00:03:49,680 –> 00:03:50,879
97
00:03:50,879 –> 00:03:53,920
خود داده ها از
98
00:03:53,920 –> 00:03:56,959
بایننس خواهد بود و توسط crypto date download.com ارائه شده است
99
00:03:56,959 –> 00:04:00,319
و در اینجا
100
00:04:00,319 –> 00:04:04,720
ما داده های تاریخی برای
101
00:04:04,720 –> 00:04:08,080
جفت های معاملاتی مختلف داریم بنابراین اساساً من من
102
00:04:08,080 –> 00:04:08,799
بین
103
00:04:08,799 –> 00:04:12,080
در این
104
00:04:12,080 –> 00:04:15,760
داده دقیقه دقیقه btc برای ما تعیین شده است
105
00:04:15,760 –> 00:04:19,040
و این اساساً داده های زیادی است
106
00:04:19,040 –> 00:04:20,320
که ما از آنها استفاده
107
00:04:20,320 –> 00:04:22,720
خواهیم کرد و حاوی همه آن
108
00:04:22,720 –> 00:04:23,840
مقادیر است
109
00:04:23,840 –> 00:04:27,280
و من به شما نشان خواهم داد که اساساً آنها چه چیزهایی
110
00:04:27,280 –> 00:04:28,560
هستند که
111
00:04:28,560 –> 00:04:33,120
من انجام داده ام و
112
00:04:33,919 –> 00:04:37,360
از سایت برای دانلود
113
00:04:37,360 –> 00:04:40,639
فایل زیپ استفاده کردم و سپس داده ها را استخراج کردم
114
00:04:40,639 –> 00:04:41,600
115
00:04:41,600 –> 00:04:45,440
و از اینجا
116
00:04:45,440 –> 00:04:48,800
این داده دقیقه btc btc usd را داریم
117
00:04:48,800 –> 00:04:52,639
و حدود 32 مگابایت است، فکر می کنم
118
00:04:52,639 –> 00:04:56,720
بله 35 یا 36 مگابایت است،
119
00:04:56,720 –> 00:04:59,680
بنابراین در مرحله بعدی از فوندوس برای
120
00:04:59,680 –> 00:05:02,320
خواندن استفاده می کنیم. داده ها
121
00:05:04,479 –> 00:05:07,680
و این باید از فایل باشد و
122
00:05:07,680 –> 00:05:10,320
ما از اینجا کامل می شویم و من
123
00:05:10,320 –> 00:05:11,280
124
00:05:11,280 –> 00:05:14,560
ستون تاریخ را تجزیه می کنم
125
00:05:14,560 –> 00:05:18,960
و اگر به داده ها نگاه
126
00:05:18,960 –> 00:05:22,080
کنیم می بینیم که نماد تاریخ
127
00:05:22,080 –> 00:05:23,199
128
00:05:23,199 –> 00:05:25,919
را داریم که منحصراً btc
129
00:05:25,919 –> 00:05:27,600
usdt است.
130
00:05:27,600 –> 00:05:30,880
و بسیاری از مقادیر دیگر
131
00:05:30,880 –> 00:05:35,440
که قرار است همه آن چیزها
132
00:05:35,440 –> 00:05:37,280
باشند، بنابراین ما قیمت افتتاحیه قیمت بالا و
133
00:05:37,280 –> 00:05:39,680
قیمت پایین قیمت بسته شدن
134
00:05:39,680 –> 00:05:42,479
حداقل برای این دقیقه را داریم زیرا این
135
00:05:42,479 –> 00:05:44,240
داده های دقیقه به دقیقه است
136
00:05:44,240 –> 00:05:46,400
و می توانید ببینید که داده ها
137
00:05:46,400 –> 00:05:48,240
احتمالاً هستند به ترتیب معکوس
138
00:05:48,240 –> 00:05:50,800
زیرا این t است او شش دقیقه از
139
00:05:50,800 –> 00:05:51,600
ساعت پنجم
140
00:05:51,600 –> 00:05:54,800
چهارم و غیره بنابراین کاری که من
141
00:05:54,800 –> 00:05:58,479
بعد از بارگذاری داده ها انجام می دهم این است
142
00:05:58,479 –> 00:06:02,960
که مقادیر را بر اساس تاریخ مرتب
143
00:06:02,960 –> 00:06:08,240
کنم و سپس فهرست قاب داده را مجددا تنظیم کنم
144
00:06:10,960 –> 00:06:14,240
و در حال حاضر می توانید
145
00:06:14,240 –> 00:06:14,880
ببینید
146
00:06:14,880 –> 00:06:17,520
که دقیقه دادههای دقیقهای به
147
00:06:17,520 –> 00:06:18,560
ترتیب صحیح مرتب شدهاند،
148
00:06:18,560 –> 00:06:22,720
بنابراین همه اینها خوب است و
149
00:06:22,720 –> 00:06:25,919
بیایید تعداد ردیفهایی را که داریم بررسی
150
00:06:25,919 –> 00:06:26,560
151
00:06:26,560 –> 00:06:29,840
کنیم،
152
00:06:29,840 –> 00:06:32,479
بله، تقریباً یک چهارم میلیون ردیف داریم،
153
00:06:32,479 –> 00:06:35,759
بنابراین این داده باید به اندازه کافی خوب باشد
154
00:06:35,759 –> 00:06:39,039
تا اساساً هر کاری را که میخواهید انجام دهید
155
00:06:39,039 –> 00:06:41,120
و بیایید با
156
00:06:41,120 –> 00:06:43,919
پیش پردازش ادامه دهیم
157
00:06:44,400 –> 00:06:47,440
یک کاری که من گهگاه یا خیلی وقت
158
00:06:47,440 –> 00:06:48,400
ها انجام می دهم این
159
00:06:48,400 –> 00:06:52,639
است که اساساً برخی از آمارها را
160
00:06:52,639 –> 00:06:55,360
در امتداد ردیف فعلی و ردیف بعدی
161
00:06:55,360 –> 00:06:57,120
یا ردیف قبلی محاسبه می کنم،
162
00:06:57,120 –> 00:07:00,160
بنابراین برای مثال در این مورد ممکن است
163
00:07:00,160 –> 00:07:01,039
164
00:07:01,039 –> 00:07:03,680
بخواهیم نگاهی به آنچه وجود دارد بیندازیم. تغییر از
165
00:07:03,680 –> 00:07:04,880
166
00:07:04,880 –> 00:07:08,000
قیمت بسته شدن قبلی به عنوان مثال به قیمت
167
00:07:08,000 –> 00:07:09,280
فعلی
168
00:07:09,280 –> 00:07:12,720
و یکی
169
00:07:12,720 –> 00:07:18,319
از روش های بسیار مفید پانداها، روش شیفت است
170
00:07:18,400 –> 00:07:23,199
و اگر این را
171
00:07:23,199 –> 00:07:27,039
با یک موقعیت تغییر دهیم، خواهید دید
172
00:07:27,039 –> 00:07:29,919
که اجازه دهید من فقط به شما نشان دهم قیمت را
173
00:07:29,919 –> 00:07:32,400
دقیقاً در
174
00:07:33,360 –> 00:07:35,759
اینجا ببندید، بنابراین این قیمت بسته است و این
175
00:07:35,759 –> 00:07:37,840
نسخه یک نسخه جابجا شده است،
176
00:07:37,840 –> 00:07:40,960
بنابراین می توانید به وضوح ببینید که این نقشه به
177
00:07:40,960 –> 00:07:43,280
شاخص صفر درست در اینجا
178
00:07:43,280 –> 00:07:46,160
این نقشه به شاخص دوم درست در اینجا
179
00:07:46,160 –> 00:07:48,720
و غیره می شود و ما فقط
180
00:07:48,720 –> 00:07:52,240
یک عدد نداریم. مقدار در شاخص صفر شده است،
181
00:07:52,240 –> 00:07:55,280
بنابراین این اساساً فقط
182
00:07:55,280 –> 00:07:55,759
ردیفها
183
00:07:55,759 –> 00:07:59,520
را یکجا جابهجا میکند و من میخواهم از آن به
184
00:07:59,520 –> 00:08:02,560
عنوان یک
185
00:08:02,560 –> 00:08:05,520
مقدار جدید یا یک ستون جدید در
186
00:08:05,520 –> 00:08:07,199
قاب دادهمان استفاده کنم
187
00:08:07,199 –> 00:08:09,120
و میخواهیم آن را فراخوانیهای قبلی
188
00:08:09,120 –> 00:08:10,560
بنامیم
189
00:08:10,560 –> 00:08:14,800
که باید به اندازه کافی توصیفی باشد
190
00:08:14,800 –> 00:08:17,440
و اگر در حال حاضر به داده ها نگاه کنم،
191
00:08:17,440 –> 00:08:18,960
می بینید که ما
192
00:08:18,960 –> 00:08:22,080
این ستون جدید را در انتهای قاب داده اضافه کرده ایم
193
00:08:22,080 –> 00:08:22,800
194
00:08:22,800 –> 00:08:24,960
و اولین مقدار عددی
195
00:08:24,960 –> 00:08:27,199
نیست که کمی مشکل ساز باشد،
196
00:08:27,199 –> 00:08:27,599
اما
197
00:08:27,599 –> 00:08:30,879
ما می خواهیم آن را مدیریت کنیم. این در حال حاضر
198
00:08:30,879 –> 00:08:34,240
بنابراین ما می خواهیم اساساً
199
00:08:34,240 –> 00:08:37,120
یک ستون جدید ایجاد کنیم
200
00:08:37,120 –> 00:08:38,320
که قیمت تغییر بسته شدن است
201
00:08:38,320 –> 00:08:41,599
و
202
00:08:41,599 –> 00:08:44,240
در اینجا من می خواهم تابع پیشرفت
203
00:08:44,240 –> 00:08:45,920
204
00:08:45,920 –> 00:08:50,320
یا روشی را اعمال کنم که
205
00:08:50,320 –> 00:08:55,600
توسط روش کتابخانه dkdm pandas به ما داده شده
206
00:08:55,600 –> 00:08:58,720
است متأسفانه
207
00:08:58,720 –> 00:09:02,000
و در در اینجا من می خواهم بررسی کنم که
208
00:09:02,000 –> 00:09:05,440
آیا مشکل است ردیف اجاره یک عدد
209
00:09:05,440 –> 00:09:09,839
یا یک عدد نیست، من از
210
00:09:10,560 –> 00:09:13,920
روش numpy استفاده
211
00:09:13,920 –> 00:09:17,040
میکنم که صفر را برگردانیم، در
212
00:09:17,040 –> 00:09:20,080
غیر این صورت
213
00:09:20,080 –> 00:09:22,880
تفاوت یا دلتای بین
214
00:09:22,880 –> 00:09:24,080
قیمت بسته فعلی
215
00:09:24,080 –> 00:09:27,279
و قیمت بسته قبلی را محاسبه میکنیم و ما
216
00:09:27,279 –> 00:09:28,320
این کار را
217
00:09:28,320 –> 00:09:31,600
در امتداد محور اول انجام می دهیم که
218
00:09:31,600 –> 00:09:32,399
219
00:09:32,399 –> 00:09:36,080
اساساً روی ردیف ها اعمال می شود ،
220
00:09:36,080 –> 00:09:40,720
بنابراین ستون دیگری ایجاد می کند
221
00:09:43,440 –> 00:09:46,640
و همانطور که می بینید پیشرفت اعمال
222
00:09:46,640 –> 00:09:49,680
یک نوار پیشرفت خوب به ما می دهد و
223
00:09:49,680 –> 00:09:50,320
در
224
00:09:50,320 –> 00:09:53,040
اینجا تعداد ثانیه ها است. که در طول این اجرا از آن عبور کردیم
225
00:09:53,040 –> 00:09:54,800
226
00:09:54,800 –> 00:09:57,920
و google co-op به اندازه کافی عالی است که این خلاصه اجرا را به ما بدهد،
227
00:09:57,920 –> 00:09:59,600
فکر
228
00:09:59,600 –> 00:10:05,040
229
00:10:05,040 –> 00:10:08,240
میکنم این یک ویژگی خوب است به اعتقاد من و
230
00:10:08,240 –> 00:10:08,720
231
00:10:08,720 –> 00:10:11,839
سپس دوباره به چارچوب داده جدید نگاهی
232
00:10:11,839 –> 00:10:15,440
میاندازیم، این
233
00:10:15,440 –> 00:10:18,640
تغییر نزدیک را داریم. قیمت یا دلتا و همانطور
234
00:10:18,640 –> 00:10:19,279
که
235
00:10:19,279 –> 00:10:22,079
در موقعیت اول یا شاخص صفر می بینید،
236
00:10:22,079 –> 00:10:22,800
237
00:10:22,800 –> 00:10:26,160
ما صفر داریم زیرا یک مقدار غیرمقدار بود
238
00:10:26,160 –> 00:10:29,519
و پس از آن ما
239
00:10:29,519 –> 00:10:32,560
فقط مقداری را داریم که قیمت بسته شدن
240
00:10:32,560 –> 00:10:33,200
تغییر کرده است،
241
00:10:33,200 –> 00:10:36,240
من معتقدم که این احتمالاً در حد است.
242
00:10:36,240 –> 00:10:37,839
تو
243
00:10:37,839 –> 00:10:41,279
من فکر می کنم احتمالاً در
244
00:10:41,279 –> 00:10:44,320
مرحله بعد،
245
00:10:44,320 –> 00:10:47,760
همه اینها را به یک قاب داده ویژگی
246
00:10:47,760 –> 00:10:51,200
هایی تبدیل می کنم که می خواهیم برای
247
00:10:51,200 –> 00:10:53,040
چند مدل بعدی خود استفاده کنیم که قرار است
248
00:10:53,040 –> 00:10:54,320
به
249
00:10:54,320 –> 00:10:57,600
چند ویدیوی بعدی نگاهی بیندازیم و
250
00:10:57,600 –> 00:11:01,680
انجام دهیم. این من قصد دارم یک
251
00:11:02,240 –> 00:11:06,720
لیست ردیف ایجاد کنم و در این لیست
252
00:11:06,720 –> 00:11:08,320
اساساً
253
00:11:08,320 –> 00:11:10,959
آن قاب داده را به ویژگی هایی تبدیل
254
00:11:10,959 –> 00:11:12,839
می کنم که قرار است از آنها استفاده کنیم،
255
00:11:12,839 –> 00:11:16,000
بنابراین می خواهم روی قاب داده تکرار
256
00:11:16,000 –> 00:11:18,240
257
00:11:21,760 –> 00:11:24,800
کنم و می روم برای انجام این کار با استفاده از tkgm و
258
00:11:24,800 –> 00:11:26,880
من تعداد ردیفهایی را که داریم ارسال
259
00:11:26,880 –> 00:11:29,440
260
00:11:29,440 –> 00:11:32,240
میکنم تا بداند چند بار تکرار میکنیم
261
00:11:32,240 –> 00:11:34,079
262
00:11:34,079 –> 00:11:36,320
و یک فرهنگ لغت ایجاد میکنم که
263
00:11:36,320 –> 00:11:37,839
264
00:11:37,839 –> 00:11:43,839
حاوی دادههای این ردیف باشد.
265
00:11:45,680 –> 00:11:48,959
من می خواهم روز هفته را دریافت کنم،
266
00:11:48,959 –> 00:11:51,200
بنابراین برای انجام این کار، به ویژگی
267
00:11:51,200 –> 00:11:52,480
تاریخ
268
00:11:52,480 –> 00:11:56,399
روز هفته دسترسی
269
00:11:56,399 –> 00:11:59,040
خواهم داشت، سپس همان کار را برای روز ماه انجام می دهم،
270
00:11:59,040 –> 00:12:01,839
271
00:12:03,760 –> 00:12:06,720
این فقط روز
272
00:12:07,519 –> 00:12:10,320
بعد است که ما این ویژگی را داریم هفته از سال و این
273
00:12:10,320 –> 00:12:12,240
می تواند هر ویژگی که شما می خواهید باشد،
274
00:12:12,240 –> 00:12:15,680
اما من آنهایی را انتخاب کردم که این راهی است برای
275
00:12:15,680 –> 00:12:16,880
276
00:12:16,880 –> 00:12:19,360
رمزگذاری تاریخ
277
00:12:20,480 –> 00:12:25,839
بعدی که داریم t او ماه ها بله
278
00:12:26,880 –> 00:12:30,480
و قیمت افتتاحیه
279
00:12:30,480 –> 00:12:34,320
قیمت بالا قیمت
280
00:12:35,440 –> 00:12:38,720
281
00:12:38,720 –> 00:12:42,079
دیوار تغییر بسته است که قرار
282
00:12:42,079 –> 00:12:46,240
است ویژگی جدید ایجاد شده توسط ما باشد
283
00:12:46,240 –> 00:12:49,760
و در نهایت قیمت بسته شدن
284
00:12:49,760 –> 00:12:54,720
و من این را به ردیف ها اضافه می
285
00:12:55,680 –> 00:12:59,040
کنم و من میخواهم همه آن را به یک قاب داده تبدیل کنم،
286
00:12:59,040 –> 00:13:06,000
287
00:13:06,000 –> 00:13:09,040
بنابراین اینجا دوباره tkdm است
288
00:13:09,040 –> 00:13:11,680
و یک چیز جالب در مورد
289
00:13:11,680 –> 00:13:12,639
Google Coop
290
00:13:12,639 –> 00:13:16,639
این است که در حال پریدن به اطراف است
291
00:13:16,639 –> 00:13:18,720
که احتمالاً به ما میگوید که
292
00:13:18,720 –> 00:13:21,040
نقطه اجرای فعلی کجاست،
293
00:13:21,040 –> 00:13:24,800
من نمیدانم اما در حال انجام یک
294
00:13:24,800 –> 00:13:27,600
کار خوب است. بعد از اینکه این کار کامل شد،
295
00:13:27,600 –> 00:13:30,079
296
00:13:30,639 –> 00:13:33,839
فقط شکل آن را بررسی میکنم و سپس
297
00:13:33,839 –> 00:13:36,320
به
298
00:13:36,320 –> 00:13:40,399
خود قاب داده نگاهی میاندازم،
299
00:13:40,959 –> 00:13:43,920
اکنون که ایجاد ویژگی
300
00:13:43,920 –> 00:13:44,959
کامل
301
00:13:44,959 –> 00:13:48,000
شده است، این
302
00:13:48,000 –> 00:13:51,440
قاب داده جدید ایجاد شده را داریم و
303
00:13:51,440 –> 00:13:53,519
همه چیز را دارد. تعداد ردیف هایی که قبلاً داشتیم،
304
00:13:53,519 –> 00:13:54,639
305
00:13:54,639 –> 00:13:58,000
اما مجدداً اگر بخواهید، فقط
306
00:13:58,000 –> 00:14:01,040
مهندسی ویژگی را انجام می دهیم
307
00:14:01,040 –> 00:14:04,560
و در اینجا اعداد جدید
308
00:14:04,560 –> 00:14:08,079
استخراج شده از داده های اصلی
309
00:14:08,079 –> 00:14:11,680
را داریم و سپس می خواهیم
310
00:14:11,680 –> 00:14:14,800
بین داده های آموزشی و داده های آزمایشی تقسیم کنیم و
311
00:14:14,800 –> 00:14:16,000
در این قسمت در صورتی که من
312
00:14:16,000 –> 00:14:19,040
میخواهم 90 عدد از دادهها را
313
00:14:19,040 –> 00:14:22,240
برای آموزش
314
00:14:23,680 –> 00:14:27,360
داشته باشم و این کار را با محاسبه
315
00:14:27,360 –> 00:14:31,600
حدود 90 مورد از
316
00:14:31,600 –> 00:14:35,279
ویژگیها به تعداد ردیفهایی که داریم انجام میدهم
317
00:14:35,279 –> 00:14:39,360
و این به این عدد میرسد و
318
00:14:39,360 –> 00:14:42,000
سپس قاب داده را تقسیم میکنیم.
319
00:14:42,000 –> 00:14:45,839
بر اساس این شاخص،
320
00:14:46,079 –> 00:14:48,240
ما قصد داریم آن دو فریم داده را ایجاد کنیم
321
00:14:48,240 –> 00:14:50,560
و من از قاب داده ویژگیها استفاده میکنم
322
00:14:50,560 –> 00:14:51,680
323
00:14:51,680 –> 00:14:55,199
و تمام مثالها را قبل
324
00:14:55,199 –> 00:14:58,399
از قطار دریافت میکنم و سپس
325
00:14:58,399 –> 00:15:01,279
تمام مثالها را
326
00:15:01,279 –> 00:15:04,800
میآورم، متاسفم اندازه محدوده
327
00:15:04,800 –> 00:15:08,480
بعد از آن این و من یکی را اضافه می کنم
328
00:15:08,480 –> 00:15:10,560
فقط برای اطمینان از اینکه همه داده ها
329
00:15:10,560 –> 00:15:12,639
بین داده های آموزشی
330
00:15:12,639 –> 00:15:15,360
و آزمایشی
331
00:15:25,040 –> 00:15:27,760
به هم مرتبط هستند، بنابراین این اعدادی هستند که ما
332
00:15:2