در این مطلب، ویدئو سری پایتون روز نهم: تجزیه و تحلیل پیش بینی در پایتون | نحوه انجام تجزیه و تحلیل پیش بینی با استفاده از پایتون با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:23:00
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:01,439 –> 00:00:04,240
سلام به همه خوش آمدید به روز نهم
2
00:00:04,240 –> 00:00:06,799
سری پایتون در جلسه امروز ما در
3
00:00:06,799 –> 00:00:09,360
مورد تجزیه و تحلیل پیشگویانه در پایتون یاد می گیریم،
4
00:00:09,360 –> 00:00:11,519
بنابراین اجازه دهید دستور
5
00:00:11,519 –> 00:00:13,679
جلسه را ببینیم ابتدا در مورد
6
00:00:13,679 –> 00:00:16,320
آنالیز پیش بینی در پایتون صحبت می
7
00:00:16,320 –> 00:00:18,480
کنیم سپس به آن نیز خواهیم پرداخت. انجام یک
8
00:00:18,480 –> 00:00:20,720
تجزیه و تحلیل عملی پیش بینی با استفاده از یک
9
00:00:20,720 –> 00:00:23,119
مجموعه داده نمونه به طوری که همه با دستور کار است،
10
00:00:23,119 –> 00:00:24,880
اجازه دهید جلسه را شروع کنیم، اما قبل از
11
00:00:24,880 –> 00:00:26,960
شروع جلسه، حتماً در
12
00:00:26,960 –> 00:00:28,800
کانال ما مشترک شوید و نماد زنگ را فشار
13
00:00:28,800 –> 00:00:30,480
دهید تا هیچ به روز رسانی را از دست ندهید.
14
00:00:30,480 –> 00:00:32,159
15
00:00:32,159 –> 00:00:34,239
تجزیه و تحلیل پیشبینیکننده از ما چیست، بنابراین
16
00:00:34,239 –> 00:00:36,559
تحلیل پیشبینیشده بهطور کاملاً ساده،
17
00:00:36,559 –> 00:00:38,640
فقط حوزهای از علم داده است که
18
00:00:38,640 –> 00:00:41,760
شامل پیشبینیهایی درباره رویدادهای آینده میشود،
19
00:00:41,760 –> 00:00:42,480
بنابراین
20
00:00:42,480 –> 00:00:44,160
شما در حال حاضر برخی از دادهها را دارید و
21
00:00:44,160 –> 00:00:45,600
میخواهید آنها را
22
00:00:45,600 –> 00:00:47,920
میخواهید، میخواهید از این دادهها استفاده کنید تا در آینده از این دادهها استفاده کنید.
23
00:00:47,920 –> 00:00:50,480
اگر دادههای جدیدی وارد شوند،
24
00:00:50,480 –> 00:00:52,480
میتوانید روی آن پیشبینی کنید که
25
00:00:52,480 –> 00:00:54,559
اساساً میتوانید
26
00:00:54,559 –> 00:00:57,600
رویدادهای آینده را پیشبینی کنید، بنابراین
27
00:00:57,600 –> 00:00:59,039
این روشی است که از تحلیل پیشبینیکننده استفاده میکنید
28
00:00:59,039 –> 00:01:01,120
و بسیار آسان است. sy برای استفاده
29
00:01:01,120 –> 00:01:03,680
نیز به ما امکان میدهد تا
30
00:01:03,680 –> 00:01:05,438
با استفاده از دادههای ما مدلی بسازیم تا
31
00:01:05,438 –> 00:01:09,040
وقتی دادههای آینده وارد سایتهای ما شد
32
00:01:09,040 –> 00:01:11,200
، مطمئن شویم که میتوانیم
33
00:01:11,200 –> 00:01:13,439
تأثیر آن نقطه داده را درک
34
00:01:13,439 –> 00:01:15,280
کنیم، بنابراین در تجزیه و تحلیل پیشبینیکننده استفاده میکنیم.
35
00:01:15,280 –> 00:01:17,119
انواع تکنیکهای آماری
36
00:01:17,119 –> 00:01:18,720
دادهکاوی مدلسازی پیشبینیکننده و یادگیری ماشینی،
37
00:01:18,720 –> 00:01:19,600
38
00:01:19,600 –> 00:01:22,240
ما از بسیاری از این مفاهیم استفاده میکنیم و
39
00:01:22,240 –> 00:01:24,560
به ما کمک میکنند تا مطمئن شویم
40
00:01:24,560 –> 00:01:26,479
که پیشبینی صحیح را دریافت میکنیم و آن
41
00:01:26,479 –> 00:01:28,640
پیشبینیها میتوانند به ما کمک کنند تا تصمیمات خود را مطلع کنیم،
42
00:01:28,640 –> 00:01:30,880
پس چرا میخواهید پیشبینی انجام دهید.
43
00:01:30,880 –> 00:01:32,799
تجزیه و تحلیل به خوبی تجزیه و تحلیل پیش بینی کننده
44
00:01:32,799 –> 00:01:34,400
اگر به درستی انجام شود می
45
00:01:34,400 –> 00:01:36,640
تواند چندین مزیت ارائه دهد که در اینجا چند مورد از
46
00:01:36,640 –> 00:01:38,560
آنها وجود دارد، بنابراین بیایید آنها را مورد بحث قرار دهیم، اولین
47
00:01:38,560 –> 00:01:40,479
مورد بازخورد است که تجزیه و تحلیل پیش بینی
48
00:01:40,479 –> 00:01:42,960
بازخورد فوری به شما ارائه می دهد، بنابراین
49
00:01:42,960 –> 00:01:44,640
بیایید بگوییم که شما یک برنامه کاربردی
50
00:01:44,640 –> 00:01:46,000
دارید که در تولید به کار گرفته اید و
51
00:01:46,000 –> 00:01:48,399
شما یک ویژگی جدید در آن
52
00:01:48,399 –> 00:01:50,159
ایجاد کردهاید که به چند کاربر اجازه دادهاید تا
53
00:01:50,159 –> 00:01:52,479
آزمایش بتا کنند که پاسخ چگونه بوده است و
54
00:01:52,479 –> 00:01:54,640
پاسخ در آینده چگونه خواهد بود.
55
00:01:54,640 –> 00:01:56,479
پس شما آن را با 10 نفر آزمایش کردید
56
00:01:56,479 –> 00:01:58,000
و آنها آن را در منطقه جغرافیایی خاص دوست داشتند.
57
00:01:58,000 –> 00:02:00,000
58
00:02:00,000 –> 00:02:01,600
59
00:02:01,600 –> 00:02:03,200
60
00:02:03,200 –> 00:02:05,200
61
00:02:05,200 –> 00:02:07,040
62
00:02:07,040 –> 00:02:09,679
آن را بر اساس آن مدل کنید و سپس
63
00:02:09,679 –> 00:02:11,680
پیشبینی میکنید و سعی میکنید و متوجه
64
00:02:11,680 –> 00:02:14,640
میشوید که چه نوع ویژگیهایی
65
00:02:14,640 –> 00:02:16,720
برای چه نوع منطقهای مناسبتر هستند و در
66
00:02:16,720 –> 00:02:18,319
آینده اگر
67
00:02:18,319 –> 00:02:19,680
این نوع ویژگیها را ایجاد کنید، در کجا
68
00:02:19,680 –> 00:02:22,239
میتوانند به کار گرفته شوند تا به
69
00:02:22,239 –> 00:02:22,959
شما
70
00:02:22,959 –> 00:02:24,480
پیشبینی کنند. تجزیه و تحلیل به شما این امکان را می دهد که به
71
00:02:24,480 –> 00:02:26,959
طور مشابه بازخورد فوری داشته باشید اگر
72
00:02:26,959 –> 00:02:29,200
در زمینه فروش یا بازاریابی هستید
73
00:02:29,200 –> 00:02:31,840
و استراتژی فروش یا بازاریابی را
74
00:02:31,840 –> 00:02:33,360
به کار گرفته اید تا
75
00:02:33,360 –> 00:02:35,120
محصول فعلی
76
00:02:35,120 –> 00:02:37,040
شما بتواند در چندین زمینه بازاریابی شود و
77
00:02:37,040 –> 00:02:40,000
داده ها و پاسخ ها را دریافت کنید و
78
00:02:40,000 –> 00:02:41,599
به راحتی می توانید از روش های پیش بینی کننده استفاده کنید. مدل سازی برای
79
00:02:41,599 –> 00:02:43,680
درک این روند که
80
00:02:43,680 –> 00:02:46,319
مردم چقدر آن را دوست دارند؟
81
00:02:46,319 –> 00:02:47,200
82
00:02:47,200 –> 00:02:49,120
83
00:02:49,120 –> 00:02:50,959
در
84
00:02:50,959 –> 00:02:53,280
آینده به جای اینکه شما منتظر بمانید
85
00:02:53,280 –> 00:02:56,560
تا ببینید روند نشان می دهد،
86
00:02:56,560 –> 00:02:58,319
می توانید فقط به داده ها نگاهی بیندازید و
87
00:02:58,319 –> 00:03:00,159
سپس بفهمید که چه چیزی خواهد بود، سپس
88
00:03:00,159 –> 00:03:02,800
بهینه سازی می آید، بنابراین اگر به عنوان مثال
89
00:03:02,800 –> 00:03:05,360
اگر مراقب باشید، مثال فروش خود را پیش ببریم
90
00:03:05,360 –> 00:03:07,519
اگر شما از فروش و بازاریابی برای
91
00:03:07,519 –> 00:03:09,200
یک محصول خاص برای
92
00:03:09,200 –> 00:03:10,800
تبلیغ یک محصول خاص استفاده می کنید
93
00:03:10,800 –> 00:03:12,720
و یک تبلیغ خاص
94
00:03:12,720 –> 00:03:15,519
توسط شما استفاده می شود، اما آن تبلیغ به
95
00:03:15,519 –> 00:03:18,159
اندازه کافی بازدید یا درآمد کافی
96
00:03:18,159 –> 00:03:19,680
به اندازه ای که فکر می کردید ایجاد نمی کند،
97
00:03:19,680 –> 00:03:22,480
بنابراین اکنون زمان آن فرا رسیده است.
98
00:03:22,480 –> 00:03:24,799
برای بهینهسازی استراتژی خود و این
99
00:03:24,799 –> 00:03:26,799
کار با استفاده از تحلیل پیشبینیکننده انجام میشود
100
00:03:26,799 –> 00:03:29,440
، به دادههایی که ایجاد میکنید نگاهی بیندازید. یک کمپین جدید
101
00:03:29,440 –> 00:03:30,560
102
00:03:30,560 –> 00:03:32,560
از آن کمپین استفاده کنید، دادهها را دریافت کنید و
103
00:03:32,560 –> 00:03:34,560
پیشبینیها را با پیشبینیهای
104
00:03:34,560 –> 00:03:36,720
قبلی مقایسه کنید و اگر عملکرد
105
00:03:36,720 –> 00:03:38,879
بهتری دارد. همان تعداد روزهایی که
106
00:03:38,879 –> 00:03:41,599
روز قبل انجام داد به این معنی است
107
00:03:41,599 –> 00:03:43,599
که استراتژی فعلی شما
108
00:03:43,599 –> 00:03:46,000
نسبت به قبلی و با
109
00:03:46,000 –> 00:03:48,080
این بازخورد و بهینه سازی بهینه تر است. در نهایت شما
110
00:03:48,080 –> 00:03:50,080
با استراتژیهای بهتری میروید، میتوانید
111
00:03:50,080 –> 00:03:51,760
آن را با بخشهای مختلف انجام دهید، میتوانید
112
00:03:51,760 –> 00:03:53,200
آن را با استراتژیهای متعدد انجام دهید، میتوانید
113
00:03:53,200 –> 00:03:55,680
آن را با گروههای متعددی از مردم انجام دهید و
114
00:03:55,680 –> 00:03:57,680
میتواند منجر به نتایج بهتر و تصمیمگیری بهتر شود
115
00:03:57,680 –> 00:04:00,159
و این استراتژیهای بهتر
116
00:04:00,159 –> 00:04:02,400
میتواند به آگاهی کسبوکار در مورد چگونگی کمک کند. برای
117
00:04:02,400 –> 00:04:04,640
ایجاد استراتژی های آینده نیز و سپس
118
00:04:04,640 –> 00:04:07,200
کاهش ریسک وجود دارد، بنابراین کاهش ریسک
119
00:04:07,200 –> 00:04:09,760
اساساً به این معنی است که اگر
120
00:04:09,760 –> 00:04:12,000
شما کسی بودید که یک
121
00:04:12,000 –> 00:04:13,519
استراتژی بازاریابی را
122
00:04:13,519 –> 00:04:15,840
به کار گرفته بودید، اما مشکل اکنون این است که
123
00:04:15,840 –> 00:04:18,000
نمی توانید
124
00:04:18,000 –> 00:04:19,759
به تأثیراتی که فرض کنید این استراتژی خواهد داشت نگاه کنید.
125
00:04:19,759 –> 00:04:21,440
شما نمی توانید تجزیه و تحلیل پیش بینی کننده انجام دهید یا
126
00:04:21,440 –> 00:04:23,520
نمی دانید چگونه انجام دهید، پس تنها گزینه ای
127
00:04:23,520 –> 00:04:25,840
که دارید این است که فقط منتظر بمانید و ببینید
128
00:04:25,840 –> 00:04:27,680
که پول بیشتری وارد می کنید و ببینید که این
129
00:04:27,680 –> 00:04:29,600
استراتژی بازاریابی چگونه عمل می کند، در
130
00:04:29,600 –> 00:04:31,199
واقع اگر قرار نیست عملکرد
131
00:04:31,199 –> 00:04:32,720
خوبی داشته باشد و شما می توانید از طرف دیگر اگر بتوانید از تجزیه و تحلیل پیشگویانه استفاده کنید و مطمئن شوید
132
00:04:32,720 –> 00:04:34,320
که این به معنای آن است که شما در
133
00:04:34,320 –> 00:04:36,240
معرض خطر بیشتری برای جمع آوری پول نقد خود هستید.
134
00:04:36,240 –> 00:04:39,280
135
00:04:39,280 –> 00:04:40,960
136
00:04:40,960 –> 00:04:43,040
در استراتژی عملکردی است که شما
137
00:04:43,040 –> 00:04:44,639
میخواهید اجرا کند،
138
00:04:44,639 –> 00:04:47,360
پس میتوانید مطمئن باشید که بسیار خوب
139
00:04:47,360 –> 00:04:49,120
استراتژی همانطور
140
00:04:49,120 –> 00:04:51,199
که من میخواهم عمل کند، یعنی پول من
141
00:04:51,199 –> 00:04:52,880
در منطقه درست سرمایهگذاری میشود،
142
00:04:52,880 –> 00:04:53,919
143
00:04:53,919 –> 00:04:56,080
بنابراین اینها برخی از
144
00:04:56,080 –> 00:04:58,320
مزایا هستند. ممکن است موارد دیگری نیز وجود داشته باشند،
145
00:04:58,320 –> 00:05:00,400
اما این تنها در صورتی است که شما
146
00:05:00,400 –> 00:05:02,080
تحلیل پیشگویانه را به درستی انجام داده باشید
147
00:05:02,080 –> 00:05:04,000
و پاسخ صحیح را دریافت کرده باشید، اکنون اجازه
148
00:05:04,000 –> 00:05:05,600
دهید نگاهی به چند مورد استفاده از
149
00:05:05,600 –> 00:05:07,360
تحلیل پیشگو بیندازیم، بنابراین تحلیل پیشگویانه
150
00:05:07,360 –> 00:05:09,360
چندین مورد استفاده دارد و در چندین مورد استفاده می شود
151
00:05:09,360 –> 00:05:11,759
. دامنهها در چندین زمینه
152
00:05:11,759 –> 00:05:13,360
در اینجا تعدادی از آنها هستند که اولین مورد،
153
00:05:13,360 –> 00:05:15,520
پیشگیری از ریزش است، بنابراین پیشگیری مشترک
154
00:05:15,520 –> 00:05:17,280
اساساً به شما امکان میدهد بفهمید
155
00:05:17,280 –> 00:05:18,720
که آیا مشتری خدمات شما را ترک میکند یا خیر،
156
00:05:18,720 –> 00:05:20,960
اگر برای مثال
157
00:05:20,960 –> 00:05:22,639
در حال کار در نتفلیکس هستید.
158
00:05:22,639 –> 00:05:25,039
159
00:05:25,039 –> 00:05:28,160
160
00:05:28,160 –> 00:05:30,720
مشتری خدمات شما آن اشتراک را ترک میکند و
161
00:05:30,720 –> 00:05:32,800
هزینهای برای ماههای آینده پرداخت نمیکند
162
00:05:32,800 –> 00:05:33,600
و
163
00:05:33,600 –> 00:05:35,759
این بدان معناست که مشتری
164
00:05:35,759 –> 00:05:36,800
165
00:05:36,800 –> 00:05:38,800
بر اساس کاهش هزینهها، این اشتراک را ترک کرده است. با استفاده از Omer می توانید
166
00:05:38,800 –> 00:05:40,960
بفهمید که آیا مشتری
167
00:05:40,960 –> 00:05:42,800
از خدمات شما منحرف می شود یا خیر و
168
00:05:42,800 –> 00:05:45,840
با استفاده از آن می توانید خدمات جدیدی ارائه
169
00:05:45,840 –> 00:05:47,840
دهید، می توانید از آنها بپرسید که چه چیزی می تواند بهبود یابد و
170
00:05:47,840 –> 00:05:50,160
حتی می توانید پیشنهاداتی را به آنها ارائه دهید
171
00:05:50,160 –> 00:05:52,720
که به جذب آنها کمک می کند و
172
00:05:52,720 –> 00:05:54,880
آنها را در خدمت نگه می دارد. خدمات برای مدت زمان طولانی تری
173
00:05:54,880 –> 00:05:56,319
،
174
00:05:56,319 –> 00:05:58,400
هنگامی که تضمین کیفیت شبیه به افزایش
175
00:05:58,400 –> 00:06:00,080
مشتری است، می توانید
176
00:06:00,080 –> 00:06:01,840
با استفاده از برنامه های خود به تضمین کیفیت نگاهی بیندازید،
177
00:06:01,840 –> 00:06:04,240
بنابراین اگر از یک
178
00:06:04,240 –> 00:06:05,919
برنامه کاربردی استفاده می کنید یا یک سرویس را مستقر کرده
179
00:06:05,919 –> 00:06:07,360
اید و مطمئن نیستید که آیا مشتریان چه احساسی دارند یا خیر.
180
00:06:07,360 –> 00:06:10,319
181
00:06:10,319 –> 00:06:12,160
می توانید با استفاده از فرم ها، داده ها را جمع آوری کنید، می توانید
182
00:06:12,160 –> 00:06:14,639
داده ها را با استفاده از نظرسنجی ها با استفاده از گروه های متمرکز جمع آوری کنید
183
00:06:14,639 –> 00:06:16,800
و با استفاده از آن داده ها، می توانید
184
00:06:16,800 –> 00:06:18,880
از مدل سازی پیش بینی و
185
00:06:18,880 –> 00:06:21,520
تجزیه و تحلیل پیش بینی استفاده کنید تا بفهمید
186
00:06:21,520 –> 00:06:24,080
که مردم دقیقاً چه چیزی می خواهند و چه
187
00:06:24,080 –> 00:06:25,440
نوع افراد متفاوتی هستند. کسانی که
188
00:06:25,440 –> 00:06:27,199
می خواهند انواع مختلفی
189
00:06:27,199 –> 00:06:29,039
از ویژگی ها را داشته باشند،
190
00:06:29,039 –> 00:06:31,360
افرادی که بیشترین درآمد را دارند از کدام ویژگی ها استفاده می کنند و
191
00:06:31,360 –> 00:06:32,960
در مورد ویژگی هایی که باید چه کار
192
00:06:32,960 –> 00:06:35,440
کنیم آنها می خواهند و شما می توانید در مورد
193
00:06:35,440 –> 00:06:37,199
این موضوع ادامه دهید و سعی کنید
194
00:06:37,199 –> 00:06:39,199
بهترین راه برای بهبود کیفیت
195
00:06:39,199 –> 00:06:40,960
خدماتی که ارائه
196
00:06:40,960 –> 00:06:42,720
می کنید چیست و آن مدل سازی ریسک است، بنابراین همانطور که قبلاً دیدیم
197
00:06:42,720 –> 00:06:44,319
198
00:06:44,319 –> 00:06:47,120
حوزه های خاصی وجود دارد که
199
00:06:47,120 –> 00:06:49,360
داشتن یک ایده روشن اینکه چگونه کارها
200
00:06:49,360 –> 00:06:51,199
در آینده پیش خواهند رفت می تواند واقعاً
201
00:06:51,199 –> 00:06:53,680
سودمند باشد و در این سناریو
202
00:06:53,680 –> 00:06:55,680
مدل سازی ریسک به این اشاره دارد که
203
00:06:55,680 –> 00:06:56,960
204
00:06:56,960 –> 00:06:58,880
آنچه که ریسک و مدل سازی به ما اجازه می دهد انجام دهیم این
205
00:06:58,880 –> 00:07:00,960
است که به ما امکان می دهد بفهمیم چه میزان
206
00:07:00,960 –> 00:07:03,440
ریسک در آن دخیل است.
207
00:07:03,440 –> 00:07:05,680
سرمایهگذاری در یک استراتژی خاص،
208
00:07:05,680 –> 00:07:08,000
سرمایهگذاری پول یا زمان،
209
00:07:08,000 –> 00:07:10,400
210
00:07:10,400 –> 00:07:11,360
211
00:07:11,360 –> 00:07:12,880
212
00:07:12,880 –> 00:07:15,360
اما اگر
213
00:07:15,360 –> 00:07:17,199
نگاهی به استراتژیای که قبلاً استفاده شده است
214
00:07:17,199 –> 00:07:20,400
بیندازیم و انتخاب کنیم، میتواند منجر به نتایج شدیدی شود که آیا باید روی یک فناوری یا استراتژی خاص سرمایهگذاری کنیم یا نه.
215
00:07:20,400 –> 00:07:22,800
اگر ابتدا آن را مدل سازی کنیم
216
00:07:22,800 –> 00:07:24,400
و سعی کنیم بفهمیم روندها چگونه پیش می
217
00:07:24,400 –> 00:07:26,720
رود، پول بیشتری برای
218
00:07:26,720 –> 00:07:28,800
آن بگذاریم،
219
00:07:28,800 –> 00:07:31,280
احتمالاً می توانیم مدل سازی ریسک پیش بینی درآمد را انجام دهیم
220
00:07:31,280 –> 00:07:32,720
221
00:07:32,720 –> 00:07:34,400
. این یکی سادهترین راه برای درک است
222
00:07:34,400 –> 00:07:37,360
اگر دادههای تاریخی در مورد فروش
223
00:07:37,360 –> 00:07:38,560
دارید، میتوانید
224
00:07:38,560 –> 00:07:40,960
تجزیه و تحلیل پیشبینیکننده انجام دهید تا پیشبینی
225
00:07:40,960 –> 00:07:42,880
کنید که فروش در
226
00:07:42,880 –> 00:07:44,879
هفته آینده یا ماه آینده چگونه پیش میرود و به
227
00:07:44,879 –> 00:07:47,360
این ترتیب میتوانیم فقط پس از
228
00:07:47,360 –> 00:07:49,280
پیشبینی فروش
229
00:07:49,280 –> 00:07:52,000
اگر تغییراتی در فروش در استراتژی فروش ما لازم باشد می تواند به راحتی تغییراتی ایجاد کند،
230
00:07:52,000 –> 00:07:54,319
231
00:07:54,319 –> 00:07:56,639
بنابراین اکنون اجازه
232
00:07:56,639 –> 00:07:58,639
دهید نگاهی به چند مرحله درگیر در
233
00:07:58,639 –> 00:08:00,400
تجزیه و تحلیل پیش بینی بیندازیم، بنابراین
234
00:08:00,400 –> 00:08:02,479
تجزیه و تحلیل پیش بینی فرآیندی است که شامل
235
00:08:02,479 –> 00:08:03,680
چندین مرحله است
236
00:08:03,680 –> 00:08:06,160
مرحله اول تعریف مشکل است، بنابراین
237
00:08:06,160 –> 00:08:08,160
مشکل چیست بنابراین اساساً به این
238
00:08:08,160 –> 00:08:10,240
معنی است که ما سعی می کنیم و تعریف می کنیم که مشکلی
239
00:08:10,240 –> 00:08:11,759
که در تلاش برای حل آن است، زمانی که
240
00:08:11,759 –> 00:08:13,599
می خواهیم پیش بینی کنیم که آیا
241
00:08:13,599 –> 00:08:15,759
مشتری سرگردان است یا نه،
242
00:08:15,759 –> 00:08:17,599
به مجموعه خاصی از داده ها نیاز داریم و اگر به یک
243
00:08:17,599 –> 00:08:20,080
طرز فکر خاص نیاز داریم. به عنوان مثال، ما
244
00:08:20,080 –> 00:08:21,840
مشکل را از قبل تعریف نمی کنیم،
245
00:08:21,840 –> 00:08:23,280
می توانیم در نهایت
246
00:08:23,280 –> 00:08:24,800
منابع زیادی را برای
247
00:08:24,800 –> 00:08:26,160
حل مشکلی سرمایه گذاری کنیم که لزوماً آن چیزی
248
00:08:26,160 –> 00:08:27,919
نیست که ما نیاز به
249
00:08:27,919 –> 00:08:30,160
حل آن داشتیم تا حل شود. برای اینکه تعریف مشکل داشته باشیم
250
00:08:30,160 –> 00:08:32,799
و کل تیمی
251
00:08:32,799 –> 00:08:34,958
که برای توسعه یک
252
00:08:34,958 –> 00:08:37,120
مدل تحلیلی پیشبینیکننده کار میکند، باید
253
00:08:37,120 –> 00:08:38,799
در یک صفحه
254
00:08:38,799 –> 00:08:40,799
باشند، همه آنها باید بدانند
255
00:08:40,799 –> 00:08:42,399
مشکلی که در تلاش برای حل آن هستند
256
00:08:42,399 –> 00:08:43,839
، جمعآوری دادهها چیست. یک
257
00:08:43,839 –> 00:08:46,080
جنبه مهم است، عمدتاً زیرا اگر
258
00:08:46,080 –> 00:08:47,600
کیفیت دادههایی که جمعآوری کردهاید
259
00:08:47,600 –> 00:08:49,200
خوب نباشد، مدلی که
260
00:08:49,200 –> 00:08:51,200
دریافت میکنید نیز خوب نخواهد بود،
261
00:08:51,200 –> 00:08:53,519
بنابراین کاری که ما انجام میدهیم این است که دادهها
262
00:08:53,519 –> 00:08:56,320
را میگیریم و از آن دادهها استفاده میکنیم، دادهها را از
263
00:08:56,320 –> 00:08:59,040
چندین مورد میگیریم. منابع را جمع آوری می کنیم
264
00:08:59,040 –> 00:09:01,120
و هر چه داده های بیشتری داشته باشیم،
265
00:09:01,120 –> 00:09:03,279
داده های بهتری داریم به این معنی است
266
00:09:03,279 –> 00:09:04,959
که داده های بیشتری برای تجزیه و تحلیل وجود دارد و داده های
267
00:09:04,959 –> 00:09:07,760
بیشتری برای بررسی تمیز کردن و
268
00:09:07,760 –> 00:09:10,160
انجام سایر مراحل زیر وجود دارد، اما با
269
00:09:10,160 –> 00:09:12,320
این حال داده های بیشتری به این معنی است. پس از
270
00:09:12,320 –> 00:09:14,560
تمام مراحل، ما همچنان
271
00:09:14,560 –> 00:09:17,040
حجم بیشتری از داده ها را خواهیم داشت که می توانیم از آنها برای
272
00:09:17,040 –> 00:09:19,279
آموزش مدل خود استفاده کنیم، سپس پاکسازی داده ها انجام می شود، بنابراین
273
00:09:19,279 –> 00:09:20,880
تمیز کردن داده ها اساساً به این معنی است که پس
274
00:09:20,880 –> 00:09:22,480
از جمع آوری داده ها، نگاهی به آن بیندازیم.
275
00:09:22,480 –> 00:09:24,560
e مقادیر گم شده نگاهی به
276
00:09:24,560 –> 00:09:27,760
مقادیر uh می اندازیم که مهم نیستند یا
277
00:09:27,760 –> 00:09:30,320
مقادیر نادرست هستند و
278
00:09:30,320 –> 00:09:33,279
آن مقادیر را از جمله مقادیر کمینه پرت
279
00:09:33,279 –> 00:09:34,240
280
00:09:34,240 –> 00:09:36,320
که بالاتر یا کمتر از
281
00:09:36,320 –> 00:09:38,720
حداقل یا حداکثر مقادیر مورد نیاز ما
282
00:09:38,720 –> 00:09:41,200
هستند و غیره حذف می کنیم. بنابراین پاکسازی دادهها
283
00:09:41,200 –> 00:09:43,760
به ما امکان میدهد
284
00:09:43,760 –> 00:09:45,360
کیفیت دادههایی را که در اختیار داریم بهبود ببخشیم که به نوبه خود
285
00:09:45,360 –> 00:09:47,600
کیفیت مدل را بهبود میبخشد،
286
00:09:47,600 –> 00:09:50,000
سپس
287
00:09:50,000 –> 00:09:51,519
تحلیل دادهها به راحتی قابل درک است.
288
00:09:51,519 –> 00:09:53,200
289
00:09:53,200 –> 00:09:55,360
290
00:09:55,360 –> 00:09:56,560
با تمیز کردن آن سعی می کنیم و بفهمیم که
291
00:09:56,560 –> 00:09:58,160
آیا داده هایی که در اختیار داریم در مناطق خاصی تعصب دارند یا خیر آیا
292
00:09:58,160 –> 00:10:01,040
293
00:10:01,040 –> 00:10:03,120
به درستی کار می کند آیا
294
00:10:03,120 –> 00:10:05,120
مقادیر مناسبی دارد یا خیر و غیره سپس
295
00:10:05,120 –> 00:10:07,040
مدل سازی داده ها
296
00:10:07,040 –> 00:10:09,120
اساساً زمانی است که ما مدل را آموزش می دهیم. با استفاده
297
00:10:09,120 –> 00:10:11,120
از دادههایی که جمعآوری کردهایم
298
00:10:11,120 –> 00:10:13,200
و با استفاده از مدلسازی دادهها تجزیه و تحلیل کردهایم،
299
00:10:13,200 –> 00:10:14,959
300
00:10:14,959 –> 00:10:16,560
اساساً دادهها را میگیریم و یک
301
00:10:16,560 –> 00:10:18,880
مدل یادگیری ماشینی با استفاده از الگوریتمهای از پیش موجود
302
00:10:18,880 –> 00:10:20,800
t ایجاد میکنیم. سپس
303
00:10:20,800 –> 00:10:22,480
مدلی را که ایجاد کردهایم آزمایش میکنیم
304
00:10:22,480 –> 00:10:25,279
یا ممکن است به درستی عمل نکند، بنابراین برای
305
00:10:25,279 –> 00:10:26,880
بررسی اینکه آیا
306
00:10:26,880 –> 00:10:29,040
تا سطح رضایتبخش کار میکند یا نه،
307
00:10:29,040 –> 00:10:30,160
دادههایی را
308
00:10:30,160 –> 00:10:31,040
برای
309
00:10:31,040 –> 00:10:33,440
آزمایش آن مجموعه داده کنار میگذاریم، چیزی است
310
00:10:33,440 –> 00:10:35,279
که مدل در آن ندیده است. مرحله آموزش
311
00:10:35,279 –> 00:10:37,200
یا فاز مدل سازی و سپس
312
00:10:37,200 –> 00:10:38,959
اتفاقی که می افتد این است که داده ها را به آن نشان می دهیم و از
313
00:10:38,959 –> 00:10:41,360
قبل خروجی ای را که داده ها
314
00:10:41,360 –> 00:10:42,560
باید تولید کند می
315
00:10:42,560 –> 00:10:44,480
دانیم و سپس آن را به مدل می دهیم
316
00:10:44,480 –> 00:10:46,240
و سپس مدل خروجی را تولید می کند و خروجی را
317
00:10:46,240 –> 00:10:47,519
مقایسه می کنیم و متوجه می شویم
318
00:10:47,519 –> 00:10:49,279
که آیا اینکه آیا خروجی درست است یا نه
319
00:10:49,279 –> 00:10:52,480
و چقدر خروجی نادرست است
320
00:10:52,480 –> 00:10:54,320
و بر اساس آن یک نمره دقت به آن می
321
00:10:54,320 –> 00:10:57,040
دهیم که از صفر تا یک صفر
322
00:10:57,040 –> 0