در این مطلب، ویدئو آموزش کامل پایتون: ارزش طول عمر مشتری و تجزیه و تحلیل RFM با استفاده از یادگیری ماشین با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 1:43:52
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,000 –> 00:00:01,439
بسیار خوب، به همه خوش آمدید به
2
00:00:01,439 –> 00:00:03,360
یک آزمایشگاه یادگیری هیجان انگیز دیگر، این
3
00:00:03,360 –> 00:00:05,440
آزمایشگاه یادگیری 59 است
4
00:00:05,440 –> 00:00:07,200
و آنچه که این یکی روی آن تمرکز دارد،
5
00:00:07,200 –> 00:00:08,960
ارزش طول عمر مشتری است
6
00:00:08,960 –> 00:00:10,639
و ما امروز کار ویژه ای انجام خواهیم داد،
7
00:00:10,639 –> 00:00:13,280
این اولین
8
00:00:13,280 –> 00:00:16,560
آزمایشگاه کامل پایتون ما است و برای شما عزیزان
9
00:00:16,560 –> 00:00:16,960
10
00:00:16,960 –> 00:00:18,640
کسانی که من را در علم کسب و کار دنبال کرده اند،
11
00:00:18,640 –> 00:00:20,640
من بنیانگذار و مدیر عامل هستم، نام من
12
00:00:20,640 –> 00:00:21,680
مات است
13
00:00:21,680 –> 00:00:23,359
و اگر تازه وارد علم تجارت شده اید،
14
00:00:23,359 –> 00:00:25,439
خوش آمدید، زیرا این
15
00:00:25,439 –> 00:00:26,960
واقعاً هیجان انگیز است، می دانم
16
00:00:26,960 –> 00:00:28,800
که ما افراد جدیدی را جذب می کنیم که به این دلیل است.
17
00:00:28,800 –> 00:00:30,000
مسیر جدید پایتون
18
00:00:30,000 –> 00:00:31,679
که ما به تازگی در
19
00:00:31,679 –> 00:00:33,520
علم کسب و کار و
20
00:00:33,520 –> 00:00:35,200
در برنامه آزمایشگاههای یادگیری خود ارائه میکنیم،
21
00:00:35,200 –> 00:00:37,600
همان چیزی است که شما در حال حاضر میبینید،
22
00:00:37,600 –> 00:00:39,680
ما خواهیم بود که اکنون آزمایشگاههای کامل پایتون را ارائه میکنیم،
23
00:00:39,680 –> 00:00:41,280
24
00:00:41,280 –> 00:00:43,200
بنابراین دو هفته پیش ما آیا
25
00:00:43,200 –> 00:00:44,719
ارزش طول عمر مشتری با
26
00:00:44,719 –> 00:00:47,360
مدلهای r و مرتب در این هفته چیزی که ما
27
00:00:47,360 –> 00:00:48,000
28
00:00:48,000 –> 00:00:51,120
انجام میدهیم همان مشکل مشابه است،
29
00:00:51,120 –> 00:00:52,800
اما در حال تجزیه و تحلیل آن با پایتون و
30
00:00:52,800 –> 00:00:54,879
scikit-learn هستیم و میخواهیم
31
00:00:54,879 –> 00:00:57,440
یک برنامه داش خوب ارائه کنیم.
32
00:00:57,440 –> 00:00:59,359
یک دقیقه دیگر اینجا نمایش داده می شود
33
00:00:59,359 –> 00:01:01,199
این به اعضای حرفهای ll ما
34
00:01:01,199 –> 00:01:03,039
میرود و من
35
00:01:03,039 –> 00:01:05,600
آن را در یک ثانیه در اینجا نشان میدهم، بنابراین
36
00:01:05,600 –> 00:01:06,640
37
00:01:06,640 –> 00:01:09,200
ما از اینجا شروع خواهیم کرد.
38
00:01:09,200 –> 00:01:10,799
39
00:01:10,799 –> 00:01:12,159
یک آزمایشگاه یادگیری علوم کسب و کار
40
00:01:12,159 –> 00:01:13,119
قبل از
41
00:01:13,119 –> 00:01:16,159
اینکه نسبتاً با کد سنگین باشد، بنابراین ما
42
00:01:16,159 –> 00:01:16,479
حدود
43
00:01:16,479 –> 00:01:19,280
10 15 دقیقه گفتگو
44
00:01:19,280 –> 00:01:20,960
داریم که در آن مشکل کسب و کار را بررسی می
45
00:01:20,960 –> 00:01:22,400
کنیم و در مورد چالش ها صحبت خواهیم کرد،
46
00:01:22,400 –> 00:01:24,000
چیزهایی که فناوری هایی که
47
00:01:24,000 –> 00:01:24,960
قرار است پیاده سازی کنیم.
48
00:01:24,960 –> 00:01:26,479
و سپس در
49
00:01:26,479 –> 00:01:29,040
عرض 15 تا 20 دقیقه
50
00:01:29,040 –> 00:01:31,280
به کدی میرویم، بنابراین وقتی وارد
51
00:01:31,280 –> 00:01:32,479
آن کد شدیم، این همان کاری است که قرار است
52
00:01:32,479 –> 00:01:33,040
انجام
53
00:01:33,040 –> 00:01:34,320
دهیم، درک دادههای زیادی را انجام
54
00:01:34,320 –> 00:01:35,280
خواهیم داد و ما قرار است
55
00:01:35,280 –> 00:01:37,200
ویژگیهایی را بسازیم که به آن ویژگیهای
56
00:01:37,200 –> 00:01:38,560
rfm میگویند که مخفف
57
00:01:38,560 –> 00:01:42,000
فرکانس جدید و پولی است، بنابراین
58
00:01:42,000 –> 00:01:44,320
در مورد کسبوکار بیشتر در مورد آن صحبت خواهم کرد،
59
00:01:44,320 –> 00:01:45,600
اما ما از
60
00:01:45,600 –> 00:01:47,280
پانداهای زیادی برای تجزیه و تحلیل استفاده خواهیم کرد و خواهیم بود.
61
00:01:47,280 –> 00:01:49,040
با ساختن چند طرح و
62
00:01:49,040 –> 00:01:50,159
سپس کاری که می خواهیم انجام دهیم این است
63
00:01:50,159 –> 00:01:51,360
که وارد ماشین شویم و یادگیری
64
00:01:51,360 –> 00:01:52,479
65
00:01:52,479 –> 00:01:54,399
اینجاست که این ابزار به نام scikit-learn
66
00:01:54,399 –> 00:01:56,880
بسیار مفید خواهد بود، ما
67
00:01:56,880 –> 00:01:58,880
دو مدل تقویت xg ایجاد می کنیم که
68
00:01:58,880 –> 00:01:59,280
69
00:01:59,280 –> 00:02:01,840
یکی برای پیش بینی احتمالات ایجاد می کنیم و
70
00:02:01,840 –> 00:02:04,000
این از نظر فنی یک مشکل طبقه بندی
71
00:02:04,000 –> 00:02:06,560
است و سپس ما خواهیم بود.
72
00:02:06,560 –> 00:02:08,479
ایجاد یکی برای
73
00:02:08,479 –> 00:02:11,680
پیشبینی هزینههای بعدی در ۹۰ روز
74
00:02:11,680 –> 00:02:14,400
که مشتریان خرج خواهند کرد و به آن مشکل رگرسیون میگویند،
75
00:02:14,400 –> 00:02:16,239
76
00:02:16,239 –> 00:02:18,400
بنابراین هنگامی که یادگیری ماشینی خود
77
00:02:18,400 –> 00:02:20,160
را انجام دادیم، پیشبینیهایی انجام میدهیم و سپس
78
00:02:20,160 –> 00:02:22,000
آن پیشبینیها را در
79
00:02:22,000 –> 00:02:23,440
برنامهای که کاربران کسبوکار انجام میدهند قیف میکنیم.
80
00:02:23,440 –> 00:02:25,280
می توانید از آن استفاده کنید و این چیزی است که
81
00:02:25,280 –> 00:02:27,360
ما امروز در اینجا به نمایش
82
00:02:27,360 –> 00:02:29,680
خواهیم گذاشت، این پاداش ll pro است، بنابراین اگر به
83
00:02:29,680 –> 00:02:32,080
lo pro بپیوندید من در عرض یک دقیقه در مورد این موضوع صحبت خواهم کرد،
84
00:02:32,080 –> 00:02:34,319
شما این برنامه را به عنوان یک جایزه دریافت خواهید کرد،
85
00:02:34,319 –> 00:02:35,760
بنابراین بسیار زیاد است. روند کار در سطحی
86
00:02:35,760 –> 00:02:37,200
که امروز از طریق هزار پا از آن عبور خواهیم کرد،
87
00:02:37,200 –> 00:02:39,360
امم،
88
00:02:39,360 –> 00:02:41,040
بیایید این کار را
89
00:02:41,040 –> 00:02:43,440
برای کسانی از شما که قبلاً
90
00:02:43,440 –> 00:02:45,040
هرگز آزمایشگاه یادگیری ندیدهاند یا برای کسانی از
91
00:02:45,040 –> 00:02:45,760
شما که
92
00:02:45,760 –> 00:02:48,400
علاقه مند به پیوستن هستند آغاز کنیم. g Learning labs pro
93
00:02:48,400 –> 00:02:50,319
ما این دو هفته یکبار را پیشنهاد می کنیم،
94
00:02:50,319 –> 00:02:53,760
95
00:02:53,760 –> 00:02:55,920
اگر می خواهید آن ها را بررسی کنید، همین الان لینک ها را در چت قرار می دهم.
96
00:02:55,920 –> 00:02:58,159
97
00:02:58,159 –> 00:02:59,920
98
00:02:59,920 –> 00:03:02,800
فقط انواع
99
00:03:02,800 –> 00:03:03,440
موضوعاتی است
100
00:03:03,440 –> 00:03:05,040
که خارج از برنامههای درسی رشتههای هنری اصلی کسبوکار
101
00:03:05,040 –> 00:03:07,040
و مسیر پایتون هستند،
102
00:03:07,040 –> 00:03:08,159
103
00:03:08,159 –> 00:03:10,159
بنابراین فراتر از ابزارهای پایه،
104
00:03:10,159 –> 00:03:12,239
دانشآموزان من نمونههای خاصی
105
00:03:12,239 –> 00:03:13,519
106
00:03:13,519 –> 00:03:16,000
از مشکلات و فناوریهای تجاری را درخواست کردهاند
107
00:03:16,000 –> 00:03:17,599
که میخواهند اجرا شوند
108
00:03:17,599 –> 00:03:19,200
و اینجاست که Learning labs pro
109
00:03:19,200 –> 00:03:21,280
وارد میشود. بازی بنابراین هر دو هفته یک بار کاری که ما انجام می دهیم
110
00:03:21,280 –> 00:03:22,239
یک آزمایشگاه جدید است
111
00:03:22,239 –> 00:03:24,239
یا به طور کلی یک ساعت پروژه ای است
112
00:03:24,239 –> 00:03:25,440
که
113
00:03:25,440 –> 00:03:27,120
این هفته انجام می شود و
114
00:03:27,120 –> 00:03:28,959
در طول چند هفته آینده ارزش طول عمر مشتری را طی خواهد کرد، ما
115
00:03:28,959 –> 00:03:30,159
116
00:03:30,159 –> 00:03:32,959
مدل سازی رسانه های ترکیبی بازاریابی را انجام خواهیم داد و خواهیم رفت. برای
117
00:03:32,959 –> 00:03:33,360
انجام
118
00:03:33,360 –> 00:03:35,599
کارهای بیشتر ما
119
00:03:35,599 –> 00:03:37,680
بین r و پایتون جابهجا
120
00:03:37,680 –> 00:03:38,959
میشویم، بنابراین میتوانید در اینجا ببینید ما r را
121
00:03:38,959 –> 00:03:40,720
داریم، پایتون داریم و
122
00:03:40,720 –> 00:03:42,000
فنآوریهای مختلف
123
00:03:42,000 –> 00:03:43,840
زیادی داریم، بنابراین میخواهیم رفتن thr اوه اینها را
124
00:03:43,840 –> 00:03:46,959
قبلاً داریم این 59امین آزمایشگاه است،
125
00:03:46,959 –> 00:03:48,799
بنابراین 58 مورد از اینها قبلاً در
126
00:03:48,799 –> 00:03:50,959
Learninglabs pro وجود دارد، این یکی فردا در اینجا اضافه می
127
00:03:50,959 –> 00:03:51,360
شود
128
00:03:51,360 –> 00:03:54,480
و به
129
00:03:54,480 –> 00:03:58,159
عنوان آزمایشگاه 59 ملحق می شود آنچه واقعاً جالب
130
00:03:58,159 –> 00:04:00,400
است در این آزمایشگاه ها است که من
131
00:04:00,400 –> 00:04:02,480
جوایز زیادی به شما می دهم. این فقط نمونهای از
132
00:04:02,480 –> 00:04:03,760
برخی از
133
00:04:03,760 –> 00:04:05,760
پاداشهایی است که من در هفتههای گذشته
134
00:04:05,760 –> 00:04:07,120
135
00:04:07,120 –> 00:04:08,879
دادهام و به اعضای حرفهای ll من میرسد، بنابراین وقتی
136
00:04:08,879 –> 00:04:10,640
به آن ملحق میشوید نه تنها کد
137
00:04:10,640 –> 00:04:11,840
و ویدیوها را دریافت میکنید، بلکه همه آنها را دریافت میکنید.
138
00:04:11,840 –> 00:04:14,799
امتیازات ویژه و به طور کلی
139
00:04:14,799 –> 00:04:15,599
می توانید ببینید
140
00:04:15,599 –> 00:04:16,959
که من یک موضوع در حال اجرا دارم، من
141
00:04:16,959 –> 00:04:18,880
142
00:04:18,880 –> 00:04:21,519
برنامه های براق زیادی را ارائه کرده ام، بنابراین اگر با r آشنا هستید
143
00:04:21,519 –> 00:04:22,639
، یک
144
00:04:22,639 –> 00:04:24,720
چارچوب برنامه به نام shiny وجود دارد و
145
00:04:24,720 –> 00:04:27,199
می توانید برنامه هایی را با علم داده بسازید تا
146
00:04:27,199 –> 00:04:29,120
ادغام شوند. چیزهایی مانند پشتههای مدلهای مرتب
147
00:04:29,120 –> 00:04:31,199
برای
148
00:04:31,199 –> 00:04:34,400
مجموعهها مشعل و دستورالعملهای متنی r سبک gbm و r
149
00:04:34,400 –> 00:04:38,000
برای nlp کتابخانه جاسازی
150
00:04:38,000 –> 00:04:38,720
برای
151
00:04:38,720 –> 00:04:42,320
تجزیه و تحلیل بخشبندی مشتریان و
152
00:04:42,320 –> 00:04:43,520
بنابراین ما برنامههای زیادی را ارائه میدهیم
153
00:04:43,520 –> 00:04:45,280
که این فناوریها را ادغام میکنند، اما
154
00:04:45,280 –> 00:04:46,080
155
00:04:46,080 –> 00:04:48,720
اکنون این متفاوت است. در هفته
156
00:04:48,720 –> 00:04:49,600
ما
157
00:04:49,600 –> 00:04:53,919
یک برنامه dash را ارائه می دهیم که توسط plotly ساخته شده است
158
00:04:53,919 –> 00:04:56,560
یا من آن را با چارچوب dash ساخته ام.
159
00:04:56,560 –> 00:04:57,520
این یک چارچوب وب است که
160
00:04:57,520 –> 00:04:59,600
بسیار شبیه به کاری است که shiny is in
161
00:04:59,600 –> 00:05:01,680
dash ما در پایتون انجام
162
00:05:01,680 –> 00:05:03,759
می دهد و به من امکان می دهد این برنامه را بسازم
163
00:05:03,759 –> 00:05:05,039
و ابزارها را ادغام می کند.
164
00:05:05,039 –> 00:05:08,080
مانند scikit-learn و کاری که این
165
00:05:08,080 –> 00:05:09,919
کار انجام می دهد این است که به ما امکان می دهد مشتریان خود را تجزیه و تحلیل
166
00:05:09,919 –> 00:05:11,039
167
00:05:11,039 –> 00:05:14,479
کنیم و به کسب و کار خود راه حلی ارائه دهیم
168
00:05:14,479 –> 00:05:16,240
یا محصول داده ای که به آنها امکان می دهد
169
00:05:16,240 –> 00:05:18,320
تصمیم گیری مبتنی بر داده را انجام
170
00:05:18,320 –> 00:05:21,199
دهند، بنابراین بیایید این برنامه را بررسی
171
00:05:21,199 –> 00:05:22,320
کنیم.
172
00:05:22,320 –> 00:05:25,120
نسخه ی نمایشی سریع این برنامه است این
173
00:05:25,120 –> 00:05:26,720
محصول نهایی است که ما امروز در حال تلاش برای ایجاد آن
174
00:05:26,720 –> 00:05:28,320
در این آزمایشگاه هستیم
175
00:05:28,320 –> 00:05:30,960
و کاری که ما انجام می دهیم این است که یک
176
00:05:30,960 –> 00:05:32,560
داشبورد تجزیه و تحلیل مشتری ایجاد
177
00:05:32,560 –> 00:05:35,840
می کنیم که هزینه ای را که مشتری انجام
178
00:05:35,840 –> 00:05:37,840
می دهد را پیش بینی می کند.
179
00:05:37,840 –> 00:05:39,280
در 90 روز آینده بسازید
180
00:05:39,280 –> 00:05:41,199
بنابراین این نقاط همه مشتری هستند و
181
00:05:41,199 –> 00:05:42,320
وقتی روی آنها
182
00:05:42,320 –> 00:05:46,800
می مانم می بینید که این مشتری 2941 است
183
00:05:46,800 –> 00:05:49,440
آنها آخرین آنها هستند که فرکانس
184
00:05:49,440 –> 00:05:51,360
25 خرید
185
00:05:51,360 –> 00:05:53,360
دارند احتمال پیش بینی آنها در
186
00:05:53,360 –> 00:05:56,800
90 روز آینده 88.6 است.
187
00:05:56,800 –> 00:05:58,560
درصد کل هزینه ای که آنها
188
00:05:58,560 –> 00:06:01,120
تا کنون با شرکت ما
189
00:06:01,120 –> 00:06:03,360
خرج کرده اند 86 است، هزینه پیش بینی شده در 90 روز آینده
190
00:06:03,360 –> 00:06:05,039
71 است
191
00:06:05,039 –> 00:06:07,600
و هزینه آنها در
192
00:06:07,600 –> 00:06:08,639
90 روز آینده
193
00:06:08,639 –> 00:06:11,280
در مقابل پیش بینی
194
00:06:11,280 –> 00:06:12,400
تفاوت 15 بوده است،
195
00:06:12,400 –> 00:06:14,880
بنابراین آنها 15 را خرج کردند. بیشتر از آن چیزی است که آنها
196
00:06:14,880 –> 00:06:16,319
پیش بینی کرده بودند، بنابراین شما این را چگونه
197
00:06:16,319 –> 00:06:17,280
می خوانید
198
00:06:17,280 –> 00:06:19,440
و نکته جالب این برنامه این
199
00:06:19,440 –> 00:06:20,960
است که همه مشتریان
200
00:06:20,960 –> 00:06:22,720
ما دارند و ما الگوریتمی در
201
00:06:22,720 –> 00:06:24,560
پشت صحنه داریم که
202
00:06:24,560 –> 00:06:26,400
پیش بینی می کند چه چیزی باید خرج کنند
203
00:06:26,400 –> 00:06:28,479
و آن را با آنچه آنها مقایسه می کند خرج کردهام،
204
00:06:28,479 –> 00:06:30,880
بنابراین کاری که میتوانم انجام دهم این است که میتوانم قیف را پایین بیاورم
205
00:06:30,880 –> 00:06:32,400
و وقتی شروع به قیف
206
00:06:32,400 –> 00:06:35,600
کردن میکنیم، میتوانیم ببینیم که بسیاری از این
207
00:06:35,600 –> 00:06:37,199
مشتریان وقتی این مقدار را کاهش
208
00:06:37,199 –> 00:06:40,000
میدهم، هزینه واقعی خود را منهای هزینههای
209
00:06:40,000 –> 00:06:41,759
پیشبینیشده میکنند،
210
00:06:41,759 –> 00:06:43,840
بنابراین وقتی این تعداد بسیار
211
00:06:43,840 –> 00:06:45,919
منفی میشود مشتریانی هستند که
212
00:06:45,919 –> 00:06:47,759
پیشبینی میشد بیش از هزینهای که خرج کردهاند هزینه
213
00:06:47,759 –> 00:06:48,800
کنند،
214
00:06:48,800 –> 00:06:51,840
بنابراین میتوانید ببینید که این مشتری 1079
215
00:06:51,840 –> 00:06:54,080
با احتمال فوقالعاده بالایی
216
00:06:54,080 –> 00:06:57,120
برای خرید 96 درصد از آنها
217
00:06:57,120 –> 00:06:59,360
پیشبینی میشود که 153 دلار خرج کنند و
218
00:06:59,360 –> 00:07:01,440
آنها در واقع 100 دلار
219
00:07:01,440 –> 00:07:04,240
برای دلتای منفی 53 دلار خرج کرده است، بنابراین
220
00:07:04,240 –> 00:07:05,919
ممکن است این مشتری باشد که میخواهیم
221
00:07:05,919 –> 00:07:06,639
222
00:07:06,639 –> 00:07:08,960
با یک ایمیل یا چیزی به او هدف قرار دهیم تا
223
00:07:08,960 –> 00:07:10,000
224
00:07:10,000 –> 00:07:12,400
به او کمک کنیم تا پول بیشتری را با ما خرج کنیم،
225
00:07:12,400 –> 00:07:13,759
زیرا آنها به اندازه آنها خرج نکردهاند.
226
00:07:13,759 –> 00:07:14,560
پیشبینی شده بود
227
00:07:14,560 –> 00:07:16,400
که هزینه کنید، بنابراین به این صورت میتوانید از این ابزار استفاده کنید
228
00:07:16,400 –> 00:07:17,840
و سپس آنچه جالب است این است که
229
00:07:17,840 –> 00:07:19,120
فقط میتوانید روی این دکمه به نام
230
00:07:19,120 –> 00:07:21,759
تقسیمبندی دانلود کلیک کنید و یک
231
00:07:21,759 –> 00:07:24,080
فایل csv از تمام این مشتریانی که
232
00:07:24,080 –> 00:07:24,400
233
00:07:24,400 –> 00:07:27,520
احتمالات منفی یا
234
00:07:27,520 –> 00:07:29,039
پیشبینیهای واقعی منفی نسبت به
235
00:07:29,039 –> 00:07:30,319
مقادیر پیشبینیشدهشان دارند دانلود میکند.
236
00:07:30,319 –> 00:07:32,400
کاری که ما میتوانیم انجام دهیم این است که میتوانیم آن را در یابنده نشان دهیم
237
00:07:32,400 –> 00:07:34,160
238
00:07:34,160 –> 00:07:37,440
که در اینجا باز میشود، باز کنید
239
00:07:37,440 –> 00:07:40,240
و در همانجا همه
240
00:07:40,240 –> 00:07:40,560
241
00:07:40,560 –> 00:07:41,759
افرادی را دارید که باید بیشتر
242
00:07:41,759 –> 00:07:43,360
از هزینههایشان پول خرج کنند
243
00:07:43,360 –> 00:07:45,840
و همه شناسههای مشتری آنها را دارید
244
00:07:45,840 –> 00:07:48,000
و می توانید به نوعی به پایین بروید
245
00:07:48,000 –> 00:07:49,440
و ببینید چه کسی
246
00:07:49,440 –> 00:07:52,240
پیش بینی شده است که چه کسی هزینه کند و اوه و
247
00:07:52,240 –> 00:07:52,800
چقدر
248
00:07:52,800 –> 00:07:55,840
هزینه کرده است، بنابراین این ابزار چگونه کار
249
00:07:55,840 –> 00:07:57,680
می کند، ابزار تقسیم بندی مشتری است
250
00:07:57,680 –> 00:07:59,280
و واقعاً مفید است. یا کسبوکارهایی که
251
00:07:59,280 –> 00:08:00,639
میخواهند بتوانند افرادی را هدف قرار
252
00:08:00,639 –> 00:08:02,800
دهند که به اندازهای
253
00:08:02,800 –> 00:08:04,560
که پیشبینی شده بود هزینه نمیکنند
254
00:08:04,560 –> 00:08:05,680
و این کاری است که ما
255
00:08:05,680 –> 00:08:07,599
امروز انجام میدهیم، مشکل کسبوکار ما است،
256
00:08:07,599 –> 00:08:10,639
پس بیایید در مورد مشکل کسبوکار صحبت کنیم.
257
00:08:10,639 –> 00:08:12,400
سطح اوه ما در حال
258
00:08:12,400 –> 00:08:13,639
تجزیه و تحلیل چیزی هستیم که روابط تجاری غیر قراردادی نامیده می شود
259
00:08:13,639 –> 00:08:14,879
،
260
00:08:14,879 –> 00:08:17,599
امم، این همان
261
00:08:17,599 –> 00:08:18,479
چیزی است
262
00:08:18,479 –> 00:08:21,440
که شرکت شما محصولاتی را ارائه می دهد که
263
00:08:21,440 –> 00:08:23,039
افراد می توانند هر زمان که می توانند بیایند و
264
00:08:23,039 –> 00:08:23,919
خریداری کنند، بنابراین
265
00:08:23,919 –> 00:08:25,440
مطالعه موردی که ما با
266
00:08:25,440 –> 00:08:27,199
آن کار می کنیم همان چیزی است که ما با آن کار کردیم. دو هفته
267
00:08:27,199 –> 00:08:29,759
پیش این شرکتی به نام سی دی است که حالا
268
00:08:29,759 –> 00:08:30,479
آنها یک
269
00:08:30,479 –> 00:08:33,599
شرکت بزرگ در دوران حباب دات کام بودند، اوه
270
00:08:33,599 –> 00:08:34,880
آنها شرکتی هستند که
271
00:08:34,880 –> 00:08:37,279
در اوایل دهه 2000 همراه با بسیاری از
272
00:08:37,279 –> 00:08:39,200
شرکت های دات کام دیگر از بین رفتند،
273
00:08:39,200 –> 00:08:42,240
اما آنچه جالب است این است که سی دی در حال حاضر
274
00:08:42,240 –> 00:08:44,959
مجموعه ای از داده ها را دارد که آنها
275
00:08:44,959 –> 00:08:47,519
در اوایل دهه 2000 منتشر کرده بودند و این
276
00:08:47,519 –> 00:08:50,000
موضوع مورد تجزیه و تحلیل زیادی قرار گرفت، به
277
00:08:50,000 –> 00:08:51,519
ویژه به این دلیل که این یکی از
278
00:08:51,519 –> 00:08:53,120
اولین مجموعه داده هایی است که ما به دست آوردیم یا یک
279
00:08:53,120 –> 00:08:54,399
شرکت واقعی اطلاعات
280
00:08:54,399 –> 00:08:57,440
ناشناس خود را ارائه کرده است. در
281
00:08:57,440 –> 00:08:58,720
مورد مشتریان خود
282
00:08:58,720 –> 00:09:00,959
و ما دیدیم که شما به نوعی می دانید
283
00:09:00,959 –> 00:09:03,279
که مشتریان آنها چگونه خرید کرده اند
284
00:09:03,279 –> 00:09:06,560
و الگوهای خرید واقعی آنها چگونه است، بنابراین این
285
00:09:06,560 –> 00:09:08,000
مجموعه داده بسیار مفیدی
286
00:09:08,000 –> 00:09:09,440
است که امروز با آن
287
00:09:09,440 –> 00:09:11,600
در مورد مجموعه داده ای که حاوی
288
00:09:11,600 –> 00:09:14,800
تاریخچه است کار خواهیم کرد. 66 000 تراکنش برای 25
289
00:09:14,800 –> 00:09:18,399
000 مشتری اوه، عرضه 19
290
00:09:18,399 –> 00:09:20,000
محصول جدید بود، بنابراین آنها
291
00:09:20,000 –> 00:09:22,240
سی دی نبودند که این محصولات سی دی
292
00:09:22,240 –> 00:09:24,560
هایی بودند که تقاضای قبلی نداشتند و
293
00:09:24,560 –> 00:09:26,320
مشتریان جدیدی را پوشش می دهد که هرگز
294
00:09:26,320 –> 00:09:27,920
قبل از خرید انجام نداده اند و اولین
295
00:09:27,920 –> 00:09:29,760
خرید خود را در یک زمان انجام داده اند. پنجره سه ماهه از
296
00:09:29,760 –> 00:09:30,560
یکدیگر، بنابراین
297
00:09:30,560 –> 00:09:32,480
بعداً بیشتر در مورد آن صحبت خواهیم کرد که به
298
00:09:32,480 –> 00:09:35,200
آن تحلیل کوهورت یا کوهورت می گویند
299
00:09:35,200 –> 00:09:37,360
و این یک مجموعه داده واقعا مفید
300
00:09:37,360 –> 00:09:40,720
برای آن نوع بود.
301
00:09:40,720 –> 00:09:43,519
302
00:09:43,519 –> 00:09:45,279
برای اینکه بفهمم
303
00:09:45,279 –> 00:09:46,800
در پایان روز
304
00:09:46,800 –> 00:09:49,279
روی چه مشتریانی باید تمرکز کنیم، این دقیقاً همان کاری است که ما میخواهیم انجام دهیم، من
305
00:09:49,279 –> 00:09:51,120
این کار را در علم کسب و کار زیاد انجام
306
00:09:51,120 –> 00:09:54,160
میدهم، من در حال تجزیه و تحلیل مشتریان هستم تا
307
00:09:54,160 –> 00:09:57,279
بفهمم کدام مشتریان احتمالاً تحلیلی را خریداری میکنند.
308
00:09:57,279 –> 00:09:58,480
309
00:09:58,480 –> 00:10:01,200
الگوریتمهای روی آنها
310
00:10:01,200 –> 00:10:02,800
، ما
311
00:10:02,800 –> 00:10:05,200
استراتژیهای هدفیابی ایمیل داخلی خودمان را داریم و
312
00:10:05,200 –> 00:10:06,640
چیزهایی از این دست،
313
00:10:06,640 –> 00:10:07,839
بنابراین این تکنیکهایی که
314
00:10:07,839 –> 00:10:09,519
امروز یاد میگیرید دقیقاً همان چیزی است که من
315
00:10:09,519 –> 00:10:10,079
واقعاً در
316
00:10:10,079 –> 00:10:13,440
داخل کسبوکار خودم از آن استفاده میکنم،
317
00:10:13,440 –> 00:10:15,200
بنابراین روی آن تمرکز خواهیم کرد. یک
318
00:10:15,200 –> 00:10:17,279
کار پیشبینی که میخواهیم بدانیم، دو
319
00:10:17,279 –> 00:10:18,320
چیز متفاوت که میخواهیم بدانیم
320
00:10:18,320 –> 00:10:19,760
در آینده چقدر خرج خواهند کرد،
321
00:10:19,760 –> 00:10:22,399
بنابراین میخواهیم آن
322
00:10:22,399 –> 00:10:23,440
را از نظر
323
00:10:23,440 –> 00:10:25,839
یک ارزش تجزیه و تحلیل کنیم و میتوانیم این را
324
00:10:25,839 –> 00:10:27,519
نه لزوماً از نظر فنی یک
325
00:10:27,519 –> 00:10:29,360
طول عمر مشتری در نظر بگیریم. ارزش اما
326
00:10:29,360 –> 00:10:30,640
ارزش 90 روز آینده مشتری است،
327
00:10:30,640 –> 00:10:32,079
بنابراین میخواهیم بدانیم که
328
00:10:32,079 –> 00:10:33,760
در 90 روز آینده چقدر با
329
00:10:33,760 –> 00:10:36,000
ما خرج میکنند و دو روز
330
00:10:36,000 –> 00:10:37,600
آینده چقدر با ما خرید میکنند
331
00:10:37,600 –> 00:10:38,560
و اینها
332
00:10:38,560 –> 00:10:40,959
اهداف متفاوت و استراتژیهای کمی متفاوت هستند
333
00:10:40,959 –> 00:10:41,760
و
334
00:10:41,760 –> 00:10:43,839
تکنیکهای کمی متفاوتی که
335
00:10:43,839 –> 00:10:44,959
باید برای
336
00:10:44,959 –> 00:10:46,640
پاسخ به این سؤالات پیادهسازی کنیم،
337
00:10:46,640 –> 00:10:48,720
بنابراین سه سؤال وجود دارد که من
338
00:10:48,720 –> 00:10:50,720
واقعاً میخواهم امروز روی آنها تمرکز کنم
339
00:10:50,720 –> 00:10:53,279
و این سه سؤال از مهمترین آنها هستند. تکههای
340
00:10:53,279 –> 00:10:53,839
341
00:10:53,839 –> 00:10:56,560
بدی که امروز از بین میبرید،
342
00:10:56,560 –> 00:10:57,519
سؤالاتی است که
343
00:10:57,519 –> 00:11:01,680
در واقع میتوانیم برای کسبوکار
344
00:11:01,680 –> 00:11:04,640
به آنها پاسخ دهیم تا بتوانیم به آنها کمک کنیم تا
345
00:11:04,640 –> 00:11:06,240
از این تجزیه و تحلیل ارزش کسب کنند، بنابراین
346
00:11:06,240 –> 00:11:07,120
این سه سؤالی است که
347
00:11:07,120 –> 00:11:08,880
امروز به سؤال اول
348
00:11:08,880 –> 00:11:10,880
سؤال شماره یک پاسخ خواهیم داد. این است که
349
00:11:10,880 –> 00:11:11,920
مشتریان بیشترین
350
00:11:11,920 –> 00:11:14,640
احتمال خرج را در 90 روز آینده دارند، بنابراین
351
00:11:14,640 –> 00:11:15,519
352
00:11:15,519 –> 00:11:17,839
ما از پیش بینی های خود استفاده می کنیم،
353
00:11:17,839 –> 00:11:19,600
این جدول را در اینجا ایجاد می کنیم
354
00:11:19,600 –> 00:11:22,800
و هر کدام از اینها یک شناسه مشتری دارند
355
00:11:22,800 –> 00:11:24,560
و می توانیم آن را مرتب کنیم و می توانید من را ببینید. ‘m
356
00:11:24,560 –> 00:11:25,920
از مقادیر مرتبسازی در اینجا
357
00:11:25,920 –> 00:11:28,800
با استفاده از این ستون، احتمال را پیشبینی میکند و
358
00:11:28,800 –> 00:11:29,279
359
00:11:29,279 –> 00:11:31,839
این بالاترین احتمال خرید را
360
00:11:31,839 –> 00:11:33,200
در 90 روز آینده دارد،
361
00:11:33,200 –> 00:11:34,399
بنابراین ما میتوانیم به این
362
00:11:34,399 –> 00:11:36,640
سؤال بلافاصله برای کسبوکارمان پاسخ دهیم.
363
00:11:36,640 –> 00:11:37,680
364
00:11:37,680 –> 00:11:39,839
سؤال بعدی سؤال شماره دو
365
00:11:39,839 –> 00:11:42,079
که مشتریان اخیرا خرید کردهاند،
366
00:11:42,079 –> 00:11:44,079
اما بعید است که بخرند، بنابراین این یک
367
00:11:44,079 –> 00:11:45,440
نوع سوال متفاوت است،
368
00:11:45,440 –> 00:11:47,440
زیرا کاری که ما در حال حاضر انجام میدهیم این است که
369
00:11:47,440 –> 00:11:50,320
میگوییم خوب است که آنها اخیراً خرید کردهاند،
370
00:11:50,320 –> 00:11:51,839
بنابراین ما مجموعه دادهای را
371
00:11:51,839 –> 00:11:54,079
که این پیشبینیهایی که ما انجام میدهیم
372
00:11:54,079 –> 00:11:57,120
و
373
00:11:57,120 –> 00:11:58,720
میخواهیم آنها را بر اساس آخرین خریدها فیلتر کنیم، بنابراین هر خریدی را بررسی میکنیم،
374
00:11:58,720 –> 00:11:59,839
375
00:11:59,839 –> 00:12:01,440
افرادی که
376
00:12:01,440 –> 00:12:03,600
در 90 روز گذشته
377
00:12:03,600 –> 00:12:05,920
چیزی نسبتاً اخیر خریدهاند و سپس ما همچنین
378
00:12:05,920 –> 00:12:06,959
میخواهیم ببینیم
379
00:12:06,959 –> 00:12:10,079
کدام یک از آنها احتمال خرید مجددشان کمتر از 20 است
380
00:12:10,079 –> 00:12:13,360
، ما آن مقادیر را مرتب میکنیم
381
00:12:13,360 –> 00:12:14,720
382
00:12:14,720 –> 00:12:17,440
و سپس چیزی که برای آن مفید است این است
383
00:12:17,440 –> 00:12:18,320
که
384
00:12:18,320 –> 00:12:21,680
بتوانیم جلوی مردم قبل از آنها دیده
385
00:12:21,680 –> 00:12:24,560
شویم.
386
00:12:24,560 –> 00:12:26,160
آن مشتری می میرد،
387
00:12:26,160 –> 00:12:28,079
ما می خواهیم او را احیا کنیم، ما می خواهیم
388
00:12:28,079 –> 00:12:30,000
آنها را تا زمانی که ممکن است حفظ کنیم،
389
00:12:30,000 –> 00:12:32,800
بنابراین شما می توانید این را تجزیه و تحلیل کنید و روی
390
00:12:32,800 –> 00:12:34,639
آن بخش از پایگاه مشتری تمرکز کنید
391
00:12:34,639 –> 00:12:38,800
و بتوانید
392
00:12:38,800 –> 00:12:41,040
برخی از این مشتریان در حال مرگ را احیا یا احیا کنید، بنابراین شما
393
00:12:41,040 –> 00:12:42,160
می خواهید این کار را انجام دهید. و
394
00:12:42,160 –> 00:12:43,760
این یکی از سؤالاتی است
395
00:12:43,760 –> 00:12:45,279
که امروز می خواهیم به آن پاسخ
396
00:12:45,279 –> 00:12:47,279
دهیم. سؤال سومی است که
397
00:12:47,279 –> 00:12:49,360
پیش بینی می شود مشتریان خریداری کنند،
398
00:12:49,360 –> 00:12:51,680
اما این کار را انجام نداده است، بنابراین این یک نوع سؤال متفاوت است
399
00:12:51,680 –> 00:12:53,600
، بنابراین اینها افرادی هستند که
400
00:12:53,600 –> 00:12:56,639
h داشتند. احتمال
401
00:12:56,639 –> 00:13:00,320
خرید بسیار زیاد است و ما میتوانیم آن را
402
00:13:00,320 –> 00:13:01,519
با پیشبینیهایی که میخواهیم انجام دهیم
403
00:13:01,519 –> 00:13:02,240
تجزیه و تحلیل
404
00:13:02,240 –> 00:13:04,560
کنیم و میخواهیم بگوییم خوب است،
405
00:13:04,560 –> 00:13:05,600
میخواهیم پیشبینی
406
00:13:05,600 –> 00:13:09,120
کنیم که کل هزینهها کل خرج 90 خواهد بود
407
00:13:09,120 –> 00:13:10,639
یا ما میخواهیم انجام دهیم.
408
00:13:10,639 –> 00:13:12,399
کسانی که
409
00:13:12,399 –> 00:13:15,200
در 90 روز آینده صفر دلار خرج کردهاند را فیلتر
410
00:13:15,200 –> 00:13:16,800
میکنیم و سپس کاری که میخواهیم انجام دهیم این است که بر اساس
411
00:13:16,800 –> 00:13:17,839
412
00:13:17,839 –> 00:13:21,279
ارزشهای هزینه پیشبینیشدهشان مرتب کنیم و میبینیم که این
413
00:13:21,279 –> 00:13:23,639
شخص 153 دلار پیشبینی کرده بود
414
00:13:23,639 –> 00:13:27,680
اما آنها صفر دلار خرج کردند.
415
00:13:27,680 –> 00:13:30,240
بهترین نوع
416
00:13:30,240 –> 00:13:31,680
فرصت است و این چیزی است که
417
00:13:31,680 –> 00:13:32,720
واقعا
418
00:13:32,720 –> 00:13:34,639
برای کسب و کار
419
00:13:34,639 –> 00:13:36,320
420
00:13:36,320 –> 00:13:37,120
421
00:13:37,120 –> 00:13:40,399
422
00:13:40,399 –> 00:13:41,279
423
00:13:41,279 –> 00:13:42,800
424
00:13:42,800 –> 00:13:44,720
ارزشمند است. و آنها دارند،
425
00:13:44,720 –> 00:13:46,160
اما نشان می دهند که باید
426
00:13:46,160 –> 00:13:48,079
خرید انجام دهند، در واقع در
427
00:13:48,079 –> 00:13:50,480
اینجا احتمال بالایی دارند 71 درصد
428
00:13:50,480 –> 00:13:52,320
و پیش بینی می شود که 153 دلار خرج کنند،
429
00:13:52,320 –> 00:13:54,320
بنابراین ما باید بفهمیم که چرا
430
00:13:54,320 –> 00:13:55,279
آنها چرا این کار را انجام نمی دهند.
431
00:13:55,279 –> 00:13:56,720
خرج نمی کنیم و ما
432
00:13:56,720 –> 00:13:58,000
باید جلوی آنها بگیریم، ما باید تیم بازاریابی خود را وادار کنیم
433
00:13:58,000 –> 00:13:59,199
434
00:13:59,199 –> 00:14:01,440
تا برای آنها ایمیل های هدفمند بفرستند
435
00:14:01,440 –> 00:14:02,800
تا آنها پول بیشتری خرج کنند، زیرا
436
00:14:02,800 –> 00:14:04,240
این یک فرصت از دست رفته است و
437
00:14:04,240 –> 00:14:05,760
می تواند درآمد زیادی برای
438
00:14:05,760 –> 00:14:07,199
شرکت شما ایجاد
439
00:14:07,199 –> 00:14:09,839
کند، پس بیایید در مورد مشتری صحبت کنیم.
440
00:14:09,839 –> 00:14:11,360
مدلسازی ارزش مادامالعمر،
441
00:14:11,360 –> 00:14:12,639
بنابراین چند
442
00:14:12,639 –> 00:14:14,480
رویکرد مختلف وجود دارد و
443
00:14:14,480 –> 00:14:15,920
اگر در
444
00:14:15,920 –> 00:14:16,480
مورد
445
00:14:16,480 –> 00:14:18,160
ارزش طول عمر مشتری تحقیق کنید،
446
00:14:18,160 –> 00:14:19,920
آیا
447
00:14:19,920 –> 00:14:22,160
مشتری یا شرکتها از این به عنوان
448
00:14:22,160 –> 00:14:23,760
معیاری برای سنجش سودآوری خود استفاده میکنند
449
00:14:23,760 –> 00:14:25,600
تا آنها بخواهند بفهمند
450
00:14:25,600 –> 00:14:27,199
کدام مشتریان هستند، چندین روش مختلف وجود دارد. آنها باید روی آن تمرکز کنند
451
00:14:27,199 –> 00:14:27,680
452
00:14:27,680 –> 00:14:29,760
و به طور کلی آنچه را که سعی می کنند و
453
00:14:29,760 –> 00:14:32,320
انجام می دهند این است که از الگوریتم های مختلفی
454
00:14:32,320 –> 00:14:34,240
برای محاسبه استفاده می کنند که می دانید ارزش
455
00:14:34,240 –> 00:14:35,360
پیش بینی
456
00:14:35,360 –> 00:14:37,120
شده این مشتری با توجه به
457
00:14:37,120 –> 00:14:39,360
سابقه خرید قبلی آنها چقدر است،
458
00:14:39,360 –> 00:14:41,519
بنابراین به طور خلاصه ارزش طول عمر مشتری
459
00:14:41,519 –> 00:14:43,360
سودی است که از آینده تخمین زده می
460
00:14:43,360 –> 00:14:45,519
شود. رابطه با یک مشتری،
461
00:14:45,519 –> 00:14:48,240
شما اساساً فقط
462
00:14:48,240 –> 00:14:50,399
یک نوع نمایه برای چگونگی این مشتری تعیین می کنید mer
463
00:14:50,399 –> 00:14:51,760
احتمالاً هزینه می کند
464
00:14:51,760 –> 00:14:53,760
و همچنین هزینه حفظ آن
465
00:14:53,760 –> 00:14:56,160
مشتری، بنابراین شما
466
00:14:56,160 –> 00:14:57,199
این هزینه ها را
467
00:14:57,199 –> 00:14:58,560
در نظر بگیرید و از آن کم کنید و این همان چیزی است که ارزش طول عمر مشتری شما
468
00:14:58,560 –> 00:15:00,399
است، بنابراین رویکردهای مختلفی وجود
469
00:15:00,399 –> 00:15:01,440
دارد که
470
00:15:01,440 –> 00:15:04,880
از استراتژی های پیچیده تر
471
00:15:04,880 –> 00:15:08,800
تا و در اینجا به نوعی شبیه یک
472
00:15:08,800 –> 00:15:11,519
اقتصاد سنجی است. رویکردی که ما داریم و من
473
00:15:11,519 –> 00:15:12,720
مقدمه این را میکنم که ما
474
00:15:12,720 –> 00:15:13,360
475
00:15:13,360 –> 00:15:15,839
رویکرد اقتصادسنجی را در اینجا پیادهسازی نمیکنیم،
476
00:15:15,839 –> 00:15:17,440
ما بیشتر از یک
477
00:15:17,440 –> 00:15:21,199
رویکرد یادگیری ماشینی پیشبینیکننده استفاده میکنیم، بنابراین یکی از راهها
478
00:15:21,199 –> 00:15:24,480
این است که محاسبه کنیم و از آن به عنوان یک یا استفاده کنیم.
479
00:15:24,480 –> 00:15:24,800
480
00:15:24,800 –> 00:15:27,199
مدل آن دارای یک جریان نقدی با تخفیف است،
481
00:15:27,199 –> 00:15:28,079
بنابراین
482
00:15:28,079 –> 00:15:30,639
شما سهمی را دارید که آن مشتری قرار است
483
00:15:30,639 –> 00:15:31,440
انجام دهد
484
00:15:31,440 –> 00:15:33,680
و سپس هزینه های او را کم می کنید
485
00:15:33,680 –> 00:15:35,440
و یک um خواهید
486
00:15:35,440 –> 00:15:37,600
داشت و همچنین به این دلیل که زمان
487
00:15:37,600 –> 00:15:39,680
درگیر است، شما یک نرخ تنزیل
488
00:15:39,680 –> 00:15:40,240
489
00:15:40,240 –> 00:15:42,000
نیز دارید. این به نوعی شبیه
490
00:15:42,000 –> 00:15:44,480
رویکرد اقتصادسنجی یا جریان نقدی
491
00:15:44,480 –> 00:15:47,680
برای اندازهگیری ارزش طول عمر مشتری است،
492
00:15:47,680 –> 00:15:50,800
من در واقع از آن در شرکت خود استفاده نمیکنم
493
00:15:50,800 –> 00:15:53,360
زیرا چالشهایی وجود دارد که من استفاده
494
00:15:53,360 –> 00:15:54,480
کردهام و سعی کردهام از آن استفاده کنم.
495
00:15:54,480 –> 00:15:56,800
شخصاً و واقعاً به من
496
00:15:56,800 –> 00:15:57,920
نتایج عالی نمی دهد
497
00:15:57,920 –> 00:15:59,759
یادگیری ماشینی این سناریویی است
498
00:15:59,759 –> 00:16:01,440
که در آن فکر می کنم یادگیری ماشینی کار
499
00:16:01,440 –> 00:16:02,720
بهتری انجام می دهد ،
500
00:16:02,720 –> 00:16:05,040
بنابراین می خواهم چالش های موجود در رویکرد اقتصاد سنجی
501
00:16:05,040 –> 00:16:06,160
502
00:16:06,160 –> 00:16:07,680
را به طور خاص برای تجارت خود بدانم
503
00:16:07,680 –> 00:16:10,000
که مشتریان در چارچوب تعریف شده مشارکت خواهند کرد.
504
00:16:10,000 –> 00:16:11,920
مدت زمان بسیار
505
00:16:11,920 –> 00:16:13,839
عالی است، اما چیزی که من معمولاً به آن
506
00:16:13,839 –> 00:16:15,360
علاقه مند هستم
507
00:16:15,360 –> 00:16:17,519
دوره 90 روزه بعدی است، بنابراین من در یک ربع به
508
00:16:17,519 –> 00:16:19,440
سه ماهه که مشتریان
509
00:16:19,440 –> 00:16:22,560
با ما پول خرج می کنند، شخصاً
510
00:16:22,560 –> 00:16:25,839
اجرای آن را دقیق ندانسته ام
511
00:16:25,839 –> 00:16:26,079
.
512
00:16:26,079 –> 00:16:29,040
رویکرد اقتصاد سنجی اقتصاد را قبلاً امتحان
513
00:16:29,040 –> 00:16:30,079
514
00:16:30,079 –> 00:16:32,639
کردهام و به سرعت از آن صرف نظر کردم، بلکه
515
00:16:32,639 –> 00:16:34,320
کاری که انجام میدهم این است که آن را به عنوان یک رویکرد یادگیری ماشینی در نظر
516
00:16:34,320 –> 00:16:35,680
بگیرم و این چیزی است که من
517
00:16:35,680 –> 00:16:37,440
با موفقیت پیادهسازی کردهام و این
518
00:16:37,440 –> 00:16:39,279
چیزی است که میخواهم به شما آموزش دهم.
519
00:16:39,279 –> 00:16:40,160
امروز می خواهم به شما نشان دهم که چگونه
520
00:16:40,160 –> 00:16:41,519
به طور خاص برخی از کارهایی را
521
00:16:41,519 –> 00:16:43,199
که من در علم تجارت انجام می دهم انجام دهید، این
522
00:16:43,199 –> 00:16:44,959
عالی است،
523
00:16:44,959 –> 00:16:46,720
بنابراین بیایید در مورد این
524
00:16:46,720 –> 00:16:48,480
رویکرد یادگیری ماشینی برای ارزش طول عمر
525
00:16:48,480 –> 00:16:49,759
مشتری یا مشتری صحبت کنیم.
526
00:16:49,759 –> 00:16:53,519
مدلسازی بنابراین
527
00:16:53,519 –> 00:16:56,560
من از یادگیری ماشینی استفاده می کنم و
528
00:16:56,560 –> 00:16:57,759
چند مرحله مختلف
529
00:16:57,759 –> 00:16:59,120
وجود دارد که قبل از اینکه وارد کد شویم باید آنها
530
00:16:59,120 –> 00:17:01,440
را در سطح بالایی طی
531
00:17:01,440 –> 00:17:02,720
532
00:17:02,720 –> 00:17:04,720
533
00:17:04,720 –> 00:17:07,039
کنم.
534
00:17:07,039 –> 00:17:08,799
شما می خواهید فقط یک نمونه از مشتریان خود را انتخاب کنید
535
00:17:08,799 –> 00:17:10,559
که در یک
536
00:17:10,559 –> 00:17:12,240
دوره مشخص هستند که همه آنها در
537
00:17:12,240 –> 00:17:13,919
همان دوره زمانی خریداری کرده اند که
538
00:17:13,919 –> 00:17:16,880
بازاریابی مشابه زیادی را تجربه کرده اند،
539
00:17:16,880 –> 00:17:19,119
بنابراین باید یک نوع الگوهای رفتاری
540
00:17:19,119 –> 00:17:20,079
نسبتا مشابه
541
00:17:20,079 –> 00:17:22,640
وجود داشته باشد. آنها
542
00:17:22,640 –> 00:17:23,359
و همچنین
543
00:17:23,359 –> 00:17:26,959
رویدادهای نسبتاً
544
00:17:26,959 –> 00:17:29,520
مشابهی که همگی در یک زمان تجربه میکنند سیمکارت میکنند،
545
00:17:29,520 –> 00:17:30,880
546
00:17:30,880 –> 00:17:32,960
بنابراین یک گروه چیزی بیش از
547
00:17:32,960 –> 00:17:34,400
گروهی از مشتریان نیست که همگی
548
00:17:34,400 –> 00:17:35,600
تقریباً در همان زمانی شروع شدهاند
549
00:17:35,600 –> 00:17:36,720
که ما قرار است به آن نگاه کنیم
550
00:17:36,720 –> 00:17:39,360
بین ژانویه است. 1997 و مشتریان
551
00:17:39,360 –> 00:17:39,760
بین
552
00:17:39,760 –> 00:17:41,679
مارس آه که اولین
553
00:17:41,679 –> 00:17:43,360
خرید خود را از شرکت
554
00:17:43,360 –> 00:17:46,320
ما انجام دادند و سی دی ما اکنون بین ژانویه و
555
00:17:46,320 –> 00:17:49,120
مارس 1997. بنابراین این
556
00:17:49,120 –> 00:17:51,280
جعبه سبز اینجاست که اولین خرید خود را انجام دادند
557
00:17:51,280 –> 00:17:53,120
و y می توانید ببینید که
558
00:17:53,120 –> 00:17:56,320
این چه چیزی است، این
559
00:17:56,320 –> 00:17:58,080
خط آبی تیره و سپس شما یک
560
00:17:58,080 –> 00:18:00,000
خط آبی روشن دارید، خط آبی تیره
561
00:18:00,000 –> 00:18:03,760
رفتار خرید انبوه آنها
562
00:18:03,760 –> 00:18:05,600
است، بنابراین ما همه
563
00:18:05,600 –> 00:18:08,160
خریدهایی را که آنها انجام داده اند به
564
00:18:08,160 –> 00:18:10,240
تفکیک ماه و اوه اضافه کرده ایم. شما این نوع الگو را می بینید
565
00:18:10,240 –> 00:18:12,320
که بعد از آن اولین
566
00:18:12,320 –> 00:18:15,120
خرید را انجام می دهند، چیزی که اتفاق می افتد این است که به
567
00:18:15,120 –> 00:18:16,640
مرور زمان از بین می رود
568
00:18:16,640 –> 00:18:18,400
و این نوعی منحنی طبیعی است که با آن
569
00:18:18,400 –> 00:18:20,080
خواهید دید
570
00:18:20,080 –> 00:18:22,000
زیرا همه مشتریان خود را نمی شناسید.
571
00:18:22,000 –> 00:18:23,360
که اولین خرید
572
00:18:23,360 –> 00:18:24,799
شما را انجام می دهید با همان نرخ به خرید ادامه می دهید
573
00:18:24,799 –> 00:18:26,240
574
00:18:26,240 –> 00:18:27,600
و به طور کلی اتفاقی که می افتد این است که به نوعی
575
00:18:27,600 –> 00:18:29,360
کاهش می یابد.
576
00:18:29,360 –> 00:18:31,520
اوم این خط آبی فقط روند است.
577
00:18:31,520 –> 00:18:33,600
578
00:18:33,600 –> 00:18:36,799
579
00:18:36,799 –> 00:18:38,640
این را به یک مشکل یادگیری ماشینی تبدیل می
580
00:18:38,640 –> 00:18:40,160
کنیم، اما ما چیزی را به نام تقسیم زمانی پیاده سازی می کنیم
581
00:18:40,160 –> 00:18:41,360
که به
582
00:18:41,360 –> 00:18:43,280
این معنی است که بر
583
00:18:43,280 –> 00:18:44,799
اساس زمان تقسیم می شویم،
584
00:18:44,799 –> 00:18:46,400
بنابراین رفتار خرید آنها
585
00:18:46,400 –> 00:18:48,960
را برای مدت زمان مشخصی در نظر می
586
00:18:48,960 –> 00:18:51,039
گیریم و سپس ما 90 بعدی آخر را تحلیل می
587
00:18:51,039 –> 00:18:52,240
کنم روزهایی
588
00:18:52,240 –> 00:18:54,960
که ما در مجموعه داده های
589
00:18:54,960 –> 00:18:56,320
خود الگوی خرید آنها را داریم،
590
00:18:56,320 –> 00:18:58,640
بنابراین از این قطعه قرمز
591
00:18:58,640 –> 00:18:59,840
592
00:18:59,840 –> 00:19:01,840
که قرار است با آن بیاییم، برای رسیدن به
593
00:19:01,840 –> 00:19:03,840
اهداف خود و این قطعه آبی
594
00:19:03,840 –> 00:19:05,679
که قرار است از آن استفاده کنیم، استفاده خواهیم کرد. با
595
00:19:05,679 –> 00:19:07,760
ویژگیهایی که مجموعه دادهها را تشکیل
596
00:19:07,760 –> 00:19:09,600
میدهند، به این دلیل که این یک سری زمانی است، میخواهیم
597
00:19:09,600 –> 00:19:11,200
بگوییم بسیار خوب، ما به آن نگاه
598
00:19:11,200 –> 00:19:11,679
599
00:19:11,679 –> 00:19:13,440
میکنیم و محاسبه میکنیم که برای
600
00:19:13,440 –> 00:19:15,919
هر مشتری جمعبندی میکنیم که چقدر هزینه کرده است.
601
00:19:15,919 –> 00:19:17,520
ما خلاصه میکنیم که آیا
602
00:19:17,520 –> 00:19:19,120
آنها
603
00:19:19,120 –> 00:19:20,640
در این پنجره زمانی چیزی خرج کردهاند یا خیر و این چیزی است که
604
00:19:20,640 –> 00:19:22,720
در این پرچم
605
00:19:22,720 –> 00:19:24,400
90 روزه وجود دارد
606
00:19:24,400 –> 00:19:25,760
607
00:19:25,760 –> 00:19:27,280
و در مجموع 90 روز و سپس قسمت آبی که ما میخواهیم
608
00:19:27,280 –> 00:19:29,280
کار ایجاد کنیم.
609
00:19:29,280 –> 00:19:32,559
ویژگیهای rfm بنابراین فرکانس جدید و
610
00:19:32,559 –> 00:19:34,559
ویژگیهای پولی نامیده میشوند و این فقط نوعی
611
00:19:34,559 –> 00:19:35,840
مهندسی ویژگی است
612
00:19:35,840 –> 00:19:37,280
و ما میخواهیم آنها را از دوره آبی رفتارهای خرید آنها در نظر بگیریم،
613
00:19:37,280 –> 00:19:39,840
614
00:19:39,840 –> 00:19:41,120
615
00:19:41,120 –> 00:19:44,160
بنابراین ویژگیهای rfm
616
00:19:44,160 –> 00:19:46,960
از اهمیت ویژهای برخوردار هستند، زیرا
617
00:19:46,960 –> 00:19:47,600
اینها
618
00:19:47,600 –> 00:19:50,480
ویژگیهای واقعاً ارزشمندی هستند وقتی که شما مشتریانی داشته باشند
619
00:19:50,480 –> 00:19:52,320
که در طول زمان خرید
620
00:19:52,320 –> 00:19:54,480
کنند با توجه به اینکه آنها پول را در مهرهای زمانی مختلف خرج می کنند
621
00:19:54,480 –> 00:19:55,520
622
00:19:55,520 –> 00:19:57,440
و شما می توانید از آنهایی استفاده کنید که
623
00:19:57,440 –> 00:19:59,520
رفتار خرج می کنند تا به این ویژگی ها دست پیدا کنید،
624
00:19:59,520 –> 00:20:01,120
بنابراین یکی از آنها برای
625
00:20:01,120 –> 00:20:02,960
تازگی است که ما برخی از آن ها را برای
626
00:20:02,960 –> 00:20:04,960
دفعات تعداد دفعاتی که آنها
627
00:20:04,960 –> 00:20:05,679
خرید کرده اند
628
00:20:05,679 –> 00:20:07,760
و سپس این دو در اینجا ویژگی های پولی هستند
629
00:20:07,760 –> 00:20:09,760
که مجموع خریدهای
630
00:20:09,760 –> 00:20:11,039
آنها
631
00:20:11,039 –> 00:20:14,240
در آن بازه زمانی انجام شده است و
632
00:20:14,240 –> 00:20:15,280
میانگین
633
00:20:15,280 –> 00:20:16,960
ارزش خرید آنها چقدر است و شما می
634
00:20:16,960 –> 00:20:18,960
توانید به بسیاری از ویژگی های دیگر دست پیدا کنید در واقع به
635
00:20:18,960 –> 00:20:20,320
این می گویند مهندسی ویژگی یکی
636
00:20:20,320 –> 00:20:22,159
از هنرهاست. از علم داده علم داده
637
00:20:22,159 –> 00:20:22,799
638
00:20:22,799 –> 00:20:24,480
تبدیل شدن به یک دانشمند داده دانشمندان خوب داده
639
00:20:24,480 –> 00:20:25,840
میدانند چگونه
640
00:20:25,840 –> 00:20:27,679
ویژگیهای واقعاً خوبی پیدا کنند،
641
00:20:27,679 –> 00:20:28,640
بنابراین این چیزی است که
642
00:20:28,640 –> 00:20:30,320
ما پیادهسازی میکنیم و سپس
643
00:20:30,320 –> 00:20:32,080
دو مدل پیشبینی
644
00:20:32,080 –> 00:20:33,840
ایجاد میکنیم، پس از اینکه مجموعه دادهها
645
00:20:33,840 –> 00:20:35,360
به روش درستی فرمولبندی شده است. ما میخواهیم
646
00:20:35,360 –> 00:20:35,840
647
00:20:35,840 –> 00:20:38,000
مدلی ارائه کنیم که پیشبینی میکند
648
00:20:38,000 –> 00:20:39,679
مشتری چقدر هزینه میکند، مشکل رگرسیونی
649
00:20:39,679 –> 00:20:40,400
است
650
00:20:40,400 –> 00:20:42,159
و سپس مشتری با چه احتمالی
651
00:20:42,159 –> 00:20:43,760
خرید میکند. n روز آینده
652
00:20:43,760 –> 00:20:47,600
که یک مشکل طبقه بندی است، خوب
653
00:20:47,600 –> 00:20:49,200
دوباره این روند کاری است که ما
654
00:20:49,200 –> 00:20:50,960
قرار است طی کنیم،
655
00:20:50,960 –> 00:20:53,280
ما از پانداها به scikit-learning به dash
656
00:20:53,280 –> 00:20:54,240
و plotley می پردازیم
657
00:20:54,240 –> 00:20:57,679
بسیار خوب، بنابراین بیایید شروع کنیم خب
658
00:20:57,679 –> 00:21:00,960
این است اولین آزمایشگاهی
659
00:21:00,960 –> 00:21:02,880
است که ما قرار است بدون
660
00:21:02,880 –> 00:21:04,320
کد در مقابل انجام دهیم،
661
00:21:04,320 –> 00:21:06,080
بنابراین من فقط میخواهم سریعاً از
662
00:21:06,080 –> 00:21:08,320
آن عبور کنم.
663
00:21:08,320 –> 00:21:09,520
664
00:21:09,520 –> 00:21:11,760
665
00:21:11,760 –> 00:21:12,720
آزمایشگاهی
666
00:21:12,720 –> 00:21:15,919
که من تمام محتویات آن را دارم، بنابراین
667
00:21:15,919 –> 00:21:17,360
چند پوشه مختلف دارد و
668
00:21:17,360 –> 00:21:19,120
برای اعضای lo pro من فقط در
669
00:21:19,120 –> 00:21:20,080
مورد
670
00:21:20,080 –> 00:21:23,280
راه اندازی این پروژه به سرعت صحبت خواهیم
671
00:21:23,280 –> 00:21:24,000
672
00:21:24,000 –> 00:21:27,360
673
00:21:27,360 –> 00:21:29,440
674
00:21:29,440 –> 00:21:30,880
کرد. یکی دو پوشه مختلف
675
00:21:30,880 –> 00:21:32,960
یکی تنظیمات کد من در مقابل من است،
676
00:21:32,960 –> 00:21:35,039
بنابراین اینها برخی از تنظیمات من هستند که
677
00:21:35,039 –> 00:21:37,840
برای فضای کاری
678
00:21:37,840 –> 00:21:39,520
خاصی که قرار است از
679
00:21:39,520 –> 00:21:41,120
ادغام نوت بوک
680
00:21:41,120 –> 00:21:43,600
jupyter استفاده کنیم و وقتی Shift را فشار می دهم و ما را وارد می کنم،
681
00:21:43,600 –> 00:21:44,720
682
00:21:44,720 –> 00:21:47,440
خواهیم بود. قرار است کدی را به نقاط
683
00:21:47,440 –> 00:21:48,000
ضعف
684
00:21:48,000 –> 00:21:50,159
یا اینتر ارسال کند پنجره فعال، بنابراین من
685
00:21:50,159 –> 00:21:51,600
این تنظیمات را در اینجا دارم
686
00:21:51,600 –> 00:21:54,480
و سپس مسیر پایتون را که
687
00:21:54,480 –> 00:21:54,799
688
00:21:54,799 –> 00:21:57,760
تا آزمایشگاه من 59 عمر مشتری پی تنظیم کردهام،
689
00:21:57,760 –> 00:21:59,919
که فقط محیطی است که من ایجاد کردهام
690
00:21:59,919 –> 00:22:01,520
و در یک ثانیه در مورد آن در اینجا بیشتر صحبت خواهم کرد.
691
00:22:01,520 –> 00:22:03,679
692
00:22:03,679 –> 00:22:06,240
مهم است
693
00:22:06,240 –> 00:22:08,159
زیرا دارای نسخههای خاصی از
694
00:22:08,159 –> 00:22:09,280
بستهها
695
00:22:09,280 –> 00:22:10,480
و کتابخانههای پایتون است که ما
696
00:22:10,480 –> 00:22:12,400
امروز از آنها استفاده میکنیم و مطمئن شویم
697
00:22:12,400 –> 00:22:15,039
که شما نسخههای مناسبی دارید که کار میکنند
698
00:22:15,039 –> 00:22:17,039
699
00:22:17,039 –> 00:22:18,559
700
00:22:18,559 –> 00:22:19,840
. من واقعاً
701
00:22:19,840 –> 00:22:21,120
اینها را ایجاد خواهم کرد، بنابراین من زمان زیادی را برای آنها صرف نمی
702
00:22:21,120 –> 00:22:22,080
کنم،
703
00:22:22,080 –> 00:22:23,840
این فقط به این فکر می کند که
704
00:22:23,840 –> 00:22:26,320
کارمان را در پایان تجزیه و تحلیل خود ذخیره می کنیم،
705
00:22:26,320 –> 00:22:29,440
مورد بعدی مجموعه داده است
706
00:22:29,440 –> 00:22:32,480
بنابراین مجموعه داده ذخیره می شود. در یک فایل متنی،
707
00:22:32,480 –> 00:22:34,240
بنابراین اگر اینجا کلیک کنم،
708
00:22:34,240 –> 00:22:36,400
فایل متنی چیزی شبیه به این است
709
00:22:36,400 –> 00:22:39,440
که در آن شماره مشتریان را
710
00:22:39,440 –> 00:22:41,919
داریم، تاریخ um آنها را داریم و سپس
711
00:22:41,919 –> 00:22:42,480
712
00:22:42,480 –> 00:22:45,039
تعداد خریدهای Uh،
713
00:22:45,039 –> 00:22:46,640
تعداد سی دی ها را داریم. آنها در یک
714
00:22:46,640 –> 00:22:47,280
715
00:22:47,280 –> 00:22:49,840
سفارش خاص برای یک خرید کردند تمبر زمان و
716
00:22:49,840 –> 00:22:50,799
ارزش سفارش آنها،
717
00:22:50,799 –> 00:22:52,320
بنابراین این همان چیزی است که مجموعه داده به نظر می رسد
718
00:22:52,320 –> 00:22:53,520
که ما با آن کار می کنیم و
719
00:22:53,520 –> 00:22:56,159
در پوشه داده ذخیره می شود،
720
00:22:56,159 –> 00:22:58,960
این سه مربوط به برنامه هستند و
721
00:22:58,960 –> 00:23:00,320
من در واقع
722
00:23:00,320 –> 00:23:02,640
می خواهم آنها را به طور خلاصه باز کنید، اما
723
00:23:02,640 –> 00:23:05,280
در پایان دستورات برنامه زمان بیشتری را روی آنها صرف خواهیم کرد،
724
00:23:05,280 –> 00:23:08,240
بنابراین اگر قبلاً
725
00:23:08,240 –> 00:23:10,400
برنامه خط تیره ایجاد
726
00:23:10,400 –> 00:23:12,240
نکرده اید، کاری که انجام می دهید این است که یک ترمینال را باز کنید
727
00:23:12,240 –> 00:23:14,720
و من یک ترمینال در حال اجرا دارم که در حال
728
00:23:14,720 –> 00:23:16,000
729
00:23:16,000 –> 00:23:18,720
حاضر به برنامه dash من اجازه می دهد
730
00:23:18,720 –> 00:23:20,000
تا سرویس داده شود
731
00:23:20,000 –> 00:23:21,679
و چه کاری انجام می دهید، بنابراین من می خواهم
732
00:23:21,679 –> 00:23:23,039
با زدن ctrl
733
00:23:23,039 –> 00:23:25,440
c بسته شود تا برنامه من بسته شود، کاری که می خواهید
734
00:23:25,440 –> 00:23:26,720
انجام دهید این است که می خواهید
735
00:23:26,720 –> 00:23:29,039
اطلاعات conda خود را بررسی کنید، بنابراین اگر ما do
736
00:23:29,039 –> 00:23:30,000
conda
737
00:23:30,000 –> 00:23:33,360
info dash پایان میدهد شما میخواهید
738
00:23:33,360 –> 00:23:35,039
مطمئن شوید که
739
00:23:35,039 –> 00:23:37,360
محیط درستی را تنظیم کردهاید، بنابراین این همان کاری است که
740
00:23:37,360 –> 00:23:39,919
این آزمایشگاه 59 پی در طول عمر مشتری انجام میدهد،
741
00:23:39,919 –> 00:23:41,919
بنابراین این همان کاری است که دستور بعدی
742
00:23:41,919 –> 00:23:43,600
هنگامی که شما conda activate را انجام میدهید،
743
00:23:43,600 –> 00:23:44,559
فعال میشود و
744
00:23:44,559 –> 00:23:47,440
در پرانتز خواهید دید در اینجا
745
00:23:47,440 –> 00:23:48,159
محیطی
746
00:23:48,159 –> 00:23:50,880
که من از آن استفاده می کنم، و سپس شما فقط
747
00:23:50,880 –> 00:23:53,679
748
00:23:53,679 –> 00:23:57,039
نقطه برنامه پایتون را انجام می دهید pi shift را وارد کنید
749
00:23:57,039 –> 00:23:59,120
و کاری که میخواهید انجام دهید این است که
750
00:23:59,120 –> 00:24:00,400
برنامه شما را مستقر میکند، بنابراین
751
00:24:00,400 –> 00:24:04,159
شما فقط به میزبان محلی 8050 خود میروید.
752
00:24:04,159 –> 00:24:08,159
و اگر من localhost 8050
753
00:24:08,159 –> 00:24:10,640
را انجام دهم، برنامه را خواهید داشت که خوب کشیده
754
00:24:10,640 –> 00:24:11,360
میشود،
755
00:24:11,360 –> 00:24:15,840
بنابراین به این ترتیب است. شما دوباره برنامه خط تیره
756
00:24:15,840 –> 00:24:17,919
را انجام می دهیم، ما این کار را به شما نشان خواهیم داد در
757
00:24:17,919 –> 00:24:18,880
اینجا
758
00:24:18,880 –> 00:24:22,080
در پایان یک برنامه plot.pi وجود دارد
759
00:24:22,080 –> 00:24:23,840
که فقط یک فایل موقت است، زیرا من
760
00:24:23,840 –> 00:24:24,880
761
00:24:24,880 –> 00:24:26,960
داشتم نمودار نموداری را برای برنامه خود ایجاد می کردم.
762
00:24:26,960 –> 00:24:28,559
جایزه حرفه ای
763
00:24:28,559 –> 00:24:30,799
فایل app.pi این چیزی است که همه اعضای حرفه ای من
764
00:24:30,799 –> 00:24:32,320
قرار است دریافت کنند، بنابراین برنامه ای که من به تازگی
765
00:24:32,320 –> 00:24:35,039
راه اندازی کردم این
766
00:24:35,039 –> 00:24:38,159
فایل محیطی
767
00:24:38,159 –> 00:24:40,080
است.yml بنابراین اگر با conda آشنایی ندارید
768
00:24:40,080 –> 00:24:41,440
769
00:24:41,440 –> 00:24:44,960
این است چگونه محیط conda خود را راه اندازی می کنید،
770
00:24:44,960 –> 00:24:47,840
بنابراین من از آزمایشگاه 59 در طول عمر مشتری استفاده می کنم
771
00:24:47,840 –> 00:24:49,360
772
00:24:49,360 –> 00:24:52,960
که برای تنظیم این،
773
00:24:52,960 –> 00:24:53,279
شما باید
774
00:24:53,279 –> 00:24:57,440
r conda m را ایجاد کنید.
775
00:24:57,440 –> 00:25:00,960
776
00:25:00,960 –> 00:25:04,159
و کاری
777
00:25:04,159 –> 00:25:05,679
که انجام می دهد این است که
778
00:25:05,679 –> 00:25:08,960
این را در یک محیط conda برای شما
779
00:25:08,960 –> 00:25:10,880
با تمام نسخه های بسته درست تنظیم می کند تا
780
00:25:10,880 –> 00:25:12,080
بخواهید به m مطمئن باشید که باید
781
00:25:12,080 –> 00:25:14,080
این را تکرارپذیر
782
00:25:14,080 –> 00:25:15,520
کنید، میخواهید از همان محیطی استفاده کنید
783
00:25:15,520 –> 00:25:17,200
که من از آن استفاده میکنم، بنابراین این چیزی است که
784
00:25:17,200 –> 00:25:19,760
ما در آنجا راهاندازی میکنیم و سپس اگر
785
00:25:19,760 –> 00:25:20,960
نیاز به تغییر در
786
00:25:20,960 –> 00:25:22,720
محیط دارید، میتوانید در اینجا تغییراتی ایجاد کنید.
787
00:25:22,720 –> 00:25:24,240
و سپس فقط آپدیت کاندوم را اجرا کنید
788
00:25:24,240 –> 00:25:26,000
تا تنها چیزی
789
00:25:26,000 –> 00:25:27,520
که از ایجاد به آپدیت تغییر می کند،
790
00:25:27,520 –> 00:25:29,120
اگر می خواهید تغییراتی ایجاد
791
00:25:29,120 –> 00:25:31,760
کنید، فقط دستور دوم را در اینجا اجرا کنید
792
00:25:31,760 –> 00:25:34,559
و سپس آخرین فایل را اجرا کنید و این همان
793
00:25:34,559 –> 00:25:35,600
چیزی است که ما می خواهیم انجام دهیم. کار
794
00:25:35,600 –> 00:25:36,559
کردن از
795
00:25:36,559 –> 00:25:39,279
امروز آزمایشگاه 59 مشتری با مسئولیت محدود است، بنابراین
796
00:25:39,279 –> 00:25:41,520
این را به عنوان تجزیه و تحلیلی که
797
00:25:41,520 –> 00:25:42,080
798
00:25:42,080 –> 00:25:45,520
برای ایجاد این فایل
799
00:25:45,520 –> 00:25:48,080
app.pi انجام می دهیم، در نظر بگیرید.
800
00:25:48,080 –> 00:25:50,000
فایل
801
00:25:50,000 –> 00:25:52,480
اوه حدود 300 خط کد یا بیشتر است
802
00:25:52,480 –> 00:25:54,320
بنابراین احتمالاً حدود 25
803
00:25:54,320 –> 00:25:58,320
دقیقه و 30 دقیقه طول می کشد تا از
804
00:25:58,320 –> 00:26:01,360
محیطی که من استفاده می کنم استفاده کنم.
805
00:26:01,360 –> 00:26:02,960
806
00:26:02,960 –> 00:26:05,840
807
00:26:05,840 –> 00:26:07,440
که می توانید به
808
00:26:07,440 –> 00:26:08,080
809
00:26:08,080 –> 00:26:11,520
پالت فرمان تنظیمات خود بروید و سپس yo را باز کنید
810
00:26:11,520 –> 00:26:15,200
مفسر ur، بنابراین اگر
811
00:26:15,200 –> 00:26:18,240
مترجم انتخابی پایتون را انجام دهید و سپس
812
00:26:18,240 –> 00:26:21,600
مطمئن شوید که
813
00:26:21,600 –> 00:26:26,159
نقطه پی 59 عمر مشتری آزمایشگاهی خود را دریافت کردهاید
814
00:26:26,159 –> 00:26:27,919
و سپس اتفاقی که میافتد این است
815
00:26:27,919 –> 00:26:29,919
که اینجا نشان داده میشود
816
00:26:29,919 –> 00:26:33,039
817
00:26:33,039 –> 00:26:35,039
. تقریباً نحوه راهاندازی
818
00:26:35,039 –> 00:26:37,279
، چند کتابخانه را بارگیری
819
00:26:37,279 –> 00:26:38,400
میکنیم، کتابخانههایی که بودند
820
00:26:38,400 –> 00:26:40,159
و Shift را فشار میدهم و enter را میزنم و
821
00:26:40,159 –> 00:26:41,600
این به یک
822
00:26:41,600 –> 00:26:44,960
پنجره مشتری تعاملی میرود و میتوانید ببینید
823
00:26:44,960 –> 00:26:46,240
که در حال حاضر چه چیزی در حال اجرا است
824
00:26:46,240 –> 00:26:48,000
. دریافت کردم و این بسیار شبیه
825
00:26:48,000 –> 00:26:49,600
مشتری است
826
00:26:49,600 –> 00:26:51,039
و همچنین می توانید اینجا را ببینید که
827
00:26:51,039 –> 00:26:53,520
مفسر آزمایشگاه 59 طول عمر مشتری است
828
00:26:53,520 –> 00:26:54,400
829
00:26:54,400 –> 00:26:57,679
که به شما نشان می دهد که کار می کند،
830
00:26:57,679 –> 00:27:00,240
بنابراین ما فقط پانداها را وارد کردیم و
831
00:27:00,240 –> 00:27:00,880
اینها به
832
00:27:00,880 –> 00:27:03,840
نوعی شبیه به داده های اصلی شما هستند که می دانید
833
00:27:03,840 –> 00:27:04,799
834
00:27:04,799 –> 00:27:07,279
اصلی شما کتابخانههای علم و جدال دادهها
835
00:27:07,279 –> 00:27:08,640
836
00:27:08,640 –> 00:27:10,400
ما میخواهیم job lib را وارد کنیم، من به شما نشان
837
00:27:10,400 –> 00:27:12,000
خواهم داد که برای چه چیزی
838
00:27:12,000 –> 00:27:13,600
در اینجا استفاده میشود،
839
00:27:13,600 –> 00:27:15,520
کمی ابزارهای ply data cat برای کار
840
00:27:15,520 –> 00:27:17,600
با دادههای طبقهبندی شده
841
00:27:17,600 –> 00:27:20,480
و سپس نمودار 9 برای انجام برخی نمودارهای ثابت و سپس نمودار 9 وجود دارد.
842
00:27:20,480 –> 00:27:21,440
843
00:27:21,440 –> 00:27:23,360
844
00:27:23,360 –> 00:27:24,960
همانطور که از کتابخانههای اصلی یادگیری ماشینی که قرار
845
00:27:24,960 –> 00:27:26,480
است از xgboost استفاده
846
00:27:26,480 –> 00:27:28,480
کنیم، طبقهبندیکننده xgb و
847
00:27:28,480 –> 00:27:29,840
regressor xgb
848
00:27:29,840 –> 00:27:31,360
را وارد میکنیم و سپس از scikit
849
00:27:31,360 –> 00:27:34,159
Learns grid search cv روی هر دوی اینها
850
00:27:34,159 –> 00:27:36,720
برای ایجاد یادگیری ماشینی خود استفاده میکنیم.
851
00:27:36,720 –> 00:27:37,520
مدلها بسیار
852
00:27:37,520 –> 00:27:39,840
خوب یک چیز دیگر من میخواهم
853
00:27:39,840 –> 00:27:42,399
pn um را تنظیم کنم بنابراین این برای طرح نهم من است
854
00:27:42,399 –> 00:27:44,480
dpi گزینههای من برابر با 300 است
855
00:27:44,480 –> 00:27:46,159
و این باعث میشود نمودارهای ما کمی واضحتر به نظر برسند،
856
00:27:46,159 –> 00:27:48,640
بنابراین اکنون میخواهیم به
857
00:27:48,640 –> 00:27:49,520
858
00:27:49,520 –> 00:27:53,039
بخش آمادهسازی دادهها،
859
00:27:53,039 –> 00:27:54,559
بنابراین اولین کاری که اینجا انجام میدهم این است
860
00:27:54,559 –> 00:27:56,559
که فقط در آن
861
00:27:56,559 –> 00:28:00,559
دادهها از دادههایمان فایل cdnownmaster.txt ما را میخوانم،
862
00:28:00,559 –> 00:28:02,640
آن فایل متنی کمی عجیب است، اگرچه
863
00:28:02,640 –> 00:28:04,559
با فاصلهها از هم جدا شدهاند، اما آنها
864
00:28:04,559 –> 00:28:06,399
فضاهای ناهموار هستند. من باید از
865
00:28:06,399 –> 00:28:07,360
866
00:28:07,360 –> 00:28:10,080
جداکننده اسلش s plus استفاده کنم و کاری که انجام می دهد این است که
867
00:28:10,080 –> 00:28:10,960
به دنبال
868
00:28:10,960 –> 00:28:13,679
یک یا چند فاصله بین هر خط است، بنابراین
869
00:28:13,679 –> 00:28:15,679
اگر من فقط این فایل را
870
00:28:15,679 –> 00:28:16,320
در اینجا بررسی
871
00:28:16,320 –> 00:28:18,559
کنم، می توانم ببینم که اگر تمام راه را به بالا اسکرول کنم
872
00:28:18,559 –> 00:28:19,919
873
00:28:19,919 –> 00:28:22,320
اوه خط اول این یکی دارای
874
00:28:22,320 –> 00:28:24,159
سه نقطه سه فاصله
875
00:28:24,159 –> 00:28:26,720
این o است ne دو فاصله دارد و این یکی
876
00:28:26,720 –> 00:28:28,399
یک فاصله دارد، بنابراین یک
877
00:28:28,399 –> 00:28:30,720
دو و سه می شود تا به
878
00:28:30,720 –> 00:28:32,240
روشی درست وارد شود، ما از خواندن csv استفاده می کنیم
879
00:28:32,240 –> 00:28:33,200
880
00:28:33,200 –> 00:28:34,880
اما جداکننده به جای کاما
881
00:28:34,880 –> 00:28:37,200
یک اسلش به علاوه خواهد بود
882
00:28:37,200 –> 00:28:38,640
و سپس من فقط میخواهم اسمهایی را به آن بدهم،
883
00:28:38,640 –> 00:28:40,880
تعداد تاریخ و قیمت شناسه مشتری و
884
00:28:40,880 –> 00:28:42,159
885
00:28:42,159 –> 00:28:44,240
این نامهای هر کدام از اینها
886
00:28:44,240 –> 00:28:45,520
887
00:28:45,520 –> 00:28:47,600
خواهد بود.
888
00:28:47,600 –> 00:28:49,039
889
00:28:49,039 –> 00:28:51,760
اکنون
890
00:28:51,760 –> 00:28:53,200
نگاهی گذرا به آن می اندازیم،
891
00:28:53,200 –> 00:28:56,320
بنابراین shift enter
892
00:28:57,360 –> 00:28:59,520
بله در اینجا یک ثانیه نگه دارید، باید
893
00:28:59,520 –> 00:29:01,600
Shift enter را انجام دهید تا آن را به داخل
894
00:29:01,600 –> 00:29:04,000
بکشید و سپس اگر
895
00:29:04,000 –> 00:29:05,600
Shift را انجام دهم و یک بار دیگر وارد کنم،
896
00:29:05,600 –> 00:29:07,039
اکنون باید مجموعه داده های خود را ببینیم.
897
00:29:07,039 –> 00:29:09,600
پس از آن تعداد تاریخ و قیمت شناسه مشتری مشخص شود،
898
00:29:09,600 –> 00:29:10,799
899
00:29:10,799 –> 00:29:12,080
من به سرعت
900
00:29:12,080 –> 00:29:13,840
اطلاعات را بررسی
901
00:29:13,840 –> 00:29:16,320
می کنم، می توانم برخی از مشکلات را در اینجا ببینم تاریخ
902
00:29:16,320 –> 00:29:17,440
یک n64 است،
903
00:29:17,440 –> 00:29:19,600
من می خواهم آن را به زمان تاریخ تغییر دهم،
904
00:29:19,600 –> 00:29:20,799
905
00:29:20,799 –> 00:29:22,720
بنابراین این چیزی است که
906
00:29:22,720 –> 00:29:24,080
907
00:29:24,080 –> 00:29:27,120
من میخواهم همینجا این کار را انجام دهم، ابتدا آن را به یک
908
00:29:27,120 –> 00:29:28,240
رشته تبدیل
909
00:29:28,240 –> 00:29:31,440
میکنم، بنابراین این کار c این را
910
00:29:31,440 –> 00:29:34,080
از یک عدد به یک رشته تبدیل کنید و
911
00:29:34,080 –> 00:29:35,919
سپس کاری که میخواهم انجام دهم این است که به
912
00:29:35,919 –> 00:29:38,480
زمان تاریخ تبدیل میکنم و سپس هر
913
00:29:38,480 –> 00:29:41,600
n مقداری را که در اینجا
914
00:29:41,600 –> 00:29:43,600
وجود دارد حذف میکنم تا این مقدار تقریباً به اندازه باشد. از
915
00:29:43,600 –> 00:29:45,679
عملیات جدال دادههای من حداقل
916
00:29:45,679 –> 00:29:47,919
برای تجزیه و تحلیل اولیه،
917
00:29:47,919 –> 00:29:50,159
بنابراین اکنون میتوانید ببینید که
918
00:29:50,159 –> 00:29:53,600
اگر این اطلاعات را دوباره اجرا کنم، زمان تاریخ است
919
00:29:53,600 –> 00:29:55,600
یا در واقع اگر آن را در اینجا اجرا کنم
920
00:29:55,600 –> 00:29:57,840
سیدی اکنون
921
00:29:57,840 –> 00:30:02,240
df dot info
922
00:30:02,240 –> 00:30:05,840
میتوانیم ببینیم که اکنون است یک زمان تاریخ 64.
923
00:30:05,840 –> 00:30:09,039
بنابراین ما باید برای حرکت به
924
00:30:09,039 –> 00:30:10,559
بخش بعدی آماده باشیم، این است که
925
00:30:10,559 –> 00:30:12,320
تجزیه و تحلیل همگروهی خود را انجام میدهیم، بنابراین
926
00:30:12,320 –> 00:30:13,679
مشتریانی را که
927
00:30:13,679 –> 00:30:14,480
928
00:30:14,480 –> 00:30:17,600
در یک پنجره زمانی خاص به آنها پیوستهاند بررسی میکنیم تا ما چه
929
00:30:17,600 –> 00:30:18,880
میخواهیم. کاری که باید انجام دهیم این است که می خواهیم
930
00:30:18,880 –> 00:30:21,120
بدانیم اولین خرید آنها چه زمانی بوده است، بنابراین
931
00:30:21,120 –> 00:30:22,399
این همان چیزی است که ما
932
00:30:22,399 –> 00:30:24,240
از کمی پاندا استفاده می کنیم و
933
00:30:24,240 –> 00:30:25,760
با سی دی خود شروع می کنیم و اکنون
934
00:30:25,760 –> 00:30:28,240
ارزش های خود را بر اساس شناسه مشتری مرتب می کنیم.
935
00:30:28,240 –> 00:30:30,640
و تاریخ، بنابراین آن را بر اساس شناسه مشتری و تاریخ مرتب می کند
936
00:30:30,640 –> 00:30:31,520
937
00:30:31,520 –> 00:30:32,559
و سپس بر اساس
938
00:30:32,559 –> 00:30:34,960
تغییر شناسه مشتری،
939
00:30:34,960 –> 00:30:36,960
i را وارد کنید t یک گروه بر اساس شی ایجاد می کند و سپس
940
00:30:36,960 –> 00:30:38,640
ما فقط اولین
941
00:30:38,640 –> 00:30:40,159
مورد را می گیریم و آن را ذخیره می کنیم زیرا
942
00:30:40,159 –> 00:30:42,880
سی دی ما اکنون اولین خرید tibble
943
00:30:42,880 –> 00:30:46,320
چیزی شبیه به این shift enter است
944
00:30:46,320 –> 00:30:49,360
و اکنون 23 570 ردیف
945
00:30:49,360 –> 00:30:50,720
دارد زیرا یک ردیف وجود دارد. مشاهده به
946
00:30:50,720 –> 00:30:53,840
ازای هر شناسه مشتری و
947
00:30:53,840 –> 00:30:54,960
اولین خرید آنها است،
948
00:30:54,960 –> 00:30:56,640
بنابراین میتوانیم ببینیم که تاریخ حداقل
949
00:30:56,640 –> 00:30:59,200
1997 0101
950
00:30:59,200 –> 00:31:02,960
و حداکثر تاریخ 1997 بوده است. 325. بنابراین
951
00:31:02,960 –> 00:31:04,799
این در بازه زمانی سه ماهه ما است، یعنی
952
00:31:04,799 –> 00:31:06,000
953
00:31:06,000 –> 00:31:10,399
از ژانویه تا مارس 1997،
954
00:31:10,399 –> 00:31:13,600
پس کاری که ممکن است بخواهیم انجام دهیم این است که بعداً
955
00:31:13,600 –> 00:31:16,080
فقط به همه خریدها نگاهی بیندازید،
956
00:31:16,080 –> 00:31:18,399
مثلاً به صورت جمعآوری شده،
957
00:31:18,399 –> 00:31:21,840
پس کاری که انجام میدهد این است که ما سی دی خود را میگیریم،
958
00:31:21,840 –> 00:31:22,559
959
00:31:22,559 –> 00:31:24,640
اکنون ایندکس را بازنشانی میکنم و من
960
00:31:24,640 –> 00:31:27,200
میخواهم شاخص را به تاریخ تنظیم کنم،
961
00:31:27,200 –> 00:31:29,519
بنابراین کاری که این کار انجام میدهد نوعی
962
00:31:29,519 –> 00:31:30,720
فرمت فرم است که
963
00:31:30,720 –> 00:31:33,200
با یک تاریخ در اینجا و سپس
964
00:31:33,200 –> 00:31:33,760
965
00:31:33,760 –> 00:31:35,760
ستون قیمت را بیرون میآورم، بنابراین میخواهم
966
00:31:35,760 –> 00:31:38,159
این
967
00:31:38,159 –> 00:31:40,559
تغییر را وارد کنم قیمت را دریافت کردم که میخواهم آن را
968
00:31:40,559 –> 00:31:42,720
به صورت ماهانه مجدداً نمونهبرداری کنم،
969
00:31:42,720 –> 00:31:44,480
بنابراین این شبیه گروهبندی بر اساس
970
00:31:44,480 –> 00:31:46,399
دوشنبه است
971
00:31:46,399 –> 00:31:48,880
این شیء نمونه مجدد را ایجاد می کند و
972
00:31:48,880 –> 00:31:50,320
سپس من یک تابع تجمیع کننده را اعمال می کنم،
973
00:31:50,320 –> 00:31:51,200
بنابراین
974
00:31:51,200 –> 00:31:53,200
هر عملیات گروه بندی شما همیشه
975
00:31:53,200 –> 00:31:54,960
باید در پایان آن یک نوع تجمع انجام دهید،
976
00:31:54,960 –> 00:31:55,600
977
00:31:55,600 –> 00:31:58,000
بنابراین ما قیمت ها را جمع بندی می کنیم و
978
00:31:58,000 –> 00:32:00,000
سپس ما فقط می خواهیم آنها را ترسیم کنیم
979
00:32:00,000 –> 00:32:01,159
و این به ما تجسم سطح بالایی
980
00:32:01,159 –> 00:32:04,159
از نوع رفتار خرید
981
00:32:04,159 –> 00:32:05,120
را
982
00:32:05,120 –> 00:32:06,960
برای مشتریانی که در
983
00:32:06,960 –> 00:32:08,799
آن گروه
984
00:32:08,799 –> 00:32:10,399
985
00:32:10,399 –> 00:32:11,840
986
00:32:11,840 –> 00:32:13,600
هستند می دهد. چیزی
987
00:32:13,600 –> 00:32:15,120
شبیه چیزی است که انتظار دارم ببینم
988
00:32:15,120 –> 00:32:16,640
شما میدانید که خیلی بالا شروع میشود و
989
00:32:16,640 –> 00:32:18,320
سپس به نوعی از بین میرود و ما
990
00:32:18,320 –> 00:32:19,600
991
00:32:19,600 –> 00:32:22,640
این دوره را اینجا تحلیل میکنیم
992
00:32:22,640 –> 00:32:24,320
و سعی میکنیم تعیین کنیم که کدام مشتریها
993
00:32:24,320 –> 00:32:26,000
قرار است باشیم. برای خرید در این محدوده از
994
00:32:26,000 –> 00:32:27,840
اینجا، اما این کار را انجام ندادم
995
00:32:27,840 –> 00:32:29,600
و برخی دیگر از تجزیه و تحلیل های مشتری
996
00:32:29,600 –> 00:32:31,679
مانند آن چیزی که می خواهم بدانم
997
00:32:31,679 –> 00:32:32,960
این است که می خواهم به چند
998
00:32:32,960 –> 00:32:34,559
مشتری فردی نگاهی بیندازم و می خواهم ببینم
999
00:32:34,559 –> 00:32:36,000
رفتار خرید آنها چگونه است.
1000
00:32:36,000 –> 00:32:36,640
1001
00:32:36,640 –> 00:32:38,720
من می توانم مهربان ببینم از آنچه که من با
1002
00:32:38,720 –> 00:32:39,919
آن سر و کار دارم، بنابراین کاری که می خواهم انجام دهم این است که
1003
00:32:39,919 –> 00:32:40,559
1004
00:32:40,559 –> 00:32:43,039
من می خواهم um خود را بگیرم، شناسه خود را می گیرم، بنابراین من فقط
1005
00:32:43,039 –> 00:32:45,360
شناسه های منحصر به
1006
00:32:45,360 –> 00:32:47,200
فرد موجود در مجموعه داده های ما را می گیرم تا بتوانید ببینید
1007
00:32:47,200 –> 00:32:49,120
این یک آرایه یک آرایه عددی در اینجا است
1008
00:32:49,120 –> 00:32:50,799
که از 1 تا
1009
00:32:50,799 –> 00:32:53,600
23 570 می رسد و این شماره های مشتری هستند که
1010
00:32:53,600 –> 00:32:54,080
1011
00:32:54,080 –> 00:32:56,399
این شناسه های مشتری منحصر به فرد هستند که
1012
00:32:56,399 –> 00:32:57,840
من می خواهم 10 مورد از آنها را
1013
00:32:57,840 –> 00:32:59,360
فقط 10 مورد اول انتخاب کنم.
1014
00:32:59,360 –> 00:33:01,039
و شما می توانید هر 10
1015
00:33:01,039 –> 00:33:02,799
عددی را که می خواهید یا هر عددی را که می خواهید انتخاب کنید، بنابراین من
1016
00:33:02,799 –> 00:33:04,399
10 مورد اول را از آنجا
1017
00:33:04,399 –> 00:33:07,279
می گیرم، آرایه ای از 1 تا 10 است. و سپس
1018
00:33:07,279 –> 00:33:08,240
کاری که می خواهم انجام دهم این است که می
1019
00:33:08,240 –> 00:33:10,559
گیرم مجموعه دادههای cd now من که
1020
00:33:10,559 –> 00:33:12,960
تمام تاریخچه خرید من است و من
1021
00:33:12,960 –> 00:33:15,279
آن را فیلتر میکنم فقط برای
1022
00:33:15,279 –> 00:33:18,480
گرفتن برخی از موارد خاص، بنابراین ابتدا
1023
00:33:18,480 –> 00:33:20,240
میروم و میخواهم برش
1024
00:33:20,240 –> 00:33:21,519
سیدی را بگیرم که شناسههای مشتری
1025
00:33:21,519 –> 00:33:24,559
در حال حاضر موجود است این شناسه در اینجا انتخاب شده است، بنابراین
1026
00:33:24,559 –> 00:33:25,360
فقط آنهایی که از
1027
00:33:25,360 –> 00:33:28,720
یک تا ده هستند، بنابراین Shift را وارد کنید
1028
00:33:28,720 –> 00:33:30,320
و می توانید ببینید که اطلاعات من را
1029
00:33:30,320 –> 00:33:31,760
به میزان قابل توجهی کاهش می
1030
00:33:31,760 –> 00:33:34,000
دهد شناسه مشتری یکی در اینجا یکی یک
1031
00:33:34,000 –> 00:33:34,799
خرید داشته است.
1032
00:33:34,799 –> 00:33:37,120
شناسه مشتری دو تا به حال دو خرید داشته است
1033
00:33:37,120 –> 00:33:38,159
سه تا به
1034
00:33:38,159 –> 00:33:41,279
نظر می رسد شش خرید داشته است و به همین ترتیب،
1035
00:33:41,279 –> 00:33:42,720
سپس کاری که من می خواهم انجام دهم این است که من
1036
00:33:42,720 –> 00:33:44,559
فقط بر اساس شناسه مشتری
1037
00:33:44,559 –> 00:33:46,559
و تاریخ آنها
1038
00:33:46,559 –> 00:33:48,240
گروه بندی می کنم، بنابراین این گروه را بر اساس شی i ایجاد می کنم. ‘
1039
00:33:48,240 –> 00:33:49,360
میخواهم
1040
00:33:49,360 –> 00:33:52,720
مجدداً یک نوع جمعآوری را اعمال کنم، بنابراین اکنون من بر اساس
1041
00:33:52,720 –> 00:33:54,159
شناسه و تاریخ مشتری دارم
1042
00:33:54,159 –> 00:33:56,399
، مجموع مقدار آنها
1043
00:33:56,399 –> 00:33:57,919
و مجموع قیمت آنها را
1044
00:33:57,919 –> 00:34:01,279
در هر تاریخ دارم و سپس
1045
00:34:01,279 –> 00:34:02,640
این خواهد شد و من چه خواهد شد. میخواهم
1046
00:34:02,640 –> 00:34:04,640
ایندکس را بازنشانی کنم و کاری که قرار است
1047
00:34:04,640 –> 00:34:06,000
انجام دهد این است
1048
00:34:06,000 –> 00:34:08,639
که مجموعهای از دادهها را به من بدهد که میتوانم آن را تجسم
1049
00:34:08,639 –> 00:34:10,399
کنم و از نمودار 9 برای تجسم آن استفاده میکنم،
1050
00:34:10,399 –> 00:34:10,960
1051
00:34:10,960 –> 00:34:12,879
بنابراین این همان چیزی است که آن مجموعه داده شبیه
1052
00:34:12,879 –> 00:34:15,199
مشتری است. مقدار تاریخ شناسه قیمت
1053
00:34:15,199 –> 00:34:17,599
در حال حاضر به شکل مرتبی است، بنابراین
1054
00:34:17,599 –> 00:34:18,639
1055
00:34:18,639 –> 00:34:22,320
اگر با نمودار نه آشنا نیستید می توانم آن را
1056
00:34:22,320 –> 00:34:24,079
با طرح نهم ترسیم
1057
00:34:24,079 –> 00:34:26,320
کنم، اساساً این یک پورت ggplot است، بنابراین
1058
00:34:26,320 –> 00:34:27,599
اگر تا به حال از r استفاده کرده
1059
00:34:27,599 –> 00:34:30,239
باشید، واقعاً قابل تنظیم است.
1060
00:34:30,239 –> 00:34:32,320
سفارشی کردن آن
1061
00:34:32,320 –> 00:34:34,239
و ایجاد
1062
00:34:34,239 –> 00:34:36,000
توطئه هایی با ظاهر واقعاً حرفه ای بسیار آسان است، بنابراین من فقط خویشاوندم
1063
00:34:36,000 –> 00:34:37,040
1064
00:34:37,040 –> 00:34:38,560
اولین کاری که میکنم این است
1065
00:34:38,560 –> 00:34:40,719
که در اینجا یک بوم
1066
00:34:40,719 –> 00:34:42,879
میسازم، و گاهی اوقات میبینید که به آن
1067
00:34:42,879 –> 00:34:43,760
مانند یک طرحبندی گفته میشود،
1068
00:34:43,760 –> 00:34:45,119
بنابراین شما اساساً در حال انتخاب یک
1069
00:34:45,119 –> 00:34:46,879
محور x و یک محور y هستید.
1070
00:34:46,879 –> 00:34:48,639
و سپس یک گروه را به اینجا اضافه کنید
1071
00:34:48,639 –> 00:34:50,159
زیرا یک ستون گروه بندی وجود دارد که مشتریان شما هستند،
1072
00:34:50,159 –> 00:34:51,119
1073
00:34:51,119 –> 00:34:54,079
بنابراین محور x من تاریخ های من است محور y من
1074
00:34:54,079 –> 00:34:55,280
قیمت است
1075
00:34:55,280 –> 00:34:58,240
و گروه های من براساس شناسه مشتری هستند و
1076
00:34:58,240 –> 00:35:00,240
سپس به آن می گویید از چه مجموعه داده ای استفاده کند
1077
00:35:00,240 –> 00:35:02,079
و سپس من روی یک لایه اضافه می کنم، بنابراین لایه بعدی
1078
00:35:02,079 –> 00:35:04,000
این خط geom است،
1079
00:35:04,000 –> 00:35:06,960
بنابراین من می خواهم خط gm را اینجا اضافه کنم،
1080
00:35:06,960 –> 00:35:08,640
سپس چیزی که می خواهم اضافه کنم یک
1081
00:35:08,640 –> 00:35:12,400
نقطه geom است و کاری که انجام می دهد این است که چند نقطه اضافه می کند
1082
00:35:12,400 –> 00:35:13,119
1083
00:35:13,119 –> 00:35:15,119
تا بتوانم به طور خاص ببینم چه زمانی آن
1084
00:35:15,119 –> 00:35:16,720
مشتریانی که خریدند
1085
00:35:16,720 –> 00:35:18,480
و سپس کاری که من میخواهم انجام دهم، چیزی است که به
1086
00:35:18,480 –> 00:35:21,119
آن روکش رویی گفته میشود،
1087
00:35:21,119 –> 00:35:23,119
بنابراین کاری که انجام میدهد این است که هر یک
1088
00:35:23,119 –> 00:35:24,160
از مشتریان را از
1089
00:35:24,160 –> 00:35:27,280
هم جدا میکند، بنابراین من با شناسه مشتری میبندم،
1090
00:35:27,280 –> 00:35:29,520
بنابراین میتوانید ببینید که از 1 به 10 رسیدهام. و
1091
00:35:29,520 –> 00:35:30,800
من واقعاً می توانم ببینم که آنها
1092
00:35:30,800 –> 00:35:32,560
اکنون الگوها را می خرند
1093
00:35:32,560 –> 00:35:34,720
و سپس من فقط می خواهم این محور x را تمیز کنم تا
1094
00:35:34,720 –> 00:35:37,119
1095
00:35:37,119 –> 00:35:38,880
اینطوری همپوشانی نداشته باشد بنابراین این کاری است که
1096
00:35:38,880 –> 00:35:41,119
من با تاریخ scalex انجام میدهم،
1097
00:35:41,119 –> 00:35:44,480
من هر سال یک بار استراحت
1098
00:35:44,480 –> 00:35:46,079
میکنم و فقط سال را با این درصد y نشان میدهم،
1099
00:35:46,079 –> 00:35:48,560
بنابراین این کاری است که من اینجا انجام
1100
00:35:48,560 –> 00:35:51,200
میدهم و این خیلی خوب است زیرا اکنون میتوانم
1101
00:35:51,200 –> 00:35:51,680
1102
00:35:51,680 –> 00:35:53,440
برای مشتریان خاص شما را ببینم بدانید که این
1103
00:35:53,440 –> 00:35:54,880
مشتری فقط
1104
00:35:54,880 –> 00:35:56,640
یک بار درست در ابتدای پنجره ما خریداری شده
1105
00:35:56,640 –> 00:35:58,560
است این مشتری فقط
1106
00:35:58,560 –> 00:35:59,200
یک بار خرید
1107
00:35:59,200 –> 00:36:00,640
کرده است جالب است زیرا آنها
1108
00:36:00,640 –> 00:36:03,280
چندین خرید دارند که انجام داده اند
1109
00:36:03,280 –> 00:36:05,280
و این مانند همان
1110
00:36:05,280 –> 00:36:06,800
مشتری تکراری است که
1111
00:36:06,800 –> 00:36:09,599
احتمالاً احتمال بیشتری دارد.
1112
00:36:09,599 –> 00:36:11,599
خرید مجدد در 90 روز آینده
1113
00:36:11,599 –> 00:36:13,920
در حالی که مشتریان یک و دو احتمالاً
1114
00:36:13,920 –> 00:36:15,839
این کار را نمی
1115
00:36:15,839 –> 00:36:18,320
کنند و می توانید ببینید چه چیز جالب
1116
00:36:18,320 –> 00:36:18,880
اینجاست
1117
00:36:18,880 –> 00:36:20,400
مشتری 4 به نظر می رسد که آنها
1118
00:36:20,400 –> 00:36:22,079
مرده اند بنابراین شما
1119
00:36:22,079 –> 00:36:24,800
یک دوره ای دارید که هیچ خریدی در اینجا ندارید و این
1120
00:36:24,800 –> 00:36:26,079
چیزی است که شما انجام نمی دهید. نمیخواهم ببینم که میخواهی
1121
00:36:26,079 –> 00:36:27,119
تلاش کنی و جلوی
1122
00:36:27,119 –> 00:36:28,480
همین اتفاق را در اینجا با مشتری شماره
1123
00:36:28,480 –> 00:36:31,119
5 بگیری، یک
1124
00:36:31,119 –> 00:36:32,960
جور الگوی خرید بسیار مکرر را میبینی و بعد
1125
00:36:32,960 –> 00:36:34,400
ناگهان هوا
1126
00:36:34,400 –> 00:36:36,960
تاریک میشود، ممکن
1127
00:36:36,960 –> 00:36:38,800
است به یک شرکت رفته باشند. رقیب ممکن
1128
00:36:38,800 –> 00:36:41,040
است علاقه خود را از دست داده باشند، اما
1129
00:36:41,040 –> 00:36:42,800
این چیزی است که ما میخواهیم تلاش کنیم و از آن جلوگیری کنیم،
1130
00:36:42,800 –> 00:36:45,839
بنابراین این همان
1131
00:36:45,839 –> 00:36:47,359
رفتار خریدی است که میتوانیم آن را
1132
00:36:47,359 –> 00:36:49,359
تحلیل کنیم و از
1133
00:36:49,359 –> 00:36:52,480
یادگیری ماشینی برای انجام این
1134
00:36:52,839 –> 00:36:54,640
1135
00:36:54,640 –> 00:36:56,400
کار استفاده میکنیم. این کار این است که
1136
00:36:56,400 –> 00:36:58,000
مقداری یادگیری ماشینی انجام دهیم و ما باید
1137
00:36:58,000 –> 00:36:59,040
این مشکل را
1138
00:36:59,040 –> 00:37:02,960
در قالب سوالاتی به سبک تجاری
1139
00:37:02,960 –> 00:37:05,359
بسازیم تا بتوانیم به
1140
00:37:05,359 –> 00:37:06,720
شکل دقیقی دریابیم که چگونه
1141
00:37:06,720 –> 00:37:08,480
داده ها را به روش صحیح
1142
00:37:08,480 –> 00:37:10,320
قالب بندی کنیم تا چارچوب بندی مشکل
1143
00:37:10,320 –> 00:37:12,160
مهمترین چیز است، بنابراین زمانی که شما در
1144
00:37:12,160 –> 00:37:13,520
حال یادگیری علم داده هستید،
1145
00:37:13,520 –> 00:37:15,839
این واقعا مهم است که
1146
00:37:15,839 –> 00:37:17,040
1147
00:37:17,040 –> 00:37:20,160
بتوانید مشکلات داده ها را به عنوان مشکلات تجاری تجزیه و تحلیل کنید، بنابراین
1148
00:37:20,160 –> 00:37:21,520
ما می خواهیم مشکل
1149
00:37:21,520 –> 00:37:23,760
را از نظر کسب و کار چارچوب بندی کنیم، بنابراین اولین
1150
00:37:23,760 –> 00:37:25,440
سوال که ما داریم این
1151
00:37:25,440 –> 00:37:28,400
است که مشتریان در 90 روز آینده چه چیزی خرج خواهند کرد،
1152
00:37:28,400 –> 00:37:28,960
1153
00:37:28,960 –> 00:37:31,920
بنابراین این یک مشکل رگرسیونی است،
1154
00:37:31,920 –> 00:37:32,640
1155
00:37:32,640 –> 00:37:34,560
زیرا ما می خواهیم به طور خاص بدانیم
1156
00:37:34,560 –> 00:37:36,880
که آنها
1157
00:37:36,880 –> 00:37:39,440
در 90 روز آینده چه مقدار هزینه خواهند کرد و سپس
1158
00:37:39,440 –> 00:37:40,640
سوال دوم این است
1159
00:37:40,640 –> 00:37:42,560
که چیست؟ پروبا این امکان وجود دارد که یک
1160
00:37:42,560 –> 00:37:44,079
مشتری در 90 روز آینده خرید دیگری انجام دهد،
1161
00:37:44,079 –> 00:37:46,240
این در واقع یک
1162
00:37:46,240 –> 00:37:47,839
مشکل طبقه بندی است،
1163
00:37:47,839 –> 00:37:48,960
بنابراین هر زمان که با احتمال روبرو هستید
1164
00:37:48,960 –> 00:37:51,440
، این یک
1165
00:37:51,440 –> 00:37:54,800
مشکل طبقه بندی باینری است، بنابراین برای انجام
1166
00:37:54,800 –> 00:37:55,280
این
1167
00:37:55,280 –> 00:37:56,720
کار یک عنصر زمان وجود دارد زیرا ما دوباره
1168
00:37:56,720 –> 00:37:58,800
در مورد 90 روز آینده صحبت می کنیم، بنابراین
1169
00:37:58,800 –> 00:38:00,560
باید کاری را انجام دهیم که به آن
1170
00:38:00,560 –> 00:38:01,359
تقسیم زمانی یا
1171
00:38:01,359 –> 00:38:03,599
تقسیم بر اساس زمان می گویند، بنابراین این اولین
1172
00:38:03,599 –> 00:38:04,640
کاری است که می خواهیم انجام دهیم،
1173
00:38:04,640 –> 00:38:05,040
1174
00:38:05,040 –> 00:38:07,599
در مرحله 1 در اینجا باید
1175
00:38:07,599 –> 00:38:08,640
تقسیم کنیم.
1176
00:38:08,640 –> 00:38:12,240
این داده ها به مرور زمان افزایش می یابد و
1177
00:38:12,240 –> 00:38:14,960
ما می خواهیم مجموعه ای ایجاد
1178
00:38:14,960 –> 00:38:15,760
کنیم که از آن
1179
00:38:15,760 –> 00:38:18,160
برای توسعه ویژگی های هدفمان
1180
00:38:18,160 –> 00:38:19,920
استفاده می کنیم و سپس از
1181
00:38:19,920 –> 00:38:21,839
داده های دیگر برای توسعه ویژگی های rfm خود استفاده می کنیم.
1182
00:38:21,839 –> 00:38:24,000
1183
00:38:24,000 –> 00:38:26,400
بنابراین تعداد روزهایی که قرار است
1184
00:38:26,400 –> 00:38:28,000
به آنها نگاه کنیم 90 روز است،
1185
00:38:28,000 –> 00:38:29,680
بنابراین من فقط میخواهم برخی
1186
00:38:29,680 –> 00:38:31,520
از آنها را ذخیره کنم و سپس کاری که میخواهم انجام دهم این
1187
00:38:31,520 –> 00:38:33,040
است که خوب حداکثر
1188
00:38:33,040 –> 00:38:33,599
1189
00:38:33,599 –> 00:38:36,400
تاریخ را بررسی کنم. این در مجموعه دادههای من در اینجا است، بنابراین
1190
00:38:36,400 –> 00:38:38,079
حداکثر تاریخ ما فقط c
1191
00:38:38,079 –> 00:38:40,480
در حال حاضر تاریخ است بنابراین d ستون خوردم من
1192
00:38:40,480 –> 00:38:42,640
حداکثر را می گیرم و می توانم اگر ماوس را
1193
00:38:42,640 –> 00:38:45,040
روی آن نگه
1194
00:38:45,359 –> 00:38:47,680
دارم یا اگر آن را به کنسول بفرستم اکنون
1195
00:38:47,680 –> 00:38:49,359
می توانیم ببینیم که حداکثر تاریخ در مجموعه داده ما
1196
00:38:49,359 –> 00:38:51,200
1197
00:38:51,200 –> 00:38:54,640
1998.06 30 است. پس چه کاری می خواهیم انجام دهیم آیا
1198
00:38:54,640 –> 00:38:55,119
1199
00:38:55,119 –> 00:38:58,960
میخواهیم 90 روز از قبل از آخرین تاریخ در
1200
00:38:58,960 –> 00:39:01,119
نظر بگیریم، بنابراین حداکثر تاریخ را میگیریم و
1201
00:39:01,119 –> 00:39:02,240
1202
00:39:02,240 –> 00:39:06,000
دلتای زمانی 90 را کم میکنیم، بنابراین این اینجا 90
1203
00:39:06,000 –> 00:39:09,280
است و سپس روز واحد است، بنابراین این
1204
00:39:09,280 –> 00:39:09,760
1205
00:39:09,760 –> 00:39:12,160
برش من خواهد بود. Shift و
1206
00:39:12,160 –> 00:39:13,520
Enter را
1207
00:39:13,520 –> 00:39:17,920
انجام دهید تا بریدگی که دقیقاً در اینجا
1208
00:39:17,920 –> 00:39:22,079
است 1998.0401 باشد، بنابراین این 90 روز
1209
00:39:22,079 –> 00:39:24,800
از آخرین روز است که در اینجا بسیار خوب است، بنابراین این همان
1210
00:39:24,800 –> 00:39:26,800
چیزی است که ما از آن استفاده خواهیم کرد زیرا بریدگی ما
1211
00:39:26,800 –> 00:39:29,920
1 آوریل 1998 است
1212
00:39:29,920 –> 00:39:33,040
و سپس یک in ایجاد می کنیم.
1213
00:39:33,040 –> 00:39:35,599
مجموعه داده و یک مجموعه داده خروجی بنابراین این
1214
00:39:35,599 –> 00:39:37,280
موقتی است ndf
1215
00:39:37,280 –> 00:39:39,119
این همه دادههایی است که
1216
00:39:39,119 –> 00:39:40,960
قبل از این تاریخ هستند یا
1217
00:39:40,960 –> 00:39:43,839
کمتر یا مساوی با این تاریخ هستند و سپس
1218
00:39:43,839 –> 00:39:45,119
این پورتال موقت خروجی
1219
00:39:45,119 –> 00:39:47,040
تمام دادههایی است که
1220
00:39:47,040 –> 00:39:49,119
بزرگتر از آن است. تاریخ، بنابراین اگر به این زمان نگاه کنم،
1221
00:39:49,119 –> 00:39:50,640
1222
00:39:50,640 –> 00:39:52,160
هیچ یک از مهرهای زمانی، هیچ یک از
1223
00:39:52,160 –> 00:39:54,240
تاریخچه خرید نباید در
1224
00:39:54,240 –> 00:39:57,280
آن باشد. زودتر از این تاریخ در اینجا
1225
00:39:57,280 –> 00:39:59,040
و ما میتوانیم ببینیم که همه اینها در اواخر
1226
00:39:59,040 –> 00:40:00,839
سال 1998 یا بعد از آن
1227
00:40:00,839 –> 00:40:04,240
0401 یا بالاتر هستند،
1228
00:40:04,240 –> 00:40:06,079
بنابراین اکنون که ما ورود و خروج خود را داریم،
1229
00:40:06,079 –> 00:40:07,520
میتوانیم شروع به ایجاد ویژگیهای خود
1230
00:40:07,520 –> 00:40:09,680
از این دو مجموعه داده متفاوت
1231
00:40:09,680 –> 00:40:12,240
کنیم، مهندسی ویژگی عبارت است از
1232
00:40:12,240 –> 00:40:13,440
چالش برانگیزترین بخش
1233
00:40:13,440 –> 00:40:16,079
، نوعی فرآیند گام به گام است، بنابراین
1234
00:40:16,079 –> 00:40:17,119
ما باید ابتدا
1235
00:40:17,119 –> 00:40:19,200
نگاهی به داده های بیرون بیاندازیم و اهدافی را ایجاد کنیم
1236
00:40:19,200 –> 00:40:20,720
1237
00:40:20,720 –> 00:40:21,760
و اینها چیزهایی هستند که ما به آنها
1238
00:40:21,760 –> 00:40:23,440
علاقه مندیم و به سؤالات تجاری ما پاسخ
1239
00:40:23,440 –> 00:40:24,240
می دهند
1240
00:40:24,240 –> 00:40:25,920
و سپس به
1241
00:40:25,920 –> 00:40:28,720
دادههای پایانی
1242
00:40:28,720 –> 00:40:32,880
دیوانهوار نگاه میکنیم که ویژگیهای rfm ما خواهند بود، بنابراین برای ایجاد
1243
00:40:32,880 –> 00:40:35,520
اهدافی که میخواهیم شیفت
1244
00:40:35,520 –> 00:40:36,400
موقت خود
1245
00:40:36,400 –> 00:40:38,720
را در اینجا وارد کنیم و کاری که میخواهیم
1246
00:40:38,720 –> 00:40:39,680
انجام دهیم این است
1247
00:40:39,680 –> 00:40:41,760
که من با رها کردن ستون مقدار، ما به
1248
00:40:41,760 –> 00:40:43,599
آن نیاز نداریم
1249
00:40:43,599 –> 00:40:45,599
و سپس میروم بر اساس شناسه مشتری گروهبندی
1250
00:40:45,599 –> 00:40:47,359
میکنم،
1251
00:40:47,359 –> 00:40:51,599
خریدهای آنها را
1252
00:40:51,599 –> 00:40:52,640
1253
00:40:52,640 –> 00:40:55,599
جمعبندی میکنم و سپس میروم و نام این چرخش را کل 90 میکنم.
1254
00:40:55,599 –> 00:40:56,880
این ویژگی هدف
1255
00:40:56,880 –> 00:40:59,040
کل خرج کردن 90 است و سپس من نیز
1256
00:40:59,040 –> 00:41:00,000
1257
00:41:00,000 –> 00:41:03,040
پرچمی از o را اختصاص خواهم داد به همه اینها خیر، بنابراین
1258
00:41:03,040 –> 00:41:04,960
اینها همه مشتریانی هستند که خرید کرده اند
1259
00:41:04,960 –> 00:41:07,359
و اگر متوجه شدید در
1260
00:41:07,359 –> 00:41:10,880
اینجا 3 9 25 می شود، بنابراین این 90
1261
00:41:10,880 –> 00:41:11,520
روز آینده است،
1262
00:41:11,520 –> 00:41:13,760
بنابراین همه مشتریان در واقع
1263
00:41:13,760 –> 00:41:15,119
فقط 3300
1264
00:41:15,119 –> 00:41:18,640
مشتری از کل 25 مشتری ما حضور ندارند. 000 یا
1265
00:41:18,640 –> 00:41:20,560
بیشتر مشتری حضور دارند،
1266
00:41:20,560 –> 00:41:22,319
بنابراین ما میخواهیم این را بهعنوان اهداف df ذخیره کنیم
1267
00:41:22,319 –> 00:41:23,680
1268
00:41:23,680 –> 00:41:25,920
و این اهدافی هستند که
1269
00:41:25,920 –> 00:41:27,280
در پایان
1270
00:41:27,280 –> 00:41:30,480
به ویژگیهای rfm
1271
00:41:30,480 –> 00:41:32,079
1272
00:41:32,079 –> 00:41:33,839
خود اضافه میکنیم. این از داده های موجود است، بنابراین
1273
00:41:33,839 –> 00:41:35,520
بسیار مهم است که ما داده هایی را دریافت کردیم
1274
00:41:35,520 –> 00:41:37,440
که با آنها کار می کردیم تا اهداف خود را ایجاد کنیم،
1275
00:41:37,440 –> 00:41:39,920
اکنون داده های خود را داریم که قرار است
1276
00:41:39,920 –> 00:41:41,359
با آن کار کنیم تا بتوانیم
1277
00:41:41,359 –> 00:41:42,640
1278
00:41:42,640 –> 00:41:45,599
ویژگی ها را ارزیابی کنیم. ویژگیهایی
1279
00:41:45,599 –> 00:41:46,880
که میخواهیم رفتار
1280
00:41:46,880 –> 00:41:49,359
خرید آنها را به ۹۰ روز آینده مرتبط کنیم،
1281
00:41:49,359 –> 00:41:50,240
1282
00:41:50,240 –> 00:41:51,839
بنابراین اولین کاری که
1283
00:41:51,839 –> 00:41:53,599
میخواهیم انجام دهیم این است که به تازگی به آنها میرسیم
1284
00:41:53,599 –> 00:41:55,520
که سپس اینها ویژگیهای مبتنی بر زمان یا تاریخ
1285
00:41:55,520 –> 00:41:57,359
هستند، بنابراین
1286
00:41:57,359 –> 00:42:00,800
اساساً همان چیزی است که میخواهیم انجام دهیم. می دانیم که
1287
00:42:00,800 –> 00:42:03,520
آخرین خرید آنها چقدر اخیر بوده است، بنابراین
1288
00:42:03,520 –> 00:42:04,000
ما می خواهیم ng
1289
00:42:04,000 –> 00:42:05,839
برای ایجاد um ما فقط یک
1290
00:42:05,839 –> 00:42:07,359
مقدار ثابت به نام حداکثر
1291
00:42:07,359 –> 00:42:09,920
تاریخ ایجاد می کنیم که آخرین تاریخی است که
1292
00:42:09,920 –> 00:42:10,640
در
1293
00:42:10,640 –> 00:42:14,839
داده های ما در مجموعه داده های نمونه ما وجود دارد و این
1294
00:42:14,839 –> 00:42:16,160
1998.0401 است
1295
00:42:16,160 –> 00:42:17,520
و کاری که می خواهیم انجام دهیم این است که می
1296
00:42:17,520 –> 00:42:19,200
خواهیم
1297
00:42:19,200 –> 00:42:22,640
محاسبه توسط مشتری چه
1298
00:42:22,640 –> 00:42:24,160
زمانی آخرین خرید آنها
1299
00:42:24,160 –> 00:42:25,680
در مقایسه با
1300
00:42:25,680 –> 00:42:27,200
آخرین تاریخ انجام شده است، بنابراین ما یک
1301
00:42:27,200 –> 00:42:29,440
مقدار منفی از تاریخ ها
1302
00:42:29,440 –> 00:42:32,079
را دریافت می کنیم، بنابراین چگونه این کار را انجام دهیم، ndf زمانی خود را می
1303
00:42:32,079 –> 00:42:34,000
گیریم، شناسه مشتری را می
1304
00:42:34,000 –> 00:42:36,720
گیریم و تاریخ گروه بندی را می گیریم. توسط مشتری
1305
00:42:36,720 –> 00:42:39,839
و سپس ما یک تابع را اعمال می کنیم
1306
00:42:39,839 –> 00:42:42,400
و کاری که قرار است انجام دهد برای هر یک
1307
00:42:42,400 –> 00:42:42,960
از این
1308
00:42:42,960 –> 00:42:44,560
گروه ها در اینجا است، بنابراین ما یک گروه با
1309
00:42:44,560 –> 00:42:47,119
گروه بندی شی بر اساس شناسه مشتری
1310
00:42:47,119 –> 00:42:48,240
داریم. کاری که می خواهیم انجام دهیم این است که ما
1311
00:42:48,240 –> 00:42:50,400
تاریخ را در هر یک از این
1312
00:42:50,400 –> 00:42:51,119
1313
00:42:51,119 –> 00:42:53,359
گروهها حداکثر تاریخ
1314
00:42:53,359 –> 00:42:54,160
1315
00:42:54,160 –> 00:42:58,880
میگیریم، بنابراین برای مشتری دوم حداکثر تاریخ 1997 خواهد بود. 12.
1316
00:42:58,880 –> 00:43:00,800
ام، این مشتری سوم، میتوانید ببینید
1317
00:43:00,800 –> 00:43:02,160
1318
00:43:02,160 –> 00:43:05,119
که تاریخی را انتخاب میکند که یا برابر با 1997
1319
00:43:05,119 –> 00:43:07,760
30 است یا اگر آنها خریدهای بیشتری
1320
00:43:07,760 –> 00:43:09,839
داشته باشید ممکن است دیرتر از آن باشد و سپس
1321
00:43:09,839 –> 00:43:12,079
ما می خواهیم محاسبه کنیم تفاوت
1322
00:43:12,079 –> 00:43:15,520
1323
00:43:15,520 –> 00:43:18,640
بین آخرین خرید و حداکثر
1324
00:43:18,640 –> 00:43:19,760
تاریخ،
1325
00:43:19,760 –> 00:43:22,720
بنابراین وقتی این را اجرا می کنیم و در واقع
1326
00:43:22,720 –> 00:43:25,040
این یک ثانیه طول می کشد تا اجرا شود
1327
00:43:25,040 –> 00:43:26,960
زیرا این یک محاسبه عاقلانه است که ما
1328
00:43:26,960 –> 00:43:29,280
گروه های زیادی در مجموعه داده های خود داریم،
1329
00:43:29,280 –> 00:43:31,520
اما کاری که ما انجام خواهیم داد این است می توانید ببینید که ما
1330
00:43:31,520 –> 00:43:32,720
1331
00:43:32,720 –> 00:43:36,240
برای هر شناسه مشتری چند روز
1332
00:43:36,240 –> 00:43:39,040
به این صورت منفی 455 دریافت می کنیم، به این معنی که این
1333
00:43:39,040 –> 00:43:40,880
اولین مشتری
1334
00:43:40,880 –> 00:43:43,040
و آخرین خرید آنها آخرین خرید آنها
1335
00:43:43,040 –> 00:43:45,440
455 روز
1336
00:43:45,440 –> 00:43:48,960
از حداکثر
1337
00:43:48,960 –> 00:43:52,480
تاریخ در مجموعه داده ها بوده است. um
1338
00:43:52,480 –> 00:43:54,480
پس این اساساً کاری است که این کار انجام
1339
00:43:54,480 –> 00:43:56,400
می دهد و ویژگی های جدید ما را ایجاد می کند.
1340
00:43:56,400 –> 00:44:00,560
1341
00:44:00,560 –> 00:44:02,400
1342
00:44:02,400 –> 00:44:04,160
1343
00:44:04,160 –> 00:44:04,960
1344
00:44:04,960 –> 00:44:06,640
1345
00:44:06,640 –> 00:44:08,400
نام به تازگی
1346
00:44:08,400 –> 00:44:10,400
و سپس ویژگیهای اخیر نهایی ما
1347
00:44:10,400 –> 00:44:11,839
چیزی شبیه به این به نظر میرسد که در آن یک
1348
00:44:11,839 –> 00:44:13,440
نام
1349
00:44:13,440 –> 00:44:15,520
تازگی دارد و اساساً آن را
1350
00:44:15,520 –> 00:44:17,440
به یک قاب داده تبدیل میکند
1351
00:44:17,440 –> 00:44:19,359
و ایندکس شناسه مشتری است که
1352
00:44:19,359 –> 00:44:21,040
شاخص مهم است زیرا ما
1353
00:44:21,040 –> 00:44:22,000
1354
00:44:22,000 –> 00:44:23,520
همه چیز را با هم ترکیب میکنیم. همه چیز
1355
00:44:23,520 –> 00:44:26,400
را با این شناسه مشتری
1356
00:44:26,400 –> 00:44:27,839
با هم ادغام کنید و سپس ویژگیهای فرکانس را ایجاد میکنیم،
1357
00:44:27,839 –> 00:44:30,079
بنابراین
1358
00:44:30,079 –> 00:44:32,240
دوباره با دادههای in کار میکنیم و
1359
00:44:32,240 –> 00:44:33,440
اکنون آنچه ما به آن نگاه میکنیم این
1360
00:44:33,440 –> 00:44:36,480
است که مشتریان ما چقدر مرتب
1361
00:44:36,480 –> 00:44:38,079
خرید میکنند تا این اولین مشتری فقط
1362
00:44:38,079 –> 00:44:39,359
یک مورد داشته باشد.
1363
00:44:39,359 –> 00:44:40,800
خرید مشتری دوم دو
1364
00:44:40,800 –> 00:44:43,119
خرید خواهد داشت مشتری سوم
1365
00:44:43,119 –> 00:44:45,280
بیشتر از آن خواهد داشت و غیره بنابراین ما
1366
00:44:45,280 –> 00:44:47,119
می خواهیم آن را به چیزی که به
1367
00:44:47,119 –> 00:44:48,880
آن ویژگی فرکانس می گویند تبدیل کنیم و فقط آنها را جمع آوری می کند
1368
00:44:48,880 –> 00:44:49,440
1369
00:44:49,440 –> 00:44:52,640
تا چگونه این کار را انجام دهیم.
1370
00:44:52,640 –> 00:44:54,319
فقط برای گرفتن شناسه مشتری و
1371
00:44:54,319 –> 00:44:58,000
تاریخ که به این صورت است و سپس i
1372
00:44:58,000 –> 00:44:59,359
group by مشتری id
1373
00:44:59,359 –> 00:45:02,319
shift enter ایجاد می کند یک گروه بر اساس شی ایجاد می کند
1374
00:45:02,319 –> 00:45:02,960
1375
00:45:02,960 –> 00:45:06,160
من می خواهم شمارش را اعمال کنم و کاری
1376
00:45:06,160 –> 00:45:07,839
که قرار است انجام دهد این است که تعداد تاریخ
1377
00:45:07,839 –> 00:45:08,720
1378
00:45:08,720 –> 00:45:10,400
هایی را که هستند بشمارم. توسط مشتری و می توانید ببینید
1379
00:45:10,400 –> 00:45:12,160
که 2003 570
1380
00:45:12,160 –> 00:45:15,280
در یک است و می توانید ببینید که این
1381
00:45:15,280 –> 00:45:16,079
مشتری پنجم
1382
00:45:16,079 –> 00:45:18,079
11 خرید داشته است که مشتری سوم
1383
00:45:18,079 –> 00:45:19,440
پنج مشتری دوم دارد، دو
1384
00:45:19,440 –> 00:45:21,680
اول یک است و سپس
1385
00:45:21,680 –> 00:45:22,480
محور را تنظیم می کنیم،
1386
00:45:22,480 –> 00:45:24,240
بنابراین ستون تاریخ i’ من می روم t o
1387
00:45:24,240 –> 00:45:26,319
اساساً فقط آن را روی فرکانس تنظیم کنید،
1388
00:45:26,319 –> 00:45:28,880
بنابراین Shift Enter کنید و اکنون ویژگیهای فرکانس خود را دارم
1389
00:45:28,880 –> 00:45:31,119
1390
00:45:31,119 –> 00:45:32,480
، کار بعدی که
1391
00:45:32,480 –> 00:45:34,319
میخواهیم انجام دهیم این است که ویژگیهای پولی را
1392
00:45:34,319 –> 00:45:35,599
انجام میدهیم، بنابراین دوباره با دادههای نمونه کار میکنیم.
1393
00:45:35,599 –> 00:45:37,680
1394
00:45:37,680 –> 00:45:40,319
این بار تنظیم کنید کاری که میخواهیم انجام دهیم این است که روی
1395
00:45:40,319 –> 00:45:41,520
ستون قیمت تمرکز
1396
00:45:41,520 –> 00:45:44,160
کنیم، بنابراین میخواهیم یک تجمیع را
1397
00:45:44,160 –> 00:45:46,960
1398
00:45:46,960 –> 00:45:48,800
1399
00:45:48,800 –> 00:45:50,079
1400
00:45:50,079 –> 00:45:53,599
اعمال کنیم. ستون قیمت
1401
00:45:53,599 –> 00:45:56,880
با استفاده از توابع مجموع و میانگین، بنابراین وقتی
1402
00:45:56,880 –> 00:45:57,359
1403
00:45:57,359 –> 00:46:00,560
این کار را انجام میدهم، اگر shift را وارد کنم،
1404
00:46:00,560 –> 00:46:04,079
یک شاخص چندگانه ایجاد میکند تا
1405
00:46:04,079 –> 00:46:06,880
میانگین قیمت مجموع قیمت را دریافت کنید و سپس کاری که من انجام میدهم این است که من دوست ندارم
1406
00:46:06,880 –> 00:46:08,200
با این
1407
00:46:08,200 –> 00:46:10,160
چند شاخص کار کنم. بنابراین میخواهم ایجاد کنم
1408
00:46:10,160 –> 00:46:11,760
، محور را روی مجموع قیمت و
1409
00:46:11,760 –> 00:46:12,960
میانگین قیمت تنظیم
1410
00:46:12,960 –> 00:46:14,640
میکنم و این چیزی است که این کار فقط به نوعی
1411
00:46:14,640 –> 00:46:16,319
آن را تمیز میکند، بنابراین لازم نیست
1412
00:46:16,319 –> 00:46:18,240
نگران کار کردن با قیمت چند شاخصه باشم.
1413
00:46:18,240 –> 00:46:20,400
و اکنون
1414
00:46:20,400 –> 00:46:22,480
من ویژگی های مهندسی شده خود را دارم،
1415
00:46:22,480 –> 00:46:24,880
می توانیم از این تابع به نام pd
1416
00:46:24,880 –> 00:46:26,079
concat استفاده کنیم و سپس
1417
00:46:26,079 –> 00:46:28,720
تمام t را جمع کنیم. او دارای ویژگیهای rfm است، بنابراین
1418
00:46:28,720 –> 00:46:30,480
من ویژگیهای جدید خود را دارم،
1419
00:46:30,480 –> 00:46:32,240
ویژگیهای فرکانس و ویژگیهای قیمت
1420
00:46:32,240 –> 00:46:33,680
من را با
1421
00:46:33,680 –> 00:46:34,880
دسترسی به یک
1422
00:46:34,880 –> 00:46:38,480
ضربه شیفت جمعآوری میکنم و آن را وارد میکنم، فقط اساساً
1423
00:46:38,480 –> 00:46:40,880
این قاب داده را در اینجا ایجاد میکند که
1424
00:46:40,880 –> 00:46:42,000
همه ویژگیهای مهندسی شده من را
1425
00:46:42,000 –> 00:46:43,760
در آن دارد، سپس من قصد دارم انجام دهم این است که می
1426
00:46:43,760 –> 00:46:45,359
خواهم در
1427
00:46:45,359 –> 00:46:47,280
چارچوب داده های اهداف ترکیب کنم و این یک جور مشکل است
1428
00:46:47,280 –> 00:46:48,720
زیرا
1429
00:46:48,720 –> 00:46:50,800
در ابتدا وقتی این کار را انجام دادم درست
1430
00:46:50,800 –> 00:46:51,760
1431
00:46:51,760 –> 00:46:55,119
انجامش ندادم.
1432
00:46:55,119 –> 00:46:58,240
یک پیوست سمت چپ، بنابراین
1433
00:46:58,240 –> 00:47:00,240
به طور پیشفرض فکر میکنم فقط یک اتصال داخلی انجام میدهد
1434
00:47:00,240 –> 00:47:01,920
و درست نشد
1435
00:47:01,920 –> 00:47:04,880
، من در واقع
1436
00:47:04,880 –> 00:47:06,800
فقط 3000
1437
00:47:06,800 –> 00:47:09,760
ردیف داشتم زیرا سعی میکرد آنها را
1438
00:47:09,760 –> 00:47:10,079
در جایی که
1439
00:47:10,079 –> 00:47:14,160
هم دادههای ورودی
1440
00:47:14,160 –> 00:47:17,280
و هم دادههای ادغام
1441
00:47:17,280 –> 00:47:20,160
شناسه مشتری یکسانی دارند و
1442
00:47:20,160 –> 00:47:21,520
خیلی خوب کار نمیکنند،
1443
00:47:21,520 –> 00:47:23,280
بنابراین فقط مطمئن شوید که hal چپ و
1444
00:47:23,280 –> 00:47:24,640
سپس نمایه سمت چپ درست
1445
00:47:24,640 –> 00:47:26,960
درست است درست است و این همان چیزی است که
1446
00:47:26,960 –> 00:47:27,680
برای من انجام شد،
1447
00:47:27,680 –> 00:47:30,720
بنابراین اگر شیفت کنم و um و وارد کنم
1448
00:47:30,720 –> 00:47:33,839
من به شما نشان خواهم داد که اگر انجام دهم، فقط آن
1449
00:47:33,839 –> 00:47:35,280
را نظر می دهم
1450
00:47:35,280 –> 00:47:39,599
و اوه و این کار را انجام می دهم et 3300 ردیف
1451
00:47:39,599 –> 00:47:42,079
و اگر به آن نگاه کنم پرچم 90 هزینه من همه یک است
1452
00:47:42,079 –> 00:47:43,200
1453
00:47:43,200 –> 00:47:44,640
و می دانم که نباید درست باشد
1454
00:47:44,640 –> 00:47:45,839
زیرا مشتریان زیادی
1455
00:47:45,839 –> 00:47:47,119
هستند که خرید نمی کنند،
1456
00:47:47,119 –> 00:47:50,000
بنابراین ترفند این بود که این مقدار
1457
00:47:50,000 –> 00:47:51,040
باقی بماند
1458
00:47:51,040 –> 00:47:53,440
و سپس و سپس در اینجا نیز خواهید
1459
00:47:53,440 –> 00:47:55,119
دید که مقدار زیادی n وجود دارد که
1460
00:47:55,119 –> 00:47:56,000
به
1461
00:47:56,000 –> 00:47:58,400
دلیل اینکه این مشتریان
1462
00:47:58,400 –> 00:47:59,359
خریدی انجام
1463
00:47:59,359 –> 00:48:02,960
نداده اند، ما می خواهیم که صفر باشد، بنابراین ما
1464
00:48:02,960 –> 00:48:04,880
فقط از fill on a0 استفاده می
1465
00:48:04,880 –> 00:48:07,200
کنیم و ما. این را بهعنوان قاب داده ویژگیهای ما ذخیره میکنیم،
1466
00:48:07,200 –> 00:48:07,920
1467
00:48:07,920 –> 00:48:11,040
بنابراین اگر شیفت را انجام دهم، قاب داده ویژگیهای ما را وارد کنید،
1468
00:48:11,040 –> 00:48:12,800
چیزی شبیه به این است
1469
00:48:12,800 –> 00:48:16,640
که در آن اکنون شناسه مشتری
1470
00:48:16,640 –> 00:48:17,520
1471
00:48:17,520 –> 00:48:19,520
نمایه ما است و فرکانس جدید و ویژگیهای پولی خود را داریم
1472
00:48:19,520 –> 00:48:21,040
و
1473
00:48:21,040 –> 00:48:22,079
میخواهیم
1474
00:48:22,079 –> 00:48:23,680
بتوانید این را به هزینه خالص در
1475
00:48:23,680 –> 00:48:24,240
1476
00:48:24,240 –> 00:48:26,559
کل 90 روز آینده و این و اینکه آیا
1477
00:48:26,559 –> 00:48:28,880
آنها پولی خرج کرده اند یا نه، یک یا
1478
00:48:28,880 –> 00:48:29,520
صفر ربط دهید،
1479
00:48:29,520 –> 00:48:31,520
بنابراین اگر آنها پول خرج کرده اند، اگر آنها پولی خرج کرده اند
1480
00:48:31,520 –> 00:48:33,440
، یک اینجا خواهید داشت. شما در اینجا یک صفر خواهید داشت
1481
00:48:33,440 –> 00:48:34,880
1482
00:48:34,880 –> 00:48:36,400
و اگر آنها پول خرج کرده باشند شما
1483
00:48:36,400 –> 00:48:38,319
چقدر در این ستون خواهید داشت و ما ب او می
1484
00:48:38,319 –> 00:48:39,359
تواند
1485
00:48:39,359 –> 00:48:41,839
رفتارهای خرید قبلی خود را تجزیه و تحلیل کند
1486
00:48:41,839 –> 00:48:42,640
تا
1487
00:48:42,640 –> 00:48:44,640
رفتارهای خرید آینده آنها را درک
1488
00:48:44,640 –> 00:48:46,000
کند،
1489
00:48:46,000 –> 00:48:47,520
بنابراین این ایده در اینجا است، هنگامی
1490
00:48:47,520 –> 00:48:50,000
که این ایده را آماده کردید و
1491
00:48:50,000 –> 00:48:52,880
اکنون به یادگیری ماشینی بروید، بنابراین ما
1492
00:48:52,880 –> 00:48:53,599
از
1493
00:48:53,599 –> 00:48:57,359
طبقه بندی کننده xgboose xgb و رگرسیورهای خود استفاده
1494
00:48:57,359 –> 00:48:59,359
خواهیم کرد. همچنین قرار است از گرید
1495
00:48:59,359 –> 00:49:01,119
جستوجوی cv استفاده کنیم، ما از امتیاز اعتبارسنجی متقاطع استفاده نمیکنیم،
1496
00:49:01,119 –> 00:49:02,000
1497
00:49:02,000 –> 00:49:05,280
بنابراین از شر آن خلاص میشوم که میتوانید
1498
00:49:05,280 –> 00:49:06,800
اینها را اجرا کنید، اما در واقع قبلاً
1499
00:49:06,800 –> 00:49:07,599
آنها
1500
00:49:07,599 –> 00:49:09,680
را در ابتدا اجرا کردم، اما اجرای
1501
00:49:09,680 –> 00:49:11,359
مجدد آن ضرری ندارد.
1502
00:49:11,359 –> 00:49:14,800
برای آنها یک x و یک y می
1503
00:49:14,800 –> 00:49:16,400
سازیم اما چون دو مدل می سازیم y
1504
00:49:16,400 –> 00:49:17,680
ما متفاوت خواهد بود اما x ما
1505
00:49:17,680 –> 00:49:19,040
برای هر دوی اینها یکسان است
1506
00:49:19,040 –> 00:49:20,960
بنابراین x ما جدید بودن ویژگی های ما خواهد بود.
1507
00:49:20,960 –> 00:49:22,559
فرکانس
1508
00:49:22,559 –> 00:49:25,920
و ویژگی های پولی um و اینها
1509
00:49:25,920 –> 00:49:27,280
رگرسیون های ما هستند
1510
00:49:27,280 –> 00:49:30,880
و سپس y ما، بنابراین متغیر هدف
1511
00:49:30,880 –> 00:49:33,839
ما ویژگی هایی خواهد بود که df
1512
00:49:33,839 –> 00:49:34,400
1513
00:49:34,400 –> 00:49:36,720
shift کل را وارد کنید و این فقط
1514
00:49:36,720 –> 00:49:37,760
یک سری پانداها خواهد بود
1515
00:49:37,760 –> 00:49:40,480
و من می خواهم y را برای ما صرف کنید.
1516
00:49:40,480 –> 00:49:42,480
سوال اول که 90 da بعدی است y
1517
00:49:42,480 –> 00:49:43,680
1518
00:49:43,680 –> 00:49:46,240
مشکل رگرسیون را پیش بینی خرج می کند و چیزی که ما
1519
00:49:46,240 –> 00:49:47,520
سعی داریم بفهمیم این است
1520
00:49:47,520 –> 00:49:48,559
که آنها در
1521
00:49:48,559 –> 00:49:50,640
90 روز آینده چقدر هزینه خواهند کرد و ما می خواهیم
1522
00:49:50,640 –> 00:49:53,200
الگوریتم ما 16 را برای این شخص پیش بینی کند
1523
00:49:53,200 –> 00:49:54,800
و ما می خواهیم صفر را برای این
1524
00:49:54,800 –> 00:49:57,119
افراد
1525
00:49:57,119 –> 00:49:59,839
پیش بینی کنیم. ‘قرار است یک رگرسیون xgb ایجاد کنیم،
1526
00:49:59,839 –> 00:50:02,480
بنابراین این مشخصات رگرسیون xgb ما است، ما از تابع
1527
00:50:02,480 –> 00:50:04,160
رگرسیون xgb استفاده میکنیم.
1528
00:50:04,160 –> 00:50:06,000
1529
00:50:06,000 –> 00:50:07,760
1530
00:50:07,760 –> 00:50:09,040
1531
00:50:09,040 –> 00:50:12,240
قابل تکرار است
1532
00:50:12,240 –> 00:50:13,680
و سپس از این
1533
00:50:13,680 –> 00:50:15,680
تابع مفید از scikit-learn به نام grid
1534
00:50:15,680 –> 00:50:17,119
search cv استفاده
1535
00:50:17,119 –> 00:50:19,440
می کنیم. یک تخمینگر
1536
00:50:19,440 –> 00:50:21,280
ارائه می کنیم و یک شبکه پارامتر برای آن ارائه می دهیم
1537
00:50:21,280 –> 00:50:22,720
و این
1538
00:50:22,720 –> 00:50:24,319
فضای جستجویی است که آن را بررسی می
1539
00:50:24,319 –> 00:50:26,160
کند. بنابراین یکی از پارامترهای کلیدی
1540
00:50:26,160 –> 00:50:29,440
برای xgboost نرخ یادگیری است،
1541
00:50:29,440 –> 00:50:31,160
بنابراین ما آن را از
1542
00:50:31,160 –> 00:50:35,119
0.01 به 0.1.3.5 تغییر می دهیم،
1543
00:50:35,119 –> 00:50:37,520
بنابراین این یک دو سه
1544
00:50:37,520 –> 00:50:38,319
چهار
1545
00:50:38,319 –> 00:50:41,839
نوع مختلف از مدل تقویت xg را
1546
00:50:41,839 –> 00:50:45,440
در طول تست و سپس امتیازدهی ایجاد می کند.
1547
00:50:45,440 –> 00:50:46,720
ما قصد داریم به آن را th روش نمره دهی
1548
00:50:46,720 –> 00:50:48,640
1549
00:50:48,640 –> 00:50:50,640
خطای میانگین مطلق منفی و کاری که قرار است
1550
00:50:50,640 –> 00:50:51,839
انجام دهد این است که
1551
00:50:51,839 –> 00:50:54,880
میانگین خطای مطلق یا mae
1552
00:50:54,880 –> 00:50:58,079
را محاسبه می کند و آن را به عنوان یک مقدار منفی ارائه می دهد، به
1553
00:50:58,079 –> 00:51:01,280
این معنی که ما به طور متوسط
1554
00:51:01,280 –> 00:51:05,280
ر مقداری که این به ما ارائه می دهد کاهش می ده
1555
00:51:05,280 –> 00:51:07,440
م. دوباره میخواهیم بگوییم refit برابر با درست است،
1556
00:51:07,440 –> 00:51:08,800
این مهم است،
1557
00:51:08,800 –> 00:51:11,359
من فکر میکنم در واقع پیشفرض است، اما
1558
00:51:11,359 –> 00:51:13,119
اتفاقی که قرار است بیفتد این است که ما
1559
00:51:13,119 –> 00:51:16,079
این refit و cv را دست به
1560
00:51:16,079 –> 00:51:16,880
دست
1561
00:51:16,880 –> 00:51:18,800
هم میدهیم، بنابراین cv اعتبار متقاطع ما است.
1562
00:51:18,800 –> 00:51:20,559
برای انجام پنج موردی که ب