فیلم آموزشی: آموزش کامل پایتون: ارزش طول عمر مشتری و تجزیه و تحلیل RFM با استفاده از یادگیری ماشین با زیرنویس فارسی

در این مطلب، ویدئو آموزش کامل پایتون: ارزش طول عمر مشتری و تجزیه و تحلیل RFM با استفاده از یادگیری ماشین با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 1:43:52

تصاویر این ویدئو:

قسمتی از زیرنویس این فیلم:

1
00:00:00,000 –> 00:00:01,439
بسیار خوب، به همه خوش آمدید به

2
00:00:01,439 –> 00:00:03,360
یک آزمایشگاه یادگیری هیجان انگیز دیگر، این

3
00:00:03,360 –> 00:00:05,440
آزمایشگاه یادگیری 59 است

4
00:00:05,440 –> 00:00:07,200
و آنچه که این یکی روی آن تمرکز دارد،

5
00:00:07,200 –> 00:00:08,960
ارزش طول عمر مشتری است

6
00:00:08,960 –> 00:00:10,639
و ما امروز کار ویژه ای انجام خواهیم داد،

7
00:00:10,639 –> 00:00:13,280
این اولین

8
00:00:13,280 –> 00:00:16,560
آزمایشگاه کامل پایتون ما است و برای شما عزیزان

9
00:00:16,560 –> 00:00:16,960

10
00:00:16,960 –> 00:00:18,640
کسانی که من را در علم کسب و کار دنبال کرده اند،

11
00:00:18,640 –> 00:00:20,640
من بنیانگذار و مدیر عامل هستم، نام من

12
00:00:20,640 –> 00:00:21,680
مات است

13
00:00:21,680 –> 00:00:23,359
و اگر تازه وارد علم تجارت شده اید،

14
00:00:23,359 –> 00:00:25,439
خوش آمدید، زیرا این

15
00:00:25,439 –> 00:00:26,960
واقعاً هیجان انگیز است، می دانم

16
00:00:26,960 –> 00:00:28,800
که ما افراد جدیدی را جذب می کنیم که به این دلیل است.

17
00:00:28,800 –> 00:00:30,000
مسیر جدید پایتون

18
00:00:30,000 –> 00:00:31,679
که ما به تازگی در

19
00:00:31,679 –> 00:00:33,520
علم کسب و کار و

20
00:00:33,520 –> 00:00:35,200
در برنامه آزمایشگاه‌های یادگیری خود ارائه می‌کنیم،

21
00:00:35,200 –> 00:00:37,600
همان چیزی است که شما در حال حاضر می‌بینید،

22
00:00:37,600 –> 00:00:39,680
ما خواهیم بود که اکنون آزمایشگاه‌های کامل پایتون را ارائه می‌کنیم،

23
00:00:39,680 –> 00:00:41,280

24
00:00:41,280 –> 00:00:43,200
بنابراین دو هفته پیش ما آیا

25
00:00:43,200 –> 00:00:44,719
ارزش طول عمر مشتری با

26
00:00:44,719 –> 00:00:47,360
مدل‌های r و مرتب در این هفته چیزی که ما

27
00:00:47,360 –> 00:00:48,000

28
00:00:48,000 –> 00:00:51,120
انجام می‌دهیم همان مشکل مشابه است،

29
00:00:51,120 –> 00:00:52,800
اما در حال تجزیه و تحلیل آن با پایتون و

30
00:00:52,800 –> 00:00:54,879
scikit-learn هستیم و می‌خواهیم

31
00:00:54,879 –> 00:00:57,440
یک برنامه داش خوب ارائه کنیم.

32
00:00:57,440 –> 00:00:59,359
یک دقیقه دیگر اینجا نمایش داده می شود

33
00:00:59,359 –> 00:01:01,199
این به اعضای حرفه‌ای ll ما

34
00:01:01,199 –> 00:01:03,039
می‌رود و من

35
00:01:03,039 –> 00:01:05,600
آن را در یک ثانیه در اینجا نشان می‌دهم، بنابراین

36
00:01:05,600 –> 00:01:06,640

37
00:01:06,640 –> 00:01:09,200
ما از اینجا شروع خواهیم کرد.

38
00:01:09,200 –> 00:01:10,799

39
00:01:10,799 –> 00:01:12,159
یک آزمایشگاه یادگیری علوم کسب و کار

40
00:01:12,159 –> 00:01:13,119
قبل از

41
00:01:13,119 –> 00:01:16,159
اینکه نسبتاً با کد سنگین باشد، بنابراین ما

42
00:01:16,159 –> 00:01:16,479
حدود

43
00:01:16,479 –> 00:01:19,280
10 15 دقیقه گفتگو

44
00:01:19,280 –> 00:01:20,960
داریم که در آن مشکل کسب و کار را بررسی می

45
00:01:20,960 –> 00:01:22,400
کنیم و در مورد چالش ها صحبت خواهیم کرد،

46
00:01:22,400 –> 00:01:24,000
چیزهایی که فناوری هایی که

47
00:01:24,000 –> 00:01:24,960
قرار است پیاده سازی کنیم.

48
00:01:24,960 –> 00:01:26,479
و سپس در

49
00:01:26,479 –> 00:01:29,040
عرض 15 تا 20 دقیقه

50
00:01:29,040 –> 00:01:31,280
به کدی می‌رویم، بنابراین وقتی وارد

51
00:01:31,280 –> 00:01:32,479
آن کد شدیم، این همان کاری است که قرار است

52
00:01:32,479 –> 00:01:33,040
انجام

53
00:01:33,040 –> 00:01:34,320
دهیم، درک داده‌های زیادی را انجام

54
00:01:34,320 –> 00:01:35,280
خواهیم داد و ما قرار است

55
00:01:35,280 –> 00:01:37,200
ویژگی‌هایی را بسازیم که به آن ویژگی‌های

56
00:01:37,200 –> 00:01:38,560
rfm می‌گویند که مخفف

57
00:01:38,560 –> 00:01:42,000
فرکانس جدید و پولی است، بنابراین

58
00:01:42,000 –> 00:01:44,320
در مورد کسب‌وکار بیشتر در مورد آن صحبت خواهم کرد،

59
00:01:44,320 –> 00:01:45,600
اما ما از

60
00:01:45,600 –> 00:01:47,280
پانداهای زیادی برای تجزیه و تحلیل استفاده خواهیم کرد و خواهیم بود.

61
00:01:47,280 –> 00:01:49,040
با ساختن چند طرح و

62
00:01:49,040 –> 00:01:50,159
سپس کاری که می خواهیم انجام دهیم این است

63
00:01:50,159 –> 00:01:51,360
که وارد ماشین شویم و یادگیری

64
00:01:51,360 –> 00:01:52,479

65
00:01:52,479 –> 00:01:54,399
اینجاست که این ابزار به نام scikit-learn

66
00:01:54,399 –> 00:01:56,880
بسیار مفید خواهد بود، ما

67
00:01:56,880 –> 00:01:58,880
دو مدل تقویت xg ایجاد می کنیم که

68
00:01:58,880 –> 00:01:59,280

69
00:01:59,280 –> 00:02:01,840
یکی برای پیش بینی احتمالات ایجاد می کنیم و

70
00:02:01,840 –> 00:02:04,000
این از نظر فنی یک مشکل طبقه بندی

71
00:02:04,000 –> 00:02:06,560
است و سپس ما خواهیم بود.

72
00:02:06,560 –> 00:02:08,479
ایجاد یکی برای

73
00:02:08,479 –> 00:02:11,680
پیش‌بینی هزینه‌های بعدی در ۹۰ روز

74
00:02:11,680 –> 00:02:14,400
که مشتریان خرج خواهند کرد و به آن مشکل رگرسیون می‌گویند،

75
00:02:14,400 –> 00:02:16,239

76
00:02:16,239 –> 00:02:18,400
بنابراین هنگامی که یادگیری ماشینی خود

77
00:02:18,400 –> 00:02:20,160
را انجام دادیم، پیش‌بینی‌هایی انجام می‌دهیم و سپس

78
00:02:20,160 –> 00:02:22,000
آن پیش‌بینی‌ها را در

79
00:02:22,000 –> 00:02:23,440
برنامه‌ای که کاربران کسب‌وکار انجام می‌دهند قیف می‌کنیم.

80
00:02:23,440 –> 00:02:25,280
می توانید از آن استفاده کنید و این چیزی است که

81
00:02:25,280 –> 00:02:27,360
ما امروز در اینجا به نمایش

82
00:02:27,360 –> 00:02:29,680
خواهیم گذاشت، این پاداش ll pro است، بنابراین اگر به

83
00:02:29,680 –> 00:02:32,080
lo pro بپیوندید من در عرض یک دقیقه در مورد این موضوع صحبت خواهم کرد،

84
00:02:32,080 –> 00:02:34,319
شما این برنامه را به عنوان یک جایزه دریافت خواهید کرد،

85
00:02:34,319 –> 00:02:35,760
بنابراین بسیار زیاد است. روند کار در سطحی

86
00:02:35,760 –> 00:02:37,200
که امروز از طریق هزار پا از آن عبور خواهیم کرد،

87
00:02:37,200 –> 00:02:39,360
امم،

88
00:02:39,360 –> 00:02:41,040
بیایید این کار را

89
00:02:41,040 –> 00:02:43,440
برای کسانی از شما که قبلاً

90
00:02:43,440 –> 00:02:45,040
هرگز آزمایشگاه یادگیری ندیده‌اند یا برای کسانی از

91
00:02:45,040 –> 00:02:45,760
شما که

92
00:02:45,760 –> 00:02:48,400
علاقه مند به پیوستن هستند آغاز کنیم. g Learning labs pro

93
00:02:48,400 –> 00:02:50,319
ما این دو هفته یکبار را پیشنهاد می کنیم،

94
00:02:50,319 –> 00:02:53,760

95
00:02:53,760 –> 00:02:55,920
اگر می خواهید آن ها را بررسی کنید، همین الان لینک ها را در چت قرار می دهم.

96
00:02:55,920 –> 00:02:58,159

97
00:02:58,159 –> 00:02:59,920

98
00:02:59,920 –> 00:03:02,800
فقط انواع

99
00:03:02,800 –> 00:03:03,440
موضوعاتی است

100
00:03:03,440 –> 00:03:05,040
که خارج از برنامه‌های درسی رشته‌های هنری اصلی کسب‌وکار

101
00:03:05,040 –> 00:03:07,040
و مسیر پایتون هستند،

102
00:03:07,040 –> 00:03:08,159

103
00:03:08,159 –> 00:03:10,159
بنابراین فراتر از ابزارهای پایه،

104
00:03:10,159 –> 00:03:12,239
دانش‌آموزان من نمونه‌های خاصی

105
00:03:12,239 –> 00:03:13,519

106
00:03:13,519 –> 00:03:16,000
از مشکلات و فناوری‌های تجاری را درخواست کرده‌اند

107
00:03:16,000 –> 00:03:17,599
که می‌خواهند اجرا شوند

108
00:03:17,599 –> 00:03:19,200
و اینجاست که Learning labs pro

109
00:03:19,200 –> 00:03:21,280
وارد می‌شود. بازی بنابراین هر دو هفته یک بار کاری که ما انجام می دهیم

110
00:03:21,280 –> 00:03:22,239
یک آزمایشگاه جدید است

111
00:03:22,239 –> 00:03:24,239
یا به طور کلی یک ساعت پروژه ای است

112
00:03:24,239 –> 00:03:25,440
که

113
00:03:25,440 –> 00:03:27,120
این هفته انجام می شود و

114
00:03:27,120 –> 00:03:28,959
در طول چند هفته آینده ارزش طول عمر مشتری را طی خواهد کرد، ما

115
00:03:28,959 –> 00:03:30,159

116
00:03:30,159 –> 00:03:32,959
مدل سازی رسانه های ترکیبی بازاریابی را انجام خواهیم داد و خواهیم رفت. برای

117
00:03:32,959 –> 00:03:33,360
انجام

118
00:03:33,360 –> 00:03:35,599
کارهای بیشتر ما

119
00:03:35,599 –> 00:03:37,680
بین r و پایتون جابه‌جا

120
00:03:37,680 –> 00:03:38,959
می‌شویم، بنابراین می‌توانید در اینجا ببینید ما r را

121
00:03:38,959 –> 00:03:40,720
داریم، پایتون داریم و

122
00:03:40,720 –> 00:03:42,000
فن‌آوری‌های مختلف

123
00:03:42,000 –> 00:03:43,840
زیادی داریم، بنابراین می‌خواهیم رفتن thr اوه اینها را

124
00:03:43,840 –> 00:03:46,959
قبلاً داریم این 59امین آزمایشگاه است،

125
00:03:46,959 –> 00:03:48,799
بنابراین 58 مورد از اینها قبلاً در

126
00:03:48,799 –> 00:03:50,959
Learninglabs pro وجود دارد، این یکی فردا در اینجا اضافه می

127
00:03:50,959 –> 00:03:51,360
شود

128
00:03:51,360 –> 00:03:54,480
و به

129
00:03:54,480 –> 00:03:58,159
عنوان آزمایشگاه 59 ملحق می شود آنچه واقعاً جالب

130
00:03:58,159 –> 00:04:00,400
است در این آزمایشگاه ها است که من

131
00:04:00,400 –> 00:04:02,480
جوایز زیادی به شما می دهم. این فقط نمونه‌ای از

132
00:04:02,480 –> 00:04:03,760
برخی از

133
00:04:03,760 –> 00:04:05,760
پاداش‌هایی است که من در هفته‌های گذشته

134
00:04:05,760 –> 00:04:07,120

135
00:04:07,120 –> 00:04:08,879
داده‌ام و به اعضای حرفه‌ای ll من می‌رسد، بنابراین وقتی

136
00:04:08,879 –> 00:04:10,640
به آن ملحق می‌شوید نه تنها کد

137
00:04:10,640 –> 00:04:11,840
و ویدیوها را دریافت می‌کنید، بلکه همه آنها را دریافت می‌کنید.

138
00:04:11,840 –> 00:04:14,799
امتیازات ویژه و به طور کلی

139
00:04:14,799 –> 00:04:15,599
می توانید ببینید

140
00:04:15,599 –> 00:04:16,959
که من یک موضوع در حال اجرا دارم، من

141
00:04:16,959 –> 00:04:18,880

142
00:04:18,880 –> 00:04:21,519
برنامه های براق زیادی را ارائه کرده ام، بنابراین اگر با r آشنا هستید

143
00:04:21,519 –> 00:04:22,639
، یک

144
00:04:22,639 –> 00:04:24,720
چارچوب برنامه به نام shiny وجود دارد و

145
00:04:24,720 –> 00:04:27,199
می توانید برنامه هایی را با علم داده بسازید تا

146
00:04:27,199 –> 00:04:29,120
ادغام شوند. چیزهایی مانند پشته‌های مدل‌های مرتب

147
00:04:29,120 –> 00:04:31,199
برای

148
00:04:31,199 –> 00:04:34,400
مجموعه‌ها مشعل و دستورالعمل‌های متنی r سبک gbm و r

149
00:04:34,400 –> 00:04:38,000
برای nlp کتابخانه جاسازی

150
00:04:38,000 –> 00:04:38,720
برای

151
00:04:38,720 –> 00:04:42,320
تجزیه و تحلیل بخش‌بندی مشتریان و

152
00:04:42,320 –> 00:04:43,520
بنابراین ما برنامه‌های زیادی را ارائه می‌دهیم

153
00:04:43,520 –> 00:04:45,280
که این فناوری‌ها را ادغام می‌کنند، اما

154
00:04:45,280 –> 00:04:46,080

155
00:04:46,080 –> 00:04:48,720
اکنون این متفاوت است. در هفته

156
00:04:48,720 –> 00:04:49,600
ما

157
00:04:49,600 –> 00:04:53,919
یک برنامه dash را ارائه می دهیم که توسط plotly ساخته شده است

158
00:04:53,919 –> 00:04:56,560
یا من آن را با چارچوب dash ساخته ام.

159
00:04:56,560 –> 00:04:57,520
این یک چارچوب وب است که

160
00:04:57,520 –> 00:04:59,600
بسیار شبیه به کاری است که shiny is in

161
00:04:59,600 –> 00:05:01,680
dash ما در پایتون انجام

162
00:05:01,680 –> 00:05:03,759
می دهد و به من امکان می دهد این برنامه را بسازم

163
00:05:03,759 –> 00:05:05,039
و ابزارها را ادغام می کند.

164
00:05:05,039 –> 00:05:08,080
مانند scikit-learn و کاری که این

165
00:05:08,080 –> 00:05:09,919
کار انجام می دهد این است که به ما امکان می دهد مشتریان خود را تجزیه و تحلیل

166
00:05:09,919 –> 00:05:11,039

167
00:05:11,039 –> 00:05:14,479
کنیم و به کسب و کار خود راه حلی ارائه دهیم

168
00:05:14,479 –> 00:05:16,240
یا محصول داده ای که به آنها امکان می دهد

169
00:05:16,240 –> 00:05:18,320
تصمیم گیری مبتنی بر داده را انجام

170
00:05:18,320 –> 00:05:21,199
دهند، بنابراین بیایید این برنامه را بررسی

171
00:05:21,199 –> 00:05:22,320
کنیم.

172
00:05:22,320 –> 00:05:25,120
نسخه ی نمایشی سریع این برنامه است این

173
00:05:25,120 –> 00:05:26,720
محصول نهایی است که ما امروز در حال تلاش برای ایجاد آن

174
00:05:26,720 –> 00:05:28,320
در این آزمایشگاه هستیم

175
00:05:28,320 –> 00:05:30,960
و کاری که ما انجام می دهیم این است که یک

176
00:05:30,960 –> 00:05:32,560
داشبورد تجزیه و تحلیل مشتری ایجاد

177
00:05:32,560 –> 00:05:35,840
می کنیم که هزینه ای را که مشتری انجام

178
00:05:35,840 –> 00:05:37,840
می دهد را پیش بینی می کند.

179
00:05:37,840 –> 00:05:39,280
در 90 روز آینده بسازید

180
00:05:39,280 –> 00:05:41,199
بنابراین این نقاط همه مشتری هستند و

181
00:05:41,199 –> 00:05:42,320
وقتی روی آنها

182
00:05:42,320 –> 00:05:46,800
می مانم می بینید که این مشتری 2941 است

183
00:05:46,800 –> 00:05:49,440
آنها آخرین آنها هستند که فرکانس

184
00:05:49,440 –> 00:05:51,360
25 خرید

185
00:05:51,360 –> 00:05:53,360
دارند احتمال پیش بینی آنها در

186
00:05:53,360 –> 00:05:56,800
90 روز آینده 88.6 است.

187
00:05:56,800 –> 00:05:58,560
درصد کل هزینه ای که آنها

188
00:05:58,560 –> 00:06:01,120
تا کنون با شرکت ما

189
00:06:01,120 –> 00:06:03,360
خرج کرده اند 86 است، هزینه پیش بینی شده در 90 روز آینده

190
00:06:03,360 –> 00:06:05,039
71 است

191
00:06:05,039 –> 00:06:07,600
و هزینه آنها در

192
00:06:07,600 –> 00:06:08,639
90 روز آینده

193
00:06:08,639 –> 00:06:11,280
در مقابل پیش بینی

194
00:06:11,280 –> 00:06:12,400
تفاوت 15 بوده است،

195
00:06:12,400 –> 00:06:14,880
بنابراین آنها 15 را خرج کردند. بیشتر از آن چیزی است که آنها

196
00:06:14,880 –> 00:06:16,319
پیش بینی کرده بودند، بنابراین شما این را چگونه

197
00:06:16,319 –> 00:06:17,280
می خوانید

198
00:06:17,280 –> 00:06:19,440
و نکته جالب این برنامه این

199
00:06:19,440 –> 00:06:20,960
است که همه مشتریان

200
00:06:20,960 –> 00:06:22,720
ما دارند و ما الگوریتمی در

201
00:06:22,720 –> 00:06:24,560
پشت صحنه داریم که

202
00:06:24,560 –> 00:06:26,400
پیش بینی می کند چه چیزی باید خرج کنند

203
00:06:26,400 –> 00:06:28,479
و آن را با آنچه آنها مقایسه می کند خرج کرده‌ام،

204
00:06:28,479 –> 00:06:30,880
بنابراین کاری که می‌توانم انجام دهم این است که می‌توانم قیف را پایین بیاورم

205
00:06:30,880 –> 00:06:32,400
و وقتی شروع به قیف

206
00:06:32,400 –> 00:06:35,600
کردن می‌کنیم، می‌توانیم ببینیم که بسیاری از این

207
00:06:35,600 –> 00:06:37,199
مشتریان وقتی این مقدار را کاهش

208
00:06:37,199 –> 00:06:40,000
می‌دهم، هزینه واقعی خود را منهای هزینه‌های

209
00:06:40,000 –> 00:06:41,759
پیش‌بینی‌شده می‌کنند،

210
00:06:41,759 –> 00:06:43,840
بنابراین وقتی این تعداد بسیار

211
00:06:43,840 –> 00:06:45,919
منفی می‌شود مشتریانی هستند که

212
00:06:45,919 –> 00:06:47,759
پیش‌بینی می‌شد بیش از هزینه‌ای که خرج کرده‌اند هزینه

213
00:06:47,759 –> 00:06:48,800
کنند،

214
00:06:48,800 –> 00:06:51,840
بنابراین می‌توانید ببینید که این مشتری 1079

215
00:06:51,840 –> 00:06:54,080
با احتمال فوق‌العاده بالایی

216
00:06:54,080 –> 00:06:57,120
برای خرید 96 درصد از آنها

217
00:06:57,120 –> 00:06:59,360
پیش‌بینی می‌شود که 153 دلار خرج کنند و

218
00:06:59,360 –> 00:07:01,440
آنها در واقع 100 دلار

219
00:07:01,440 –> 00:07:04,240
برای دلتای منفی 53 دلار خرج کرده است، بنابراین

220
00:07:04,240 –> 00:07:05,919
ممکن است این مشتری باشد که می‌خواهیم

221
00:07:05,919 –> 00:07:06,639

222
00:07:06,639 –> 00:07:08,960
با یک ایمیل یا چیزی به او هدف قرار دهیم تا

223
00:07:08,960 –> 00:07:10,000

224
00:07:10,000 –> 00:07:12,400
به او کمک کنیم تا پول بیشتری را با ما خرج کنیم،

225
00:07:12,400 –> 00:07:13,759
زیرا آنها به اندازه آنها خرج نکرده‌اند.

226
00:07:13,759 –> 00:07:14,560
پیش‌بینی شده بود

227
00:07:14,560 –> 00:07:16,400
که هزینه کنید، بنابراین به این صورت می‌توانید از این ابزار استفاده کنید

228
00:07:16,400 –> 00:07:17,840
و سپس آنچه جالب است این است که

229
00:07:17,840 –> 00:07:19,120
فقط می‌توانید روی این دکمه به نام

230
00:07:19,120 –> 00:07:21,759
تقسیم‌بندی دانلود کلیک کنید و یک

231
00:07:21,759 –> 00:07:24,080
فایل csv از تمام این مشتریانی که

232
00:07:24,080 –> 00:07:24,400

233
00:07:24,400 –> 00:07:27,520
احتمالات منفی یا

234
00:07:27,520 –> 00:07:29,039
پیش‌بینی‌های واقعی منفی نسبت به

235
00:07:29,039 –> 00:07:30,319
مقادیر پیش‌بینی‌شده‌شان دارند دانلود می‌کند.

236
00:07:30,319 –> 00:07:32,400
کاری که ما می‌توانیم انجام دهیم این است که می‌توانیم آن را در یابنده نشان دهیم

237
00:07:32,400 –> 00:07:34,160

238
00:07:34,160 –> 00:07:37,440
که در اینجا باز می‌شود، باز کنید

239
00:07:37,440 –> 00:07:40,240
و در همانجا همه

240
00:07:40,240 –> 00:07:40,560

241
00:07:40,560 –> 00:07:41,759
افرادی را دارید که باید بیشتر

242
00:07:41,759 –> 00:07:43,360
از هزینه‌هایشان پول خرج کنند

243
00:07:43,360 –> 00:07:45,840
و همه شناسه‌های مشتری آنها را دارید

244
00:07:45,840 –> 00:07:48,000
و می توانید به نوعی به پایین بروید

245
00:07:48,000 –> 00:07:49,440
و ببینید چه کسی

246
00:07:49,440 –> 00:07:52,240
پیش بینی شده است که چه کسی هزینه کند و اوه و

247
00:07:52,240 –> 00:07:52,800
چقدر

248
00:07:52,800 –> 00:07:55,840
هزینه کرده است، بنابراین این ابزار چگونه کار

249
00:07:55,840 –> 00:07:57,680
می کند، ابزار تقسیم بندی مشتری است

250
00:07:57,680 –> 00:07:59,280
و واقعاً مفید است. یا کسب‌وکارهایی که

251
00:07:59,280 –> 00:08:00,639
می‌خواهند بتوانند افرادی را هدف قرار

252
00:08:00,639 –> 00:08:02,800
دهند که به اندازه‌ای

253
00:08:02,800 –> 00:08:04,560
که پیش‌بینی شده بود هزینه نمی‌کنند

254
00:08:04,560 –> 00:08:05,680
و این کاری است که ما

255
00:08:05,680 –> 00:08:07,599
امروز انجام می‌دهیم، مشکل کسب‌وکار ما است،

256
00:08:07,599 –> 00:08:10,639
پس بیایید در مورد مشکل کسب‌وکار صحبت کنیم.

257
00:08:10,639 –> 00:08:12,400
سطح اوه ما در حال

258
00:08:12,400 –> 00:08:13,639
تجزیه و تحلیل چیزی هستیم که روابط تجاری غیر قراردادی نامیده می شود

259
00:08:13,639 –> 00:08:14,879
،

260
00:08:14,879 –> 00:08:17,599
امم، این همان

261
00:08:17,599 –> 00:08:18,479
چیزی است

262
00:08:18,479 –> 00:08:21,440
که شرکت شما محصولاتی را ارائه می دهد که

263
00:08:21,440 –> 00:08:23,039
افراد می توانند هر زمان که می توانند بیایند و

264
00:08:23,039 –> 00:08:23,919
خریداری کنند، بنابراین

265
00:08:23,919 –> 00:08:25,440
مطالعه موردی که ما با

266
00:08:25,440 –> 00:08:27,199
آن کار می کنیم همان چیزی است که ما با آن کار کردیم. دو هفته

267
00:08:27,199 –> 00:08:29,759
پیش این شرکتی به نام سی دی است که حالا

268
00:08:29,759 –> 00:08:30,479
آنها یک

269
00:08:30,479 –> 00:08:33,599
شرکت بزرگ در دوران حباب دات کام بودند، اوه

270
00:08:33,599 –> 00:08:34,880
آنها شرکتی هستند که

271
00:08:34,880 –> 00:08:37,279
در اوایل دهه 2000 همراه با بسیاری از

272
00:08:37,279 –> 00:08:39,200
شرکت های دات کام دیگر از بین رفتند،

273
00:08:39,200 –> 00:08:42,240
اما آنچه جالب است این است که سی دی در حال حاضر

274
00:08:42,240 –> 00:08:44,959
مجموعه ای از داده ها را دارد که آنها

275
00:08:44,959 –> 00:08:47,519
در اوایل دهه 2000 منتشر کرده بودند و این

276
00:08:47,519 –> 00:08:50,000
موضوع مورد تجزیه و تحلیل زیادی قرار گرفت، به

277
00:08:50,000 –> 00:08:51,519
ویژه به این دلیل که این یکی از

278
00:08:51,519 –> 00:08:53,120
اولین مجموعه داده هایی است که ما به دست آوردیم یا یک

279
00:08:53,120 –> 00:08:54,399
شرکت واقعی اطلاعات

280
00:08:54,399 –> 00:08:57,440
ناشناس خود را ارائه کرده است. در

281
00:08:57,440 –> 00:08:58,720
مورد مشتریان خود

282
00:08:58,720 –> 00:09:00,959
و ما دیدیم که شما به نوعی می دانید

283
00:09:00,959 –> 00:09:03,279
که مشتریان آنها چگونه خرید کرده اند

284
00:09:03,279 –> 00:09:06,560
و الگوهای خرید واقعی آنها چگونه است، بنابراین این

285
00:09:06,560 –> 00:09:08,000
مجموعه داده بسیار مفیدی

286
00:09:08,000 –> 00:09:09,440
است که امروز با آن

287
00:09:09,440 –> 00:09:11,600
در مورد مجموعه داده ای که حاوی

288
00:09:11,600 –> 00:09:14,800
تاریخچه است کار خواهیم کرد. 66 000 تراکنش برای 25

289
00:09:14,800 –> 00:09:18,399
000 مشتری اوه، عرضه 19

290
00:09:18,399 –> 00:09:20,000
محصول جدید بود، بنابراین آنها

291
00:09:20,000 –> 00:09:22,240
سی دی نبودند که این محصولات سی دی

292
00:09:22,240 –> 00:09:24,560
هایی بودند که تقاضای قبلی نداشتند و

293
00:09:24,560 –> 00:09:26,320
مشتریان جدیدی را پوشش می دهد که هرگز

294
00:09:26,320 –> 00:09:27,920
قبل از خرید انجام نداده اند و اولین

295
00:09:27,920 –> 00:09:29,760
خرید خود را در یک زمان انجام داده اند. پنجره سه ماهه از

296
00:09:29,760 –> 00:09:30,560
یکدیگر، بنابراین

297
00:09:30,560 –> 00:09:32,480
بعداً بیشتر در مورد آن صحبت خواهیم کرد که به

298
00:09:32,480 –> 00:09:35,200
آن تحلیل کوهورت یا کوهورت می گویند

299
00:09:35,200 –> 00:09:37,360
و این یک مجموعه داده واقعا مفید

300
00:09:37,360 –> 00:09:40,720
برای آن نوع بود.

301
00:09:40,720 –> 00:09:43,519

302
00:09:43,519 –> 00:09:45,279
برای اینکه بفهمم

303
00:09:45,279 –> 00:09:46,800
در پایان روز

304
00:09:46,800 –> 00:09:49,279
روی چه مشتریانی باید تمرکز کنیم، این دقیقاً همان کاری است که ما می‌خواهیم انجام دهیم، من

305
00:09:49,279 –> 00:09:51,120
این کار را در علم کسب و کار زیاد انجام

306
00:09:51,120 –> 00:09:54,160
می‌دهم، من در حال تجزیه و تحلیل مشتریان هستم تا

307
00:09:54,160 –> 00:09:57,279
بفهمم کدام مشتریان احتمالاً تحلیلی را خریداری می‌کنند.

308
00:09:57,279 –> 00:09:58,480

309
00:09:58,480 –> 00:10:01,200
الگوریتم‌های روی آن‌ها

310
00:10:01,200 –> 00:10:02,800
، ما

311
00:10:02,800 –> 00:10:05,200
استراتژی‌های هدف‌یابی ایمیل داخلی خودمان را داریم و

312
00:10:05,200 –> 00:10:06,640
چیزهایی از این دست،

313
00:10:06,640 –> 00:10:07,839
بنابراین این تکنیک‌هایی که

314
00:10:07,839 –> 00:10:09,519
امروز یاد می‌گیرید دقیقاً همان چیزی است که من

315
00:10:09,519 –> 00:10:10,079
واقعاً در

316
00:10:10,079 –> 00:10:13,440
داخل کسب‌وکار خودم از آن استفاده می‌کنم،

317
00:10:13,440 –> 00:10:15,200
بنابراین روی آن تمرکز خواهیم کرد. یک

318
00:10:15,200 –> 00:10:17,279
کار پیش‌بینی که می‌خواهیم بدانیم، دو

319
00:10:17,279 –> 00:10:18,320
چیز متفاوت که می‌خواهیم بدانیم

320
00:10:18,320 –> 00:10:19,760
در آینده چقدر خرج خواهند کرد،

321
00:10:19,760 –> 00:10:22,399
بنابراین می‌خواهیم آن

322
00:10:22,399 –> 00:10:23,440
را از نظر

323
00:10:23,440 –> 00:10:25,839
یک ارزش تجزیه و تحلیل کنیم و می‌توانیم این را

324
00:10:25,839 –> 00:10:27,519
نه لزوماً از نظر فنی یک

325
00:10:27,519 –> 00:10:29,360
طول عمر مشتری در نظر بگیریم. ارزش اما

326
00:10:29,360 –> 00:10:30,640
ارزش 90 روز آینده مشتری است،

327
00:10:30,640 –> 00:10:32,079
بنابراین می‌خواهیم بدانیم که

328
00:10:32,079 –> 00:10:33,760
در 90 روز آینده چقدر با

329
00:10:33,760 –> 00:10:36,000
ما خرج می‌کنند و دو روز

330
00:10:36,000 –> 00:10:37,600
آینده چقدر با ما خرید می‌کنند

331
00:10:37,600 –> 00:10:38,560
و اینها

332
00:10:38,560 –> 00:10:40,959
اهداف متفاوت و استراتژی‌های کمی متفاوت هستند

333
00:10:40,959 –> 00:10:41,760
و

334
00:10:41,760 –> 00:10:43,839
تکنیک‌های کمی متفاوتی که

335
00:10:43,839 –> 00:10:44,959
باید برای

336
00:10:44,959 –> 00:10:46,640
پاسخ به این سؤالات پیاده‌سازی کنیم،

337
00:10:46,640 –> 00:10:48,720
بنابراین سه سؤال وجود دارد که من

338
00:10:48,720 –> 00:10:50,720
واقعاً می‌خواهم امروز روی آنها تمرکز کنم

339
00:10:50,720 –> 00:10:53,279
و این سه سؤال از مهم‌ترین آنها هستند. تکه‌های

340
00:10:53,279 –> 00:10:53,839

341
00:10:53,839 –> 00:10:56,560
بدی که امروز از بین می‌برید،

342
00:10:56,560 –> 00:10:57,519
سؤالاتی است که

343
00:10:57,519 –> 00:11:01,680
در واقع می‌توانیم برای کسب‌وکار

344
00:11:01,680 –> 00:11:04,640
به آنها پاسخ دهیم تا بتوانیم به آنها کمک کنیم تا

345
00:11:04,640 –> 00:11:06,240
از این تجزیه و تحلیل ارزش کسب کنند، بنابراین

346
00:11:06,240 –> 00:11:07,120
این سه سؤالی است که

347
00:11:07,120 –> 00:11:08,880
امروز به سؤال اول

348
00:11:08,880 –> 00:11:10,880
سؤال شماره یک پاسخ خواهیم داد. این است که

349
00:11:10,880 –> 00:11:11,920
مشتریان بیشترین

350
00:11:11,920 –> 00:11:14,640
احتمال خرج را در 90 روز آینده دارند، بنابراین

351
00:11:14,640 –> 00:11:15,519

352
00:11:15,519 –> 00:11:17,839
ما از پیش بینی های خود استفاده می کنیم،

353
00:11:17,839 –> 00:11:19,600
این جدول را در اینجا ایجاد می کنیم

354
00:11:19,600 –> 00:11:22,800
و هر کدام از اینها یک شناسه مشتری دارند

355
00:11:22,800 –> 00:11:24,560
و می توانیم آن را مرتب کنیم و می توانید من را ببینید. ‘m

356
00:11:24,560 –> 00:11:25,920
از مقادیر مرتب‌سازی در اینجا

357
00:11:25,920 –> 00:11:28,800
با استفاده از این ستون، احتمال را پیش‌بینی می‌کند و

358
00:11:28,800 –> 00:11:29,279

359
00:11:29,279 –> 00:11:31,839
این بالاترین احتمال خرید را

360
00:11:31,839 –> 00:11:33,200
در 90 روز آینده دارد،

361
00:11:33,200 –> 00:11:34,399
بنابراین ما می‌توانیم به این

362
00:11:34,399 –> 00:11:36,640
سؤال بلافاصله برای کسب‌وکارمان پاسخ دهیم.

363
00:11:36,640 –> 00:11:37,680

364
00:11:37,680 –> 00:11:39,839
سؤال بعدی سؤال شماره دو

365
00:11:39,839 –> 00:11:42,079
که مشتریان اخیرا خرید کرده‌اند،

366
00:11:42,079 –> 00:11:44,079
اما بعید است که بخرند، بنابراین این یک

367
00:11:44,079 –> 00:11:45,440
نوع سوال متفاوت است،

368
00:11:45,440 –> 00:11:47,440
زیرا کاری که ما در حال حاضر انجام می‌دهیم این است که

369
00:11:47,440 –> 00:11:50,320
می‌گوییم خوب است که آنها اخیراً خرید کرده‌اند،

370
00:11:50,320 –> 00:11:51,839
بنابراین ما مجموعه داده‌ای را

371
00:11:51,839 –> 00:11:54,079
که این پیش‌بینی‌هایی که ما انجام می‌دهیم

372
00:11:54,079 –> 00:11:57,120
و

373
00:11:57,120 –> 00:11:58,720
می‌خواهیم آن‌ها را بر اساس آخرین خریدها فیلتر کنیم، بنابراین هر خریدی را بررسی می‌کنیم،

374
00:11:58,720 –> 00:11:59,839

375
00:11:59,839 –> 00:12:01,440
افرادی که

376
00:12:01,440 –> 00:12:03,600
در 90 روز گذشته

377
00:12:03,600 –> 00:12:05,920
چیزی نسبتاً اخیر خریده‌اند و سپس ما همچنین

378
00:12:05,920 –> 00:12:06,959
می‌خواهیم ببینیم

379
00:12:06,959 –> 00:12:10,079
کدام یک از آن‌ها احتمال خرید مجددشان کمتر از 20 است

380
00:12:10,079 –> 00:12:13,360
، ما آن مقادیر را مرتب می‌کنیم

381
00:12:13,360 –> 00:12:14,720

382
00:12:14,720 –> 00:12:17,440
و سپس چیزی که برای آن مفید است این است

383
00:12:17,440 –> 00:12:18,320
که

384
00:12:18,320 –> 00:12:21,680
بتوانیم جلوی مردم قبل از آن‌ها دیده

385
00:12:21,680 –> 00:12:24,560
شویم.

386
00:12:24,560 –> 00:12:26,160
آن مشتری می میرد،

387
00:12:26,160 –> 00:12:28,079
ما می خواهیم او را احیا کنیم، ما می خواهیم

388
00:12:28,079 –> 00:12:30,000
آنها را تا زمانی که ممکن است حفظ کنیم،

389
00:12:30,000 –> 00:12:32,800
بنابراین شما می توانید این را تجزیه و تحلیل کنید و روی

390
00:12:32,800 –> 00:12:34,639
آن بخش از پایگاه مشتری تمرکز کنید

391
00:12:34,639 –> 00:12:38,800
و بتوانید

392
00:12:38,800 –> 00:12:41,040
برخی از این مشتریان در حال مرگ را احیا یا احیا کنید، بنابراین شما

393
00:12:41,040 –> 00:12:42,160
می خواهید این کار را انجام دهید. و

394
00:12:42,160 –> 00:12:43,760
این یکی از سؤالاتی است

395
00:12:43,760 –> 00:12:45,279
که امروز می خواهیم به آن پاسخ

396
00:12:45,279 –> 00:12:47,279
دهیم. سؤال سومی است که

397
00:12:47,279 –> 00:12:49,360
پیش بینی می شود مشتریان خریداری کنند،

398
00:12:49,360 –> 00:12:51,680
اما این کار را انجام نداده است، بنابراین این یک نوع سؤال متفاوت است

399
00:12:51,680 –> 00:12:53,600
، بنابراین اینها افرادی هستند که

400
00:12:53,600 –> 00:12:56,639
h داشتند. احتمال

401
00:12:56,639 –> 00:13:00,320
خرید بسیار زیاد است و ما می‌توانیم آن را

402
00:13:00,320 –> 00:13:01,519
با پیش‌بینی‌هایی که می‌خواهیم انجام دهیم

403
00:13:01,519 –> 00:13:02,240
تجزیه و تحلیل

404
00:13:02,240 –> 00:13:04,560
کنیم و می‌خواهیم بگوییم خوب است،

405
00:13:04,560 –> 00:13:05,600
می‌خواهیم پیش‌بینی

406
00:13:05,600 –> 00:13:09,120
کنیم که کل هزینه‌ها کل خرج 90 خواهد بود

407
00:13:09,120 –> 00:13:10,639
یا ما می‌خواهیم انجام دهیم.

408
00:13:10,639 –> 00:13:12,399
کسانی که

409
00:13:12,399 –> 00:13:15,200
در 90 روز آینده صفر دلار خرج کرده‌اند را فیلتر

410
00:13:15,200 –> 00:13:16,800
می‌کنیم و سپس کاری که می‌خواهیم انجام دهیم این است که بر اساس

411
00:13:16,800 –> 00:13:17,839

412
00:13:17,839 –> 00:13:21,279
ارزش‌های هزینه پیش‌بینی‌شده‌شان مرتب کنیم و می‌بینیم که این

413
00:13:21,279 –> 00:13:23,639
شخص 153 دلار پیش‌بینی کرده بود

414
00:13:23,639 –> 00:13:27,680
اما آنها صفر دلار خرج کردند.

415
00:13:27,680 –> 00:13:30,240
بهترین نوع

416
00:13:30,240 –> 00:13:31,680
فرصت است و این چیزی است که

417
00:13:31,680 –> 00:13:32,720
واقعا

418
00:13:32,720 –> 00:13:34,639
برای کسب و کار

419
00:13:34,639 –> 00:13:36,320

420
00:13:36,320 –> 00:13:37,120

421
00:13:37,120 –> 00:13:40,399

422
00:13:40,399 –> 00:13:41,279

423
00:13:41,279 –> 00:13:42,800

424
00:13:42,800 –> 00:13:44,720
ارزشمند است. و آنها دارند،

425
00:13:44,720 –> 00:13:46,160
اما نشان می دهند که باید

426
00:13:46,160 –> 00:13:48,079
خرید انجام دهند، در واقع در

427
00:13:48,079 –> 00:13:50,480
اینجا احتمال بالایی دارند 71 درصد

428
00:13:50,480 –> 00:13:52,320
و پیش بینی می شود که 153 دلار خرج کنند،

429
00:13:52,320 –> 00:13:54,320
بنابراین ما باید بفهمیم که چرا

430
00:13:54,320 –> 00:13:55,279
آنها چرا این کار را انجام نمی دهند.

431
00:13:55,279 –> 00:13:56,720
خرج نمی کنیم و ما

432
00:13:56,720 –> 00:13:58,000
باید جلوی آنها بگیریم، ما باید تیم بازاریابی خود را وادار کنیم

433
00:13:58,000 –> 00:13:59,199

434
00:13:59,199 –> 00:14:01,440
تا برای آنها ایمیل های هدفمند بفرستند

435
00:14:01,440 –> 00:14:02,800
تا آنها پول بیشتری خرج کنند، زیرا

436
00:14:02,800 –> 00:14:04,240
این یک فرصت از دست رفته است و

437
00:14:04,240 –> 00:14:05,760
می تواند درآمد زیادی برای

438
00:14:05,760 –> 00:14:07,199
شرکت شما ایجاد

439
00:14:07,199 –> 00:14:09,839
کند، پس بیایید در مورد مشتری صحبت کنیم.

440
00:14:09,839 –> 00:14:11,360
مدل‌سازی ارزش مادام‌العمر،

441
00:14:11,360 –> 00:14:12,639
بنابراین چند

442
00:14:12,639 –> 00:14:14,480
رویکرد مختلف وجود دارد و

443
00:14:14,480 –> 00:14:15,920
اگر در

444
00:14:15,920 –> 00:14:16,480
مورد

445
00:14:16,480 –> 00:14:18,160
ارزش طول عمر مشتری تحقیق کنید،

446
00:14:18,160 –> 00:14:19,920
آیا

447
00:14:19,920 –> 00:14:22,160
مشتری یا شرکت‌ها از این به عنوان

448
00:14:22,160 –> 00:14:23,760
معیاری برای سنجش سودآوری خود استفاده می‌کنند

449
00:14:23,760 –> 00:14:25,600
تا آنها بخواهند بفهمند

450
00:14:25,600 –> 00:14:27,199
کدام مشتریان هستند، چندین روش مختلف وجود دارد. آنها باید روی آن تمرکز کنند

451
00:14:27,199 –> 00:14:27,680

452
00:14:27,680 –> 00:14:29,760
و به طور کلی آنچه را که سعی می کنند و

453
00:14:29,760 –> 00:14:32,320
انجام می دهند این است که از الگوریتم های مختلفی

454
00:14:32,320 –> 00:14:34,240
برای محاسبه استفاده می کنند که می دانید ارزش

455
00:14:34,240 –> 00:14:35,360
پیش بینی

456
00:14:35,360 –> 00:14:37,120
شده این مشتری با توجه به

457
00:14:37,120 –> 00:14:39,360
سابقه خرید قبلی آنها چقدر است،

458
00:14:39,360 –> 00:14:41,519
بنابراین به طور خلاصه ارزش طول عمر مشتری

459
00:14:41,519 –> 00:14:43,360
سودی است که از آینده تخمین زده می

460
00:14:43,360 –> 00:14:45,519
شود. رابطه با یک مشتری،

461
00:14:45,519 –> 00:14:48,240
شما اساساً فقط

462
00:14:48,240 –> 00:14:50,399
یک نوع نمایه برای چگونگی این مشتری تعیین می کنید mer

463
00:14:50,399 –> 00:14:51,760
احتمالاً هزینه می کند

464
00:14:51,760 –> 00:14:53,760
و همچنین هزینه حفظ آن

465
00:14:53,760 –> 00:14:56,160
مشتری، بنابراین شما

466
00:14:56,160 –> 00:14:57,199
این هزینه ها را

467
00:14:57,199 –> 00:14:58,560
در نظر بگیرید و از آن کم کنید و این همان چیزی است که ارزش طول عمر مشتری شما

468
00:14:58,560 –> 00:15:00,399
است، بنابراین رویکردهای مختلفی وجود

469
00:15:00,399 –> 00:15:01,440
دارد که

470
00:15:01,440 –> 00:15:04,880
از استراتژی های پیچیده تر

471
00:15:04,880 –> 00:15:08,800
تا و در اینجا به نوعی شبیه یک

472
00:15:08,800 –> 00:15:11,519
اقتصاد سنجی است. رویکردی که ما داریم و من

473
00:15:11,519 –> 00:15:12,720
مقدمه این را می‌کنم که ما

474
00:15:12,720 –> 00:15:13,360

475
00:15:13,360 –> 00:15:15,839
رویکرد اقتصادسنجی را در اینجا پیاده‌سازی نمی‌کنیم،

476
00:15:15,839 –> 00:15:17,440
ما بیشتر از یک

477
00:15:17,440 –> 00:15:21,199
رویکرد یادگیری ماشینی پیش‌بینی‌کننده استفاده می‌کنیم، بنابراین یکی از راه‌ها

478
00:15:21,199 –> 00:15:24,480
این است که محاسبه کنیم و از آن به عنوان یک یا استفاده کنیم.

479
00:15:24,480 –> 00:15:24,800

480
00:15:24,800 –> 00:15:27,199
مدل آن دارای یک جریان نقدی با تخفیف است،

481
00:15:27,199 –> 00:15:28,079
بنابراین

482
00:15:28,079 –> 00:15:30,639
شما سهمی را دارید که آن مشتری قرار است

483
00:15:30,639 –> 00:15:31,440
انجام دهد

484
00:15:31,440 –> 00:15:33,680
و سپس هزینه های او را کم می کنید

485
00:15:33,680 –> 00:15:35,440
و یک um خواهید

486
00:15:35,440 –> 00:15:37,600
داشت و همچنین به این دلیل که زمان

487
00:15:37,600 –> 00:15:39,680
درگیر است، شما یک نرخ تنزیل

488
00:15:39,680 –> 00:15:40,240

489
00:15:40,240 –> 00:15:42,000
نیز دارید. این به نوعی شبیه

490
00:15:42,000 –> 00:15:44,480
رویکرد اقتصادسنجی یا جریان نقدی

491
00:15:44,480 –> 00:15:47,680
برای اندازه‌گیری ارزش طول عمر مشتری است،

492
00:15:47,680 –> 00:15:50,800
من در واقع از آن در شرکت خود استفاده نمی‌کنم

493
00:15:50,800 –> 00:15:53,360
زیرا چالش‌هایی وجود دارد که من استفاده

494
00:15:53,360 –> 00:15:54,480
کرده‌ام و سعی کرده‌ام از آن استفاده کنم.

495
00:15:54,480 –> 00:15:56,800
شخصاً و واقعاً به من

496
00:15:56,800 –> 00:15:57,920
نتایج عالی نمی دهد

497
00:15:57,920 –> 00:15:59,759
یادگیری ماشینی این سناریویی است

498
00:15:59,759 –> 00:16:01,440
که در آن فکر می کنم یادگیری ماشینی کار

499
00:16:01,440 –> 00:16:02,720
بهتری انجام می دهد ،

500
00:16:02,720 –> 00:16:05,040
بنابراین می خواهم چالش های موجود در رویکرد اقتصاد سنجی

501
00:16:05,040 –> 00:16:06,160

502
00:16:06,160 –> 00:16:07,680
را به طور خاص برای تجارت خود بدانم

503
00:16:07,680 –> 00:16:10,000
که مشتریان در چارچوب تعریف شده مشارکت خواهند کرد.

504
00:16:10,000 –> 00:16:11,920
مدت زمان بسیار

505
00:16:11,920 –> 00:16:13,839
عالی است، اما چیزی که من معمولاً به آن

506
00:16:13,839 –> 00:16:15,360
علاقه مند هستم

507
00:16:15,360 –> 00:16:17,519
دوره 90 روزه بعدی است، بنابراین من در یک ربع به

508
00:16:17,519 –> 00:16:19,440
سه ماهه که مشتریان

509
00:16:19,440 –> 00:16:22,560
با ما پول خرج می کنند، شخصاً

510
00:16:22,560 –> 00:16:25,839
اجرای آن را دقیق ندانسته ام

511
00:16:25,839 –> 00:16:26,079
.

512
00:16:26,079 –> 00:16:29,040
رویکرد اقتصاد سنجی اقتصاد را قبلاً امتحان

513
00:16:29,040 –> 00:16:30,079

514
00:16:30,079 –> 00:16:32,639
کرده‌ام و به سرعت از آن صرف نظر کردم، بلکه

515
00:16:32,639 –> 00:16:34,320
کاری که انجام می‌دهم این است که آن را به عنوان یک رویکرد یادگیری ماشینی در نظر

516
00:16:34,320 –> 00:16:35,680
بگیرم و این چیزی است که من

517
00:16:35,680 –> 00:16:37,440
با موفقیت پیاده‌سازی کرده‌ام و این

518
00:16:37,440 –> 00:16:39,279
چیزی است که می‌خواهم به شما آموزش دهم.

519
00:16:39,279 –> 00:16:40,160
امروز می خواهم به شما نشان دهم که چگونه

520
00:16:40,160 –> 00:16:41,519
به طور خاص برخی از کارهایی را

521
00:16:41,519 –> 00:16:43,199
که من در علم تجارت انجام می دهم انجام دهید، این

522
00:16:43,199 –> 00:16:44,959
عالی است،

523
00:16:44,959 –> 00:16:46,720
بنابراین بیایید در مورد این

524
00:16:46,720 –> 00:16:48,480
رویکرد یادگیری ماشینی برای ارزش طول عمر

525
00:16:48,480 –> 00:16:49,759
مشتری یا مشتری صحبت کنیم.

526
00:16:49,759 –> 00:16:53,519
مدلسازی بنابراین

527
00:16:53,519 –> 00:16:56,560
من از یادگیری ماشینی استفاده می کنم و

528
00:16:56,560 –> 00:16:57,759
چند مرحله مختلف

529
00:16:57,759 –> 00:16:59,120
وجود دارد که قبل از اینکه وارد کد شویم باید آنها

530
00:16:59,120 –> 00:17:01,440
را در سطح بالایی طی

531
00:17:01,440 –> 00:17:02,720

532
00:17:02,720 –> 00:17:04,720

533
00:17:04,720 –> 00:17:07,039
کنم.

534
00:17:07,039 –> 00:17:08,799
شما می خواهید فقط یک نمونه از مشتریان خود را انتخاب کنید

535
00:17:08,799 –> 00:17:10,559
که در یک

536
00:17:10,559 –> 00:17:12,240
دوره مشخص هستند که همه آنها در

537
00:17:12,240 –> 00:17:13,919
همان دوره زمانی خریداری کرده اند که

538
00:17:13,919 –> 00:17:16,880
بازاریابی مشابه زیادی را تجربه کرده اند،

539
00:17:16,880 –> 00:17:19,119
بنابراین باید یک نوع الگوهای رفتاری

540
00:17:19,119 –> 00:17:20,079
نسبتا مشابه

541
00:17:20,079 –> 00:17:22,640
وجود داشته باشد. آن‌ها

542
00:17:22,640 –> 00:17:23,359
و همچنین

543
00:17:23,359 –> 00:17:26,959
رویدادهای نسبتاً

544
00:17:26,959 –> 00:17:29,520
مشابهی که همگی در یک زمان تجربه می‌کنند سیم‌کارت می‌کنند،

545
00:17:29,520 –> 00:17:30,880

546
00:17:30,880 –> 00:17:32,960
بنابراین یک گروه چیزی بیش از

547
00:17:32,960 –> 00:17:34,400
گروهی از مشتریان نیست که همگی

548
00:17:34,400 –> 00:17:35,600
تقریباً در همان زمانی شروع شده‌اند

549
00:17:35,600 –> 00:17:36,720
که ما قرار است به آن نگاه کنیم

550
00:17:36,720 –> 00:17:39,360
بین ژانویه است. 1997 و مشتریان

551
00:17:39,360 –> 00:17:39,760
بین

552
00:17:39,760 –> 00:17:41,679
مارس آه که اولین

553
00:17:41,679 –> 00:17:43,360
خرید خود را از شرکت

554
00:17:43,360 –> 00:17:46,320
ما انجام دادند و سی دی ما اکنون بین ژانویه و

555
00:17:46,320 –> 00:17:49,120
مارس 1997. بنابراین این

556
00:17:49,120 –> 00:17:51,280
جعبه سبز اینجاست که اولین خرید خود را انجام دادند

557
00:17:51,280 –> 00:17:53,120
و y می توانید ببینید که

558
00:17:53,120 –> 00:17:56,320
این چه چیزی است، این

559
00:17:56,320 –> 00:17:58,080
خط آبی تیره و سپس شما یک

560
00:17:58,080 –> 00:18:00,000
خط آبی روشن دارید، خط آبی تیره

561
00:18:00,000 –> 00:18:03,760
رفتار خرید انبوه آنها

562
00:18:03,760 –> 00:18:05,600
است، بنابراین ما همه

563
00:18:05,600 –> 00:18:08,160
خریدهایی را که آنها انجام داده اند به

564
00:18:08,160 –> 00:18:10,240
تفکیک ماه و اوه اضافه کرده ایم. شما این نوع الگو را می بینید

565
00:18:10,240 –> 00:18:12,320
که بعد از آن اولین

566
00:18:12,320 –> 00:18:15,120
خرید را انجام می دهند، چیزی که اتفاق می افتد این است که به

567
00:18:15,120 –> 00:18:16,640
مرور زمان از بین می رود

568
00:18:16,640 –> 00:18:18,400
و این نوعی منحنی طبیعی است که با آن

569
00:18:18,400 –> 00:18:20,080
خواهید دید

570
00:18:20,080 –> 00:18:22,000
زیرا همه مشتریان خود را نمی شناسید.

571
00:18:22,000 –> 00:18:23,360
که اولین خرید

572
00:18:23,360 –> 00:18:24,799
شما را انجام می دهید با همان نرخ به خرید ادامه می دهید

573
00:18:24,799 –> 00:18:26,240

574
00:18:26,240 –> 00:18:27,600
و به طور کلی اتفاقی که می افتد این است که به نوعی

575
00:18:27,600 –> 00:18:29,360
کاهش می یابد.

576
00:18:29,360 –> 00:18:31,520
اوم این خط آبی فقط روند است.

577
00:18:31,520 –> 00:18:33,600

578
00:18:33,600 –> 00:18:36,799

579
00:18:36,799 –> 00:18:38,640
این را به یک مشکل یادگیری ماشینی تبدیل می

580
00:18:38,640 –> 00:18:40,160
کنیم، اما ما چیزی را به نام تقسیم زمانی پیاده سازی می کنیم

581
00:18:40,160 –> 00:18:41,360
که به

582
00:18:41,360 –> 00:18:43,280
این معنی است که بر

583
00:18:43,280 –> 00:18:44,799
اساس زمان تقسیم می شویم،

584
00:18:44,799 –> 00:18:46,400
بنابراین رفتار خرید آنها

585
00:18:46,400 –> 00:18:48,960
را برای مدت زمان مشخصی در نظر می

586
00:18:48,960 –> 00:18:51,039
گیریم و سپس ما 90 بعدی آخر را تحلیل می

587
00:18:51,039 –> 00:18:52,240
کنم روزهایی

588
00:18:52,240 –> 00:18:54,960
که ما در مجموعه داده های

589
00:18:54,960 –> 00:18:56,320
خود الگوی خرید آنها را داریم،

590
00:18:56,320 –> 00:18:58,640
بنابراین از این قطعه قرمز

591
00:18:58,640 –> 00:18:59,840

592
00:18:59,840 –> 00:19:01,840
که قرار است با آن بیاییم، برای رسیدن به

593
00:19:01,840 –> 00:19:03,840
اهداف خود و این قطعه آبی

594
00:19:03,840 –> 00:19:05,679
که قرار است از آن استفاده کنیم، استفاده خواهیم کرد. با

595
00:19:05,679 –> 00:19:07,760
ویژگی‌هایی که مجموعه داده‌ها را تشکیل

596
00:19:07,760 –> 00:19:09,600
می‌دهند، به این دلیل که این یک سری زمانی است، می‌خواهیم

597
00:19:09,600 –> 00:19:11,200
بگوییم بسیار خوب، ما به آن نگاه

598
00:19:11,200 –> 00:19:11,679

599
00:19:11,679 –> 00:19:13,440
می‌کنیم و محاسبه می‌کنیم که برای

600
00:19:13,440 –> 00:19:15,919
هر مشتری جمع‌بندی می‌کنیم که چقدر هزینه کرده است.

601
00:19:15,919 –> 00:19:17,520
ما خلاصه می‌کنیم که آیا

602
00:19:17,520 –> 00:19:19,120
آنها

603
00:19:19,120 –> 00:19:20,640
در این پنجره زمانی چیزی خرج کرده‌اند یا خیر و این چیزی است که

604
00:19:20,640 –> 00:19:22,720
در این پرچم

605
00:19:22,720 –> 00:19:24,400
90 روزه وجود دارد

606
00:19:24,400 –> 00:19:25,760

607
00:19:25,760 –> 00:19:27,280
و در مجموع 90 روز و سپس قسمت آبی که ما می‌خواهیم

608
00:19:27,280 –> 00:19:29,280
کار ایجاد کنیم.

609
00:19:29,280 –> 00:19:32,559
ویژگی‌های rfm بنابراین فرکانس جدید و

610
00:19:32,559 –> 00:19:34,559
ویژگی‌های پولی نامیده می‌شوند و این فقط نوعی

611
00:19:34,559 –> 00:19:35,840
مهندسی ویژگی است

612
00:19:35,840 –> 00:19:37,280
و ما می‌خواهیم آن‌ها را از دوره آبی رفتارهای خرید آنها در نظر بگیریم،

613
00:19:37,280 –> 00:19:39,840

614
00:19:39,840 –> 00:19:41,120

615
00:19:41,120 –> 00:19:44,160
بنابراین ویژگی‌های rfm

616
00:19:44,160 –> 00:19:46,960
از اهمیت ویژه‌ای برخوردار هستند، زیرا

617
00:19:46,960 –> 00:19:47,600
اینها

618
00:19:47,600 –> 00:19:50,480
ویژگی‌های واقعاً ارزشمندی هستند وقتی که شما مشتریانی داشته باشند

619
00:19:50,480 –> 00:19:52,320
که در طول زمان خرید

620
00:19:52,320 –> 00:19:54,480
کنند با توجه به اینکه آنها پول را در مهرهای زمانی مختلف خرج می کنند

621
00:19:54,480 –> 00:19:55,520

622
00:19:55,520 –> 00:19:57,440
و شما می توانید از آنهایی استفاده کنید که

623
00:19:57,440 –> 00:19:59,520
رفتار خرج می کنند تا به این ویژگی ها دست پیدا کنید،

624
00:19:59,520 –> 00:20:01,120
بنابراین یکی از آنها برای

625
00:20:01,120 –> 00:20:02,960
تازگی است که ما برخی از آن ها را برای

626
00:20:02,960 –> 00:20:04,960
دفعات تعداد دفعاتی که آنها

627
00:20:04,960 –> 00:20:05,679
خرید کرده اند

628
00:20:05,679 –> 00:20:07,760
و سپس این دو در اینجا ویژگی های پولی هستند

629
00:20:07,760 –> 00:20:09,760
که مجموع خریدهای

630
00:20:09,760 –> 00:20:11,039
آنها

631
00:20:11,039 –> 00:20:14,240
در آن بازه زمانی انجام شده است و

632
00:20:14,240 –> 00:20:15,280
میانگین

633
00:20:15,280 –> 00:20:16,960
ارزش خرید آنها چقدر است و شما می

634
00:20:16,960 –> 00:20:18,960
توانید به بسیاری از ویژگی های دیگر دست پیدا کنید در واقع به

635
00:20:18,960 –> 00:20:20,320
این می گویند مهندسی ویژگی یکی

636
00:20:20,320 –> 00:20:22,159
از هنرهاست. از علم داده علم داده

637
00:20:22,159 –> 00:20:22,799

638
00:20:22,799 –> 00:20:24,480
تبدیل شدن به یک دانشمند داده دانشمندان خوب داده

639
00:20:24,480 –> 00:20:25,840
می‌دانند چگونه

640
00:20:25,840 –> 00:20:27,679
ویژگی‌های واقعاً خوبی پیدا کنند،

641
00:20:27,679 –> 00:20:28,640
بنابراین این چیزی است که

642
00:20:28,640 –> 00:20:30,320
ما پیاده‌سازی می‌کنیم و سپس

643
00:20:30,320 –> 00:20:32,080
دو مدل پیش‌بینی

644
00:20:32,080 –> 00:20:33,840
ایجاد می‌کنیم، پس از اینکه مجموعه داده‌ها

645
00:20:33,840 –> 00:20:35,360
به روش درستی فرمول‌بندی شده است. ما می‌خواهیم

646
00:20:35,360 –> 00:20:35,840

647
00:20:35,840 –> 00:20:38,000
مدلی ارائه کنیم که پیش‌بینی می‌کند

648
00:20:38,000 –> 00:20:39,679
مشتری چقدر هزینه می‌کند، مشکل رگرسیونی

649
00:20:39,679 –> 00:20:40,400
است

650
00:20:40,400 –> 00:20:42,159
و سپس مشتری با چه احتمالی

651
00:20:42,159 –> 00:20:43,760
خرید می‌کند. n روز آینده

652
00:20:43,760 –> 00:20:47,600
که یک مشکل طبقه بندی است، خوب

653
00:20:47,600 –> 00:20:49,200
دوباره این روند کاری است که ما

654
00:20:49,200 –> 00:20:50,960
قرار است طی کنیم،

655
00:20:50,960 –> 00:20:53,280
ما از پانداها به scikit-learning به dash

656
00:20:53,280 –> 00:20:54,240
و plotley می پردازیم

657
00:20:54,240 –> 00:20:57,679
بسیار خوب، بنابراین بیایید شروع کنیم خب

658
00:20:57,679 –> 00:21:00,960
این است اولین آزمایشگاهی

659
00:21:00,960 –> 00:21:02,880
است که ما قرار است بدون

660
00:21:02,880 –> 00:21:04,320
کد در مقابل انجام دهیم،

661
00:21:04,320 –> 00:21:06,080
بنابراین من فقط می‌خواهم سریعاً از

662
00:21:06,080 –> 00:21:08,320
آن عبور کنم.

663
00:21:08,320 –> 00:21:09,520

664
00:21:09,520 –> 00:21:11,760

665
00:21:11,760 –> 00:21:12,720
آزمایشگاهی

666
00:21:12,720 –> 00:21:15,919
که من تمام محتویات آن را دارم، بنابراین

667
00:21:15,919 –> 00:21:17,360
چند پوشه مختلف دارد و

668
00:21:17,360 –> 00:21:19,120
برای اعضای lo pro من فقط در

669
00:21:19,120 –> 00:21:20,080
مورد

670
00:21:20,080 –> 00:21:23,280
راه اندازی این پروژه به سرعت صحبت خواهیم

671
00:21:23,280 –> 00:21:24,000

672
00:21:24,000 –> 00:21:27,360

673
00:21:27,360 –> 00:21:29,440

674
00:21:29,440 –> 00:21:30,880
کرد. یکی دو پوشه مختلف

675
00:21:30,880 –> 00:21:32,960
یکی تنظیمات کد من در مقابل من است،

676
00:21:32,960 –> 00:21:35,039
بنابراین اینها برخی از تنظیمات من هستند که

677
00:21:35,039 –> 00:21:37,840
برای فضای کاری

678
00:21:37,840 –> 00:21:39,520
خاصی که قرار است از

679
00:21:39,520 –> 00:21:41,120
ادغام نوت بوک

680
00:21:41,120 –> 00:21:43,600
jupyter استفاده کنیم و وقتی Shift را فشار می دهم و ما را وارد می کنم،

681
00:21:43,600 –> 00:21:44,720

682
00:21:44,720 –> 00:21:47,440
خواهیم بود. قرار است کدی را به نقاط

683
00:21:47,440 –> 00:21:48,000
ضعف

684
00:21:48,000 –> 00:21:50,159
یا اینتر ارسال کند پنجره فعال، بنابراین من

685
00:21:50,159 –> 00:21:51,600
این تنظیمات را در اینجا دارم

686
00:21:51,600 –> 00:21:54,480
و سپس مسیر پایتون را که

687
00:21:54,480 –> 00:21:54,799

688
00:21:54,799 –> 00:21:57,760
تا آزمایشگاه من 59 عمر مشتری پی تنظیم کرده‌ام،

689
00:21:57,760 –> 00:21:59,919
که فقط محیطی است که من ایجاد کرده‌ام

690
00:21:59,919 –> 00:22:01,520
و در یک ثانیه در مورد آن در اینجا بیشتر صحبت خواهم کرد.

691
00:22:01,520 –> 00:22:03,679

692
00:22:03,679 –> 00:22:06,240
مهم است

693
00:22:06,240 –> 00:22:08,159
زیرا دارای نسخه‌های خاصی از

694
00:22:08,159 –> 00:22:09,280
بسته‌ها

695
00:22:09,280 –> 00:22:10,480
و کتابخانه‌های پایتون است که ما

696
00:22:10,480 –> 00:22:12,400
امروز از آن‌ها استفاده می‌کنیم و مطمئن شویم

697
00:22:12,400 –> 00:22:15,039
که شما نسخه‌های مناسبی دارید که کار می‌کنند

698
00:22:15,039 –> 00:22:17,039

699
00:22:17,039 –> 00:22:18,559

700
00:22:18,559 –> 00:22:19,840
. من واقعاً

701
00:22:19,840 –> 00:22:21,120
اینها را ایجاد خواهم کرد، بنابراین من زمان زیادی را برای آنها صرف نمی

702
00:22:21,120 –> 00:22:22,080
کنم،

703
00:22:22,080 –> 00:22:23,840
این فقط به این فکر می کند که

704
00:22:23,840 –> 00:22:26,320
کارمان را در پایان تجزیه و تحلیل خود ذخیره می کنیم،

705
00:22:26,320 –> 00:22:29,440
مورد بعدی مجموعه داده است

706
00:22:29,440 –> 00:22:32,480
بنابراین مجموعه داده ذخیره می شود. در یک فایل متنی،

707
00:22:32,480 –> 00:22:34,240
بنابراین اگر اینجا کلیک کنم،

708
00:22:34,240 –> 00:22:36,400
فایل متنی چیزی شبیه به این است

709
00:22:36,400 –> 00:22:39,440
که در آن شماره مشتریان را

710
00:22:39,440 –> 00:22:41,919
داریم، تاریخ um آنها را داریم و سپس

711
00:22:41,919 –> 00:22:42,480

712
00:22:42,480 –> 00:22:45,039
تعداد خریدهای Uh،

713
00:22:45,039 –> 00:22:46,640
تعداد سی دی ها را داریم. آنها در یک

714
00:22:46,640 –> 00:22:47,280

715
00:22:47,280 –> 00:22:49,840
سفارش خاص برای یک خرید کردند تمبر زمان و

716
00:22:49,840 –> 00:22:50,799
ارزش سفارش آنها،

717
00:22:50,799 –> 00:22:52,320
بنابراین این همان چیزی است که مجموعه داده به نظر می رسد

718
00:22:52,320 –> 00:22:53,520
که ما با آن کار می کنیم و

719
00:22:53,520 –> 00:22:56,159
در پوشه داده ذخیره می شود،

720
00:22:56,159 –> 00:22:58,960
این سه مربوط به برنامه هستند و

721
00:22:58,960 –> 00:23:00,320
من در واقع

722
00:23:00,320 –> 00:23:02,640
می خواهم آنها را به طور خلاصه باز کنید، اما

723
00:23:02,640 –> 00:23:05,280
در پایان دستورات برنامه زمان بیشتری را روی آنها صرف خواهیم کرد،

724
00:23:05,280 –> 00:23:08,240
بنابراین اگر قبلاً

725
00:23:08,240 –> 00:23:10,400
برنامه خط تیره ایجاد

726
00:23:10,400 –> 00:23:12,240
نکرده اید، کاری که انجام می دهید این است که یک ترمینال را باز کنید

727
00:23:12,240 –> 00:23:14,720
و من یک ترمینال در حال اجرا دارم که در حال

728
00:23:14,720 –> 00:23:16,000

729
00:23:16,000 –> 00:23:18,720
حاضر به برنامه dash من اجازه می دهد

730
00:23:18,720 –> 00:23:20,000
تا سرویس داده شود

731
00:23:20,000 –> 00:23:21,679
و چه کاری انجام می دهید، بنابراین من می خواهم

732
00:23:21,679 –> 00:23:23,039
با زدن ctrl

733
00:23:23,039 –> 00:23:25,440
c بسته شود تا برنامه من بسته شود، کاری که می خواهید

734
00:23:25,440 –> 00:23:26,720
انجام دهید این است که می خواهید

735
00:23:26,720 –> 00:23:29,039
اطلاعات conda خود را بررسی کنید، بنابراین اگر ما do

736
00:23:29,039 –> 00:23:30,000
conda

737
00:23:30,000 –> 00:23:33,360
info dash پایان می‌دهد شما می‌خواهید

738
00:23:33,360 –> 00:23:35,039
مطمئن شوید که

739
00:23:35,039 –> 00:23:37,360
محیط درستی را تنظیم کرده‌اید، بنابراین این همان کاری است که

740
00:23:37,360 –> 00:23:39,919
این آزمایشگاه 59 پی در طول عمر مشتری انجام می‌دهد،

741
00:23:39,919 –> 00:23:41,919
بنابراین این همان کاری است که دستور بعدی

742
00:23:41,919 –> 00:23:43,600
هنگامی که شما conda activate را انجام می‌دهید،

743
00:23:43,600 –> 00:23:44,559
فعال می‌شود و

744
00:23:44,559 –> 00:23:47,440
در پرانتز خواهید دید در اینجا

745
00:23:47,440 –> 00:23:48,159
محیطی

746
00:23:48,159 –> 00:23:50,880
که من از آن استفاده می کنم، و سپس شما فقط

747
00:23:50,880 –> 00:23:53,679

748
00:23:53,679 –> 00:23:57,039
نقطه برنامه پایتون را انجام می دهید pi shift را وارد کنید

749
00:23:57,039 –> 00:23:59,120
و کاری که می‌خواهید انجام دهید این است که

750
00:23:59,120 –> 00:24:00,400
برنامه شما را مستقر می‌کند، بنابراین

751
00:24:00,400 –> 00:24:04,159
شما فقط به میزبان محلی 8050 خود می‌روید.

752
00:24:04,159 –> 00:24:08,159
و اگر من localhost 8050

753
00:24:08,159 –> 00:24:10,640
را انجام دهم، برنامه را خواهید داشت که خوب کشیده

754
00:24:10,640 –> 00:24:11,360
می‌شود،

755
00:24:11,360 –> 00:24:15,840
بنابراین به این ترتیب است. شما دوباره برنامه خط تیره

756
00:24:15,840 –> 00:24:17,919
را انجام می دهیم، ما این کار را به شما نشان خواهیم داد در

757
00:24:17,919 –> 00:24:18,880
اینجا

758
00:24:18,880 –> 00:24:22,080
در پایان یک برنامه plot.pi وجود دارد

759
00:24:22,080 –> 00:24:23,840
که فقط یک فایل موقت است، زیرا من

760
00:24:23,840 –> 00:24:24,880

761
00:24:24,880 –> 00:24:26,960
داشتم نمودار نموداری را برای برنامه خود ایجاد می کردم.

762
00:24:26,960 –> 00:24:28,559
جایزه حرفه ای

763
00:24:28,559 –> 00:24:30,799
فایل app.pi این چیزی است که همه اعضای حرفه ای من

764
00:24:30,799 –> 00:24:32,320
قرار است دریافت کنند، بنابراین برنامه ای که من به تازگی

765
00:24:32,320 –> 00:24:35,039
راه اندازی کردم این

766
00:24:35,039 –> 00:24:38,159
فایل محیطی

767
00:24:38,159 –> 00:24:40,080
است.yml بنابراین اگر با conda آشنایی ندارید

768
00:24:40,080 –> 00:24:41,440

769
00:24:41,440 –> 00:24:44,960
این است چگونه محیط conda خود را راه اندازی می کنید،

770
00:24:44,960 –> 00:24:47,840
بنابراین من از آزمایشگاه 59 در طول عمر مشتری استفاده می کنم

771
00:24:47,840 –> 00:24:49,360

772
00:24:49,360 –> 00:24:52,960
که برای تنظیم این،

773
00:24:52,960 –> 00:24:53,279
شما باید

774
00:24:53,279 –> 00:24:57,440
r conda m را ایجاد کنید.

775
00:24:57,440 –> 00:25:00,960

776
00:25:00,960 –> 00:25:04,159
و کاری

777
00:25:04,159 –> 00:25:05,679
که انجام می دهد این است که

778
00:25:05,679 –> 00:25:08,960
این را در یک محیط conda برای شما

779
00:25:08,960 –> 00:25:10,880
با تمام نسخه های بسته درست تنظیم می کند تا

780
00:25:10,880 –> 00:25:12,080
بخواهید به m مطمئن باشید که باید

781
00:25:12,080 –> 00:25:14,080
این را تکرارپذیر

782
00:25:14,080 –> 00:25:15,520
کنید، می‌خواهید از همان محیطی استفاده کنید

783
00:25:15,520 –> 00:25:17,200
که من از آن استفاده می‌کنم، بنابراین این چیزی است که

784
00:25:17,200 –> 00:25:19,760
ما در آنجا راه‌اندازی می‌کنیم و سپس اگر

785
00:25:19,760 –> 00:25:20,960
نیاز به تغییر در

786
00:25:20,960 –> 00:25:22,720
محیط دارید، می‌توانید در اینجا تغییراتی ایجاد کنید.

787
00:25:22,720 –> 00:25:24,240
و سپس فقط آپدیت کاندوم را اجرا کنید

788
00:25:24,240 –> 00:25:26,000
تا تنها چیزی

789
00:25:26,000 –> 00:25:27,520
که از ایجاد به آپدیت تغییر می کند،

790
00:25:27,520 –> 00:25:29,120
اگر می خواهید تغییراتی ایجاد

791
00:25:29,120 –> 00:25:31,760
کنید، فقط دستور دوم را در اینجا اجرا کنید

792
00:25:31,760 –> 00:25:34,559
و سپس آخرین فایل را اجرا کنید و این همان

793
00:25:34,559 –> 00:25:35,600
چیزی است که ما می خواهیم انجام دهیم. کار

794
00:25:35,600 –> 00:25:36,559
کردن از

795
00:25:36,559 –> 00:25:39,279
امروز آزمایشگاه 59 مشتری با مسئولیت محدود است، بنابراین

796
00:25:39,279 –> 00:25:41,520
این را به عنوان تجزیه و تحلیلی که

797
00:25:41,520 –> 00:25:42,080

798
00:25:42,080 –> 00:25:45,520
برای ایجاد این فایل

799
00:25:45,520 –> 00:25:48,080
app.pi انجام می دهیم، در نظر بگیرید.

800
00:25:48,080 –> 00:25:50,000
فایل

801
00:25:50,000 –> 00:25:52,480
اوه حدود 300 خط کد یا بیشتر است

802
00:25:52,480 –> 00:25:54,320
بنابراین احتمالاً حدود 25

803
00:25:54,320 –> 00:25:58,320
دقیقه و 30 دقیقه طول می کشد تا از

804
00:25:58,320 –> 00:26:01,360
محیطی که من استفاده می کنم استفاده کنم.

805
00:26:01,360 –> 00:26:02,960

806
00:26:02,960 –> 00:26:05,840

807
00:26:05,840 –> 00:26:07,440
که می توانید به

808
00:26:07,440 –> 00:26:08,080

809
00:26:08,080 –> 00:26:11,520
پالت فرمان تنظیمات خود بروید و سپس yo را باز کنید

810
00:26:11,520 –> 00:26:15,200
مفسر ur، بنابراین اگر

811
00:26:15,200 –> 00:26:18,240
مترجم انتخابی پایتون را انجام دهید و سپس

812
00:26:18,240 –> 00:26:21,600
مطمئن شوید که

813
00:26:21,600 –> 00:26:26,159
نقطه پی 59 عمر مشتری آزمایشگاهی خود را دریافت کرده‌اید

814
00:26:26,159 –> 00:26:27,919
و سپس اتفاقی که می‌افتد این است

815
00:26:27,919 –> 00:26:29,919
که اینجا نشان داده می‌شود

816
00:26:29,919 –> 00:26:33,039

817
00:26:33,039 –> 00:26:35,039
. تقریباً نحوه راه‌اندازی

818
00:26:35,039 –> 00:26:37,279
، چند کتابخانه را بارگیری

819
00:26:37,279 –> 00:26:38,400
می‌کنیم، کتابخانه‌هایی که بودند

820
00:26:38,400 –> 00:26:40,159
و Shift را فشار می‌دهم و enter را می‌زنم و

821
00:26:40,159 –> 00:26:41,600
این به یک

822
00:26:41,600 –> 00:26:44,960
پنجره مشتری تعاملی می‌رود و می‌توانید ببینید

823
00:26:44,960 –> 00:26:46,240
که در حال حاضر چه چیزی در حال اجرا است

824
00:26:46,240 –> 00:26:48,000
. دریافت کردم و این بسیار شبیه

825
00:26:48,000 –> 00:26:49,600
مشتری است

826
00:26:49,600 –> 00:26:51,039
و همچنین می توانید اینجا را ببینید که

827
00:26:51,039 –> 00:26:53,520
مفسر آزمایشگاه 59 طول عمر مشتری است

828
00:26:53,520 –> 00:26:54,400

829
00:26:54,400 –> 00:26:57,679
که به شما نشان می دهد که کار می کند،

830
00:26:57,679 –> 00:27:00,240
بنابراین ما فقط پانداها را وارد کردیم و

831
00:27:00,240 –> 00:27:00,880
اینها به

832
00:27:00,880 –> 00:27:03,840
نوعی شبیه به داده های اصلی شما هستند که می دانید

833
00:27:03,840 –> 00:27:04,799

834
00:27:04,799 –> 00:27:07,279
اصلی شما کتابخانه‌های علم و جدال داده‌ها

835
00:27:07,279 –> 00:27:08,640

836
00:27:08,640 –> 00:27:10,400
ما می‌خواهیم job lib را وارد کنیم، من به شما نشان

837
00:27:10,400 –> 00:27:12,000
خواهم داد که برای چه چیزی

838
00:27:12,000 –> 00:27:13,600
در اینجا استفاده می‌شود،

839
00:27:13,600 –> 00:27:15,520
کمی ابزارهای ply data cat برای کار

840
00:27:15,520 –> 00:27:17,600
با داده‌های طبقه‌بندی شده

841
00:27:17,600 –> 00:27:20,480
و سپس نمودار 9 برای انجام برخی نمودارهای ثابت و سپس نمودار 9 وجود دارد.

842
00:27:20,480 –> 00:27:21,440

843
00:27:21,440 –> 00:27:23,360

844
00:27:23,360 –> 00:27:24,960
همان‌طور که از کتابخانه‌های اصلی یادگیری ماشینی که قرار

845
00:27:24,960 –> 00:27:26,480
است از xgboost استفاده

846
00:27:26,480 –> 00:27:28,480
کنیم، طبقه‌بندی‌کننده xgb و

847
00:27:28,480 –> 00:27:29,840
regressor xgb

848
00:27:29,840 –> 00:27:31,360
را وارد می‌کنیم و سپس از scikit

849
00:27:31,360 –> 00:27:34,159
Learns grid search cv روی هر دوی اینها

850
00:27:34,159 –> 00:27:36,720
برای ایجاد یادگیری ماشینی خود استفاده می‌کنیم.

851
00:27:36,720 –> 00:27:37,520
مدل‌ها بسیار

852
00:27:37,520 –> 00:27:39,840
خوب یک چیز دیگر من می‌خواهم

853
00:27:39,840 –> 00:27:42,399
pn um را تنظیم کنم بنابراین این برای طرح نهم من است

854
00:27:42,399 –> 00:27:44,480
dpi گزینه‌های من برابر با 300 است

855
00:27:44,480 –> 00:27:46,159
و این باعث می‌شود نمودارهای ما کمی واضح‌تر به نظر برسند،

856
00:27:46,159 –> 00:27:48,640
بنابراین اکنون می‌خواهیم به

857
00:27:48,640 –> 00:27:49,520

858
00:27:49,520 –> 00:27:53,039
بخش آماده‌سازی داده‌ها،

859
00:27:53,039 –> 00:27:54,559
بنابراین اولین کاری که اینجا انجام می‌دهم این است

860
00:27:54,559 –> 00:27:56,559
که فقط در آن

861
00:27:56,559 –> 00:28:00,559
داده‌ها از داده‌هایمان فایل cdnownmaster.txt ما را می‌خوانم،

862
00:28:00,559 –> 00:28:02,640
آن فایل متنی کمی عجیب است، اگرچه

863
00:28:02,640 –> 00:28:04,559
با فاصله‌ها از هم جدا شده‌اند، اما آنها

864
00:28:04,559 –> 00:28:06,399
فضاهای ناهموار هستند. من باید از

865
00:28:06,399 –> 00:28:07,360

866
00:28:07,360 –> 00:28:10,080
جداکننده اسلش s plus استفاده کنم و کاری که انجام می دهد این است که

867
00:28:10,080 –> 00:28:10,960
به دنبال

868
00:28:10,960 –> 00:28:13,679
یک یا چند فاصله بین هر خط است، بنابراین

869
00:28:13,679 –> 00:28:15,679
اگر من فقط این فایل را

870
00:28:15,679 –> 00:28:16,320
در اینجا بررسی

871
00:28:16,320 –> 00:28:18,559
کنم، می توانم ببینم که اگر تمام راه را به بالا اسکرول کنم

872
00:28:18,559 –> 00:28:19,919

873
00:28:19,919 –> 00:28:22,320
اوه خط اول این یکی دارای

874
00:28:22,320 –> 00:28:24,159
سه نقطه سه فاصله

875
00:28:24,159 –> 00:28:26,720
این o است ne دو فاصله دارد و این یکی

876
00:28:26,720 –> 00:28:28,399
یک فاصله دارد، بنابراین یک

877
00:28:28,399 –> 00:28:30,720
دو و سه می شود تا به

878
00:28:30,720 –> 00:28:32,240
روشی درست وارد شود، ما از خواندن csv استفاده می کنیم

879
00:28:32,240 –> 00:28:33,200

880
00:28:33,200 –> 00:28:34,880
اما جداکننده به جای کاما

881
00:28:34,880 –> 00:28:37,200
یک اسلش به علاوه خواهد بود

882
00:28:37,200 –> 00:28:38,640
و سپس من فقط می‌خواهم اسم‌هایی را به آن بدهم،

883
00:28:38,640 –> 00:28:40,880
تعداد تاریخ و قیمت شناسه مشتری و

884
00:28:40,880 –> 00:28:42,159

885
00:28:42,159 –> 00:28:44,240
این نام‌های هر کدام از این‌ها

886
00:28:44,240 –> 00:28:45,520

887
00:28:45,520 –> 00:28:47,600
خواهد بود.

888
00:28:47,600 –> 00:28:49,039

889
00:28:49,039 –> 00:28:51,760
اکنون

890
00:28:51,760 –> 00:28:53,200
نگاهی گذرا به آن می اندازیم،

891
00:28:53,200 –> 00:28:56,320
بنابراین shift enter

892
00:28:57,360 –> 00:28:59,520
بله در اینجا یک ثانیه نگه دارید، باید

893
00:28:59,520 –> 00:29:01,600
Shift enter را انجام دهید تا آن را به داخل

894
00:29:01,600 –> 00:29:04,000
بکشید و سپس اگر

895
00:29:04,000 –> 00:29:05,600
Shift را انجام دهم و یک بار دیگر وارد کنم،

896
00:29:05,600 –> 00:29:07,039
اکنون باید مجموعه داده های خود را ببینیم.

897
00:29:07,039 –> 00:29:09,600
پس از آن تعداد تاریخ و قیمت شناسه مشتری مشخص شود،

898
00:29:09,600 –> 00:29:10,799

899
00:29:10,799 –> 00:29:12,080
من به سرعت

900
00:29:12,080 –> 00:29:13,840
اطلاعات را بررسی

901
00:29:13,840 –> 00:29:16,320
می کنم، می توانم برخی از مشکلات را در اینجا ببینم تاریخ

902
00:29:16,320 –> 00:29:17,440
یک n64 است،

903
00:29:17,440 –> 00:29:19,600
من می خواهم آن را به زمان تاریخ تغییر دهم،

904
00:29:19,600 –> 00:29:20,799

905
00:29:20,799 –> 00:29:22,720
بنابراین این چیزی است که

906
00:29:22,720 –> 00:29:24,080

907
00:29:24,080 –> 00:29:27,120
من می‌خواهم همین‌جا این کار را انجام دهم، ابتدا آن را به یک

908
00:29:27,120 –> 00:29:28,240
رشته تبدیل

909
00:29:28,240 –> 00:29:31,440
می‌کنم، بنابراین این کار c این را

910
00:29:31,440 –> 00:29:34,080
از یک عدد به یک رشته تبدیل کنید و

911
00:29:34,080 –> 00:29:35,919
سپس کاری که می‌خواهم انجام دهم این است که به

912
00:29:35,919 –> 00:29:38,480
زمان تاریخ تبدیل می‌کنم و سپس هر

913
00:29:38,480 –> 00:29:41,600
n مقداری را که در اینجا

914
00:29:41,600 –> 00:29:43,600
وجود دارد حذف می‌کنم تا این مقدار تقریباً به اندازه باشد. از

915
00:29:43,600 –> 00:29:45,679
عملیات جدال داده‌های من حداقل

916
00:29:45,679 –> 00:29:47,919
برای تجزیه و تحلیل اولیه،

917
00:29:47,919 –> 00:29:50,159
بنابراین اکنون می‌توانید ببینید که

918
00:29:50,159 –> 00:29:53,600
اگر این اطلاعات را دوباره اجرا کنم، زمان تاریخ است

919
00:29:53,600 –> 00:29:55,600
یا در واقع اگر آن را در اینجا اجرا کنم

920
00:29:55,600 –> 00:29:57,840
سی‌دی اکنون

921
00:29:57,840 –> 00:30:02,240
df dot info

922
00:30:02,240 –> 00:30:05,840
می‌توانیم ببینیم که اکنون است یک زمان تاریخ 64.

923
00:30:05,840 –> 00:30:09,039
بنابراین ما باید برای حرکت به

924
00:30:09,039 –> 00:30:10,559
بخش بعدی آماده باشیم، این است که

925
00:30:10,559 –> 00:30:12,320
تجزیه و تحلیل همگروهی خود را انجام می‌دهیم، بنابراین

926
00:30:12,320 –> 00:30:13,679
مشتریانی را که

927
00:30:13,679 –> 00:30:14,480

928
00:30:14,480 –> 00:30:17,600
در یک پنجره زمانی خاص به آن‌ها پیوسته‌اند بررسی می‌کنیم تا ما چه

929
00:30:17,600 –> 00:30:18,880
می‌خواهیم. کاری که باید انجام دهیم این است که می خواهیم

930
00:30:18,880 –> 00:30:21,120
بدانیم اولین خرید آنها چه زمانی بوده است، بنابراین

931
00:30:21,120 –> 00:30:22,399
این همان چیزی است که ما

932
00:30:22,399 –> 00:30:24,240
از کمی پاندا استفاده می کنیم و

933
00:30:24,240 –> 00:30:25,760
با سی دی خود شروع می کنیم و اکنون

934
00:30:25,760 –> 00:30:28,240
ارزش های خود را بر اساس شناسه مشتری مرتب می کنیم.

935
00:30:28,240 –> 00:30:30,640
و تاریخ، بنابراین آن را بر اساس شناسه مشتری و تاریخ مرتب می کند

936
00:30:30,640 –> 00:30:31,520

937
00:30:31,520 –> 00:30:32,559
و سپس بر اساس

938
00:30:32,559 –> 00:30:34,960
تغییر شناسه مشتری،

939
00:30:34,960 –> 00:30:36,960
i را وارد کنید t یک گروه بر اساس شی ایجاد می کند و سپس

940
00:30:36,960 –> 00:30:38,640
ما فقط اولین

941
00:30:38,640 –> 00:30:40,159
مورد را می گیریم و آن را ذخیره می کنیم زیرا

942
00:30:40,159 –> 00:30:42,880
سی دی ما اکنون اولین خرید tibble

943
00:30:42,880 –> 00:30:46,320
چیزی شبیه به این shift enter است

944
00:30:46,320 –> 00:30:49,360
و اکنون 23 570 ردیف

945
00:30:49,360 –> 00:30:50,720
دارد زیرا یک ردیف وجود دارد. مشاهده به

946
00:30:50,720 –> 00:30:53,840
ازای هر شناسه مشتری و

947
00:30:53,840 –> 00:30:54,960
اولین خرید آن‌ها است،

948
00:30:54,960 –> 00:30:56,640
بنابراین می‌توانیم ببینیم که تاریخ حداقل

949
00:30:56,640 –> 00:30:59,200
1997 0101

950
00:30:59,200 –> 00:31:02,960
و حداکثر تاریخ 1997 بوده است. 325. بنابراین

951
00:31:02,960 –> 00:31:04,799
این در بازه زمانی سه ماهه ما است، یعنی

952
00:31:04,799 –> 00:31:06,000

953
00:31:06,000 –> 00:31:10,399
از ژانویه تا مارس 1997،

954
00:31:10,399 –> 00:31:13,600
پس کاری که ممکن است بخواهیم انجام دهیم این است که بعداً

955
00:31:13,600 –> 00:31:16,080
فقط به همه خریدها نگاهی بیندازید،

956
00:31:16,080 –> 00:31:18,399
مثلاً به صورت جمع‌آوری شده،

957
00:31:18,399 –> 00:31:21,840
پس کاری که انجام می‌دهد این است که ما سی دی خود را می‌گیریم،

958
00:31:21,840 –> 00:31:22,559

959
00:31:22,559 –> 00:31:24,640
اکنون ایندکس را بازنشانی می‌کنم و من

960
00:31:24,640 –> 00:31:27,200
می‌خواهم شاخص را به تاریخ تنظیم کنم،

961
00:31:27,200 –> 00:31:29,519
بنابراین کاری که این کار انجام می‌دهد نوعی

962
00:31:29,519 –> 00:31:30,720
فرمت فرم است که

963
00:31:30,720 –> 00:31:33,200
با یک تاریخ در اینجا و سپس

964
00:31:33,200 –> 00:31:33,760

965
00:31:33,760 –> 00:31:35,760
ستون قیمت را بیرون می‌آورم، بنابراین می‌خواهم

966
00:31:35,760 –> 00:31:38,159
این

967
00:31:38,159 –> 00:31:40,559
تغییر را وارد کنم قیمت را دریافت کردم که می‌خواهم آن را

968
00:31:40,559 –> 00:31:42,720
به صورت ماهانه مجدداً نمونه‌برداری کنم،

969
00:31:42,720 –> 00:31:44,480
بنابراین این شبیه گروه‌بندی بر اساس

970
00:31:44,480 –> 00:31:46,399
دوشنبه است

971
00:31:46,399 –> 00:31:48,880
این شیء نمونه مجدد را ایجاد می کند و

972
00:31:48,880 –> 00:31:50,320
سپس من یک تابع تجمیع کننده را اعمال می کنم،

973
00:31:50,320 –> 00:31:51,200
بنابراین

974
00:31:51,200 –> 00:31:53,200
هر عملیات گروه بندی شما همیشه

975
00:31:53,200 –> 00:31:54,960
باید در پایان آن یک نوع تجمع انجام دهید،

976
00:31:54,960 –> 00:31:55,600

977
00:31:55,600 –> 00:31:58,000
بنابراین ما قیمت ها را جمع بندی می کنیم و

978
00:31:58,000 –> 00:32:00,000
سپس ما فقط می خواهیم آنها را ترسیم کنیم

979
00:32:00,000 –> 00:32:01,159
و این به ما تجسم سطح بالایی

980
00:32:01,159 –> 00:32:04,159
از نوع رفتار خرید

981
00:32:04,159 –> 00:32:05,120
را

982
00:32:05,120 –> 00:32:06,960
برای مشتریانی که در

983
00:32:06,960 –> 00:32:08,799
آن گروه

984
00:32:08,799 –> 00:32:10,399

985
00:32:10,399 –> 00:32:11,840

986
00:32:11,840 –> 00:32:13,600
هستند می دهد. چیزی

987
00:32:13,600 –> 00:32:15,120
شبیه چیزی است که انتظار دارم ببینم

988
00:32:15,120 –> 00:32:16,640
شما می‌دانید که خیلی بالا شروع می‌شود و

989
00:32:16,640 –> 00:32:18,320
سپس به نوعی از بین می‌رود و ما

990
00:32:18,320 –> 00:32:19,600

991
00:32:19,600 –> 00:32:22,640
این دوره را اینجا تحلیل می‌کنیم

992
00:32:22,640 –> 00:32:24,320
و سعی می‌کنیم تعیین کنیم که کدام مشتری‌ها

993
00:32:24,320 –> 00:32:26,000
قرار است باشیم. برای خرید در این محدوده از

994
00:32:26,000 –> 00:32:27,840
اینجا، اما این کار را انجام ندادم

995
00:32:27,840 –> 00:32:29,600
و برخی دیگر از تجزیه و تحلیل های مشتری

996
00:32:29,600 –> 00:32:31,679
مانند آن چیزی که می خواهم بدانم

997
00:32:31,679 –> 00:32:32,960
این است که می خواهم به چند

998
00:32:32,960 –> 00:32:34,559
مشتری فردی نگاهی بیندازم و می خواهم ببینم

999
00:32:34,559 –> 00:32:36,000
رفتار خرید آنها چگونه است.

1000
00:32:36,000 –> 00:32:36,640

1001
00:32:36,640 –> 00:32:38,720
من می توانم مهربان ببینم از آنچه که من با

1002
00:32:38,720 –> 00:32:39,919
آن سر و کار دارم، بنابراین کاری که می خواهم انجام دهم این است که

1003
00:32:39,919 –> 00:32:40,559

1004
00:32:40,559 –> 00:32:43,039
من می خواهم um خود را بگیرم، شناسه خود را می گیرم، بنابراین من فقط

1005
00:32:43,039 –> 00:32:45,360
شناسه های منحصر به

1006
00:32:45,360 –> 00:32:47,200
فرد موجود در مجموعه داده های ما را می گیرم تا بتوانید ببینید

1007
00:32:47,200 –> 00:32:49,120
این یک آرایه یک آرایه عددی در اینجا است

1008
00:32:49,120 –> 00:32:50,799
که از 1 تا

1009
00:32:50,799 –> 00:32:53,600
23 570 می رسد و این شماره های مشتری هستند که

1010
00:32:53,600 –> 00:32:54,080

1011
00:32:54,080 –> 00:32:56,399
این شناسه های مشتری منحصر به فرد هستند که

1012
00:32:56,399 –> 00:32:57,840
من می خواهم 10 مورد از آنها را

1013
00:32:57,840 –> 00:32:59,360
فقط 10 مورد اول انتخاب کنم.

1014
00:32:59,360 –> 00:33:01,039
و شما می توانید هر 10

1015
00:33:01,039 –> 00:33:02,799
عددی را که می خواهید یا هر عددی را که می خواهید انتخاب کنید، بنابراین من

1016
00:33:02,799 –> 00:33:04,399
10 مورد اول را از آنجا

1017
00:33:04,399 –> 00:33:07,279
می گیرم، آرایه ای از 1 تا 10 است. و سپس

1018
00:33:07,279 –> 00:33:08,240
کاری که می خواهم انجام دهم این است که می

1019
00:33:08,240 –> 00:33:10,559
گیرم مجموعه داده‌های cd now من که

1020
00:33:10,559 –> 00:33:12,960
تمام تاریخچه خرید من است و من

1021
00:33:12,960 –> 00:33:15,279
آن را فیلتر می‌کنم فقط برای

1022
00:33:15,279 –> 00:33:18,480
گرفتن برخی از موارد خاص، بنابراین ابتدا

1023
00:33:18,480 –> 00:33:20,240
می‌روم و می‌خواهم برش

1024
00:33:20,240 –> 00:33:21,519
سی‌دی را بگیرم که شناسه‌های مشتری

1025
00:33:21,519 –> 00:33:24,559
در حال حاضر موجود است این شناسه در اینجا انتخاب شده است، بنابراین

1026
00:33:24,559 –> 00:33:25,360
فقط آنهایی که از

1027
00:33:25,360 –> 00:33:28,720
یک تا ده هستند، بنابراین Shift را وارد کنید

1028
00:33:28,720 –> 00:33:30,320
و می توانید ببینید که اطلاعات من را

1029
00:33:30,320 –> 00:33:31,760
به میزان قابل توجهی کاهش می

1030
00:33:31,760 –> 00:33:34,000
دهد شناسه مشتری یکی در اینجا یکی یک

1031
00:33:34,000 –> 00:33:34,799
خرید داشته است.

1032
00:33:34,799 –> 00:33:37,120
شناسه مشتری دو تا به حال دو خرید داشته است

1033
00:33:37,120 –> 00:33:38,159
سه تا به

1034
00:33:38,159 –> 00:33:41,279
نظر می رسد شش خرید داشته است و به همین ترتیب،

1035
00:33:41,279 –> 00:33:42,720
سپس کاری که من می خواهم انجام دهم این است که من

1036
00:33:42,720 –> 00:33:44,559
فقط بر اساس شناسه مشتری

1037
00:33:44,559 –> 00:33:46,559
و تاریخ آنها

1038
00:33:46,559 –> 00:33:48,240
گروه بندی می کنم، بنابراین این گروه را بر اساس شی i ایجاد می کنم. ‘

1039
00:33:48,240 –> 00:33:49,360
می‌خواهم

1040
00:33:49,360 –> 00:33:52,720
مجدداً یک نوع جمع‌آوری را اعمال کنم، بنابراین اکنون من بر اساس

1041
00:33:52,720 –> 00:33:54,159
شناسه و تاریخ مشتری دارم

1042
00:33:54,159 –> 00:33:56,399
، مجموع مقدار آنها

1043
00:33:56,399 –> 00:33:57,919
و مجموع قیمت آنها را

1044
00:33:57,919 –> 00:34:01,279
در هر تاریخ دارم و سپس

1045
00:34:01,279 –> 00:34:02,640
این خواهد شد و من چه خواهد شد. می‌خواهم

1046
00:34:02,640 –> 00:34:04,640
ایندکس را بازنشانی کنم و کاری که قرار است

1047
00:34:04,640 –> 00:34:06,000
انجام دهد این است

1048
00:34:06,000 –> 00:34:08,639
که مجموعه‌ای از داده‌ها را به من بدهد که می‌توانم آن را تجسم

1049
00:34:08,639 –> 00:34:10,399
کنم و از نمودار 9 برای تجسم آن استفاده می‌کنم،

1050
00:34:10,399 –> 00:34:10,960

1051
00:34:10,960 –> 00:34:12,879
بنابراین این همان چیزی است که آن مجموعه داده شبیه

1052
00:34:12,879 –> 00:34:15,199
مشتری است. مقدار تاریخ شناسه قیمت

1053
00:34:15,199 –> 00:34:17,599
در حال حاضر به شکل مرتبی است، بنابراین

1054
00:34:17,599 –> 00:34:18,639

1055
00:34:18,639 –> 00:34:22,320
اگر با نمودار نه آشنا نیستید می توانم آن را

1056
00:34:22,320 –> 00:34:24,079
با طرح نهم ترسیم

1057
00:34:24,079 –> 00:34:26,320
کنم، اساساً این یک پورت ggplot است، بنابراین

1058
00:34:26,320 –> 00:34:27,599
اگر تا به حال از r استفاده کرده

1059
00:34:27,599 –> 00:34:30,239
باشید، واقعاً قابل تنظیم است.

1060
00:34:30,239 –> 00:34:32,320
سفارشی کردن آن

1061
00:34:32,320 –> 00:34:34,239
و ایجاد

1062
00:34:34,239 –> 00:34:36,000
توطئه هایی با ظاهر واقعاً حرفه ای بسیار آسان است، بنابراین من فقط خویشاوندم

1063
00:34:36,000 –> 00:34:37,040

1064
00:34:37,040 –> 00:34:38,560
اولین کاری که می‌کنم این است

1065
00:34:38,560 –> 00:34:40,719
که در اینجا یک بوم

1066
00:34:40,719 –> 00:34:42,879
می‌سازم، و گاهی اوقات می‌بینید که به آن

1067
00:34:42,879 –> 00:34:43,760
مانند یک طرح‌بندی گفته می‌شود،

1068
00:34:43,760 –> 00:34:45,119
بنابراین شما اساساً در حال انتخاب یک

1069
00:34:45,119 –> 00:34:46,879
محور x و یک محور y هستید.

1070
00:34:46,879 –> 00:34:48,639
و سپس یک گروه را به اینجا اضافه کنید

1071
00:34:48,639 –> 00:34:50,159
زیرا یک ستون گروه بندی وجود دارد که مشتریان شما هستند،

1072
00:34:50,159 –> 00:34:51,119

1073
00:34:51,119 –> 00:34:54,079
بنابراین محور x من تاریخ های من است محور y من

1074
00:34:54,079 –> 00:34:55,280
قیمت است

1075
00:34:55,280 –> 00:34:58,240
و گروه های من براساس شناسه مشتری هستند و

1076
00:34:58,240 –> 00:35:00,240
سپس به آن می گویید از چه مجموعه داده ای استفاده کند

1077
00:35:00,240 –> 00:35:02,079
و سپس من روی یک لایه اضافه می کنم، بنابراین لایه بعدی

1078
00:35:02,079 –> 00:35:04,000
این خط geom است،

1079
00:35:04,000 –> 00:35:06,960
بنابراین من می خواهم خط gm را اینجا اضافه کنم،

1080
00:35:06,960 –> 00:35:08,640
سپس چیزی که می خواهم اضافه کنم یک

1081
00:35:08,640 –> 00:35:12,400
نقطه geom است و کاری که انجام می دهد این است که چند نقطه اضافه می کند

1082
00:35:12,400 –> 00:35:13,119

1083
00:35:13,119 –> 00:35:15,119
تا بتوانم به طور خاص ببینم چه زمانی آن

1084
00:35:15,119 –> 00:35:16,720
مشتریانی که خریدند

1085
00:35:16,720 –> 00:35:18,480
و سپس کاری که من می‌خواهم انجام دهم، چیزی است که به

1086
00:35:18,480 –> 00:35:21,119
آن روکش رویی گفته می‌شود،

1087
00:35:21,119 –> 00:35:23,119
بنابراین کاری که انجام می‌دهد این است که هر یک

1088
00:35:23,119 –> 00:35:24,160
از مشتریان را از

1089
00:35:24,160 –> 00:35:27,280
هم جدا می‌کند، بنابراین من با شناسه مشتری می‌بندم،

1090
00:35:27,280 –> 00:35:29,520
بنابراین می‌توانید ببینید که از 1 به 10 رسیده‌ام. و

1091
00:35:29,520 –> 00:35:30,800
من واقعاً می توانم ببینم که آنها

1092
00:35:30,800 –> 00:35:32,560
اکنون الگوها را می خرند

1093
00:35:32,560 –> 00:35:34,720
و سپس من فقط می خواهم این محور x را تمیز کنم تا

1094
00:35:34,720 –> 00:35:37,119

1095
00:35:37,119 –> 00:35:38,880
اینطوری همپوشانی نداشته باشد بنابراین این کاری است که

1096
00:35:38,880 –> 00:35:41,119
من با تاریخ scalex انجام می‌دهم،

1097
00:35:41,119 –> 00:35:44,480
من هر سال یک بار استراحت

1098
00:35:44,480 –> 00:35:46,079
می‌کنم و فقط سال را با این درصد y نشان می‌دهم،

1099
00:35:46,079 –> 00:35:48,560
بنابراین این کاری است که من اینجا انجام

1100
00:35:48,560 –> 00:35:51,200
می‌دهم و این خیلی خوب است زیرا اکنون می‌توانم

1101
00:35:51,200 –> 00:35:51,680

1102
00:35:51,680 –> 00:35:53,440
برای مشتریان خاص شما را ببینم بدانید که این

1103
00:35:53,440 –> 00:35:54,880
مشتری فقط

1104
00:35:54,880 –> 00:35:56,640
یک بار درست در ابتدای پنجره ما خریداری شده

1105
00:35:56,640 –> 00:35:58,560
است این مشتری فقط

1106
00:35:58,560 –> 00:35:59,200
یک بار خرید

1107
00:35:59,200 –> 00:36:00,640
کرده است جالب است زیرا آنها

1108
00:36:00,640 –> 00:36:03,280
چندین خرید دارند که انجام داده اند

1109
00:36:03,280 –> 00:36:05,280
و این مانند همان

1110
00:36:05,280 –> 00:36:06,800
مشتری تکراری است که

1111
00:36:06,800 –> 00:36:09,599
احتمالاً احتمال بیشتری دارد.

1112
00:36:09,599 –> 00:36:11,599
خرید مجدد در 90 روز آینده

1113
00:36:11,599 –> 00:36:13,920
در حالی که مشتریان یک و دو احتمالاً

1114
00:36:13,920 –> 00:36:15,839
این کار را نمی

1115
00:36:15,839 –> 00:36:18,320
کنند و می توانید ببینید چه چیز جالب

1116
00:36:18,320 –> 00:36:18,880
اینجاست

1117
00:36:18,880 –> 00:36:20,400
مشتری 4 به نظر می رسد که آنها

1118
00:36:20,400 –> 00:36:22,079
مرده اند بنابراین شما

1119
00:36:22,079 –> 00:36:24,800
یک دوره ای دارید که هیچ خریدی در اینجا ندارید و این

1120
00:36:24,800 –> 00:36:26,079
چیزی است که شما انجام نمی دهید. نمی‌خواهم ببینم که می‌خواهی

1121
00:36:26,079 –> 00:36:27,119
تلاش کنی و جلوی

1122
00:36:27,119 –> 00:36:28,480
همین اتفاق را در اینجا با مشتری شماره

1123
00:36:28,480 –> 00:36:31,119
5 بگیری، یک

1124
00:36:31,119 –> 00:36:32,960
جور الگوی خرید بسیار مکرر را می‌بینی و بعد

1125
00:36:32,960 –> 00:36:34,400
ناگهان هوا

1126
00:36:34,400 –> 00:36:36,960
تاریک می‌شود، ممکن

1127
00:36:36,960 –> 00:36:38,800
است به یک شرکت رفته باشند. رقیب ممکن

1128
00:36:38,800 –> 00:36:41,040
است علاقه خود را از دست داده باشند، اما

1129
00:36:41,040 –> 00:36:42,800
این چیزی است که ما می‌خواهیم تلاش کنیم و از آن جلوگیری کنیم،

1130
00:36:42,800 –> 00:36:45,839
بنابراین این همان

1131
00:36:45,839 –> 00:36:47,359
رفتار خریدی است که می‌توانیم آن را

1132
00:36:47,359 –> 00:36:49,359
تحلیل کنیم و از

1133
00:36:49,359 –> 00:36:52,480
یادگیری ماشینی برای انجام این

1134
00:36:52,839 –> 00:36:54,640

1135
00:36:54,640 –> 00:36:56,400
کار استفاده می‌کنیم. این کار این است که

1136
00:36:56,400 –> 00:36:58,000
مقداری یادگیری ماشینی انجام دهیم و ما باید

1137
00:36:58,000 –> 00:36:59,040
این مشکل را

1138
00:36:59,040 –> 00:37:02,960
در قالب سوالاتی به سبک تجاری

1139
00:37:02,960 –> 00:37:05,359
بسازیم تا بتوانیم به

1140
00:37:05,359 –> 00:37:06,720
شکل دقیقی دریابیم که چگونه

1141
00:37:06,720 –> 00:37:08,480
داده ها را به روش صحیح

1142
00:37:08,480 –> 00:37:10,320
قالب بندی کنیم تا چارچوب بندی مشکل

1143
00:37:10,320 –> 00:37:12,160
مهمترین چیز است، بنابراین زمانی که شما در

1144
00:37:12,160 –> 00:37:13,520
حال یادگیری علم داده هستید،

1145
00:37:13,520 –> 00:37:15,839
این واقعا مهم است که

1146
00:37:15,839 –> 00:37:17,040

1147
00:37:17,040 –> 00:37:20,160
بتوانید مشکلات داده ها را به عنوان مشکلات تجاری تجزیه و تحلیل کنید، بنابراین

1148
00:37:20,160 –> 00:37:21,520
ما می خواهیم مشکل

1149
00:37:21,520 –> 00:37:23,760
را از نظر کسب و کار چارچوب بندی کنیم، بنابراین اولین

1150
00:37:23,760 –> 00:37:25,440
سوال که ما داریم این

1151
00:37:25,440 –> 00:37:28,400
است که مشتریان در 90 روز آینده چه چیزی خرج خواهند کرد،

1152
00:37:28,400 –> 00:37:28,960

1153
00:37:28,960 –> 00:37:31,920
بنابراین این یک مشکل رگرسیونی است،

1154
00:37:31,920 –> 00:37:32,640

1155
00:37:32,640 –> 00:37:34,560
زیرا ما می خواهیم به طور خاص بدانیم

1156
00:37:34,560 –> 00:37:36,880
که آنها

1157
00:37:36,880 –> 00:37:39,440
در 90 روز آینده چه مقدار هزینه خواهند کرد و سپس

1158
00:37:39,440 –> 00:37:40,640
سوال دوم این است

1159
00:37:40,640 –> 00:37:42,560
که چیست؟ پروبا این امکان وجود دارد که یک

1160
00:37:42,560 –> 00:37:44,079
مشتری در 90 روز آینده خرید دیگری انجام دهد،

1161
00:37:44,079 –> 00:37:46,240
این در واقع یک

1162
00:37:46,240 –> 00:37:47,839
مشکل طبقه بندی است،

1163
00:37:47,839 –> 00:37:48,960
بنابراین هر زمان که با احتمال روبرو هستید

1164
00:37:48,960 –> 00:37:51,440
، این یک

1165
00:37:51,440 –> 00:37:54,800
مشکل طبقه بندی باینری است، بنابراین برای انجام

1166
00:37:54,800 –> 00:37:55,280
این

1167
00:37:55,280 –> 00:37:56,720
کار یک عنصر زمان وجود دارد زیرا ما دوباره

1168
00:37:56,720 –> 00:37:58,800
در مورد 90 روز آینده صحبت می کنیم، بنابراین

1169
00:37:58,800 –> 00:38:00,560
باید کاری را انجام دهیم که به آن

1170
00:38:00,560 –> 00:38:01,359
تقسیم زمانی یا

1171
00:38:01,359 –> 00:38:03,599
تقسیم بر اساس زمان می گویند، بنابراین این اولین

1172
00:38:03,599 –> 00:38:04,640
کاری است که می خواهیم انجام دهیم،

1173
00:38:04,640 –> 00:38:05,040

1174
00:38:05,040 –> 00:38:07,599
در مرحله 1 در اینجا باید

1175
00:38:07,599 –> 00:38:08,640
تقسیم کنیم.

1176
00:38:08,640 –> 00:38:12,240
این داده ها به مرور زمان افزایش می یابد و

1177
00:38:12,240 –> 00:38:14,960
ما می خواهیم مجموعه ای ایجاد

1178
00:38:14,960 –> 00:38:15,760
کنیم که از آن

1179
00:38:15,760 –> 00:38:18,160
برای توسعه ویژگی های هدفمان

1180
00:38:18,160 –> 00:38:19,920
استفاده می کنیم و سپس از

1181
00:38:19,920 –> 00:38:21,839
داده های دیگر برای توسعه ویژگی های rfm خود استفاده می کنیم.

1182
00:38:21,839 –> 00:38:24,000

1183
00:38:24,000 –> 00:38:26,400
بنابراین تعداد روزهایی که قرار است

1184
00:38:26,400 –> 00:38:28,000
به آنها نگاه کنیم 90 روز است،

1185
00:38:28,000 –> 00:38:29,680
بنابراین من فقط می‌خواهم برخی

1186
00:38:29,680 –> 00:38:31,520
از آنها را ذخیره کنم و سپس کاری که می‌خواهم انجام دهم این

1187
00:38:31,520 –> 00:38:33,040
است که خوب حداکثر

1188
00:38:33,040 –> 00:38:33,599

1189
00:38:33,599 –> 00:38:36,400
تاریخ را بررسی کنم. این در مجموعه داده‌های من در اینجا است، بنابراین

1190
00:38:36,400 –> 00:38:38,079
حداکثر تاریخ ما فقط c

1191
00:38:38,079 –> 00:38:40,480
در حال حاضر تاریخ است بنابراین d ستون خوردم من

1192
00:38:40,480 –> 00:38:42,640
حداکثر را می گیرم و می توانم اگر ماوس را

1193
00:38:42,640 –> 00:38:45,040
روی آن نگه

1194
00:38:45,359 –> 00:38:47,680
دارم یا اگر آن را به کنسول بفرستم اکنون

1195
00:38:47,680 –> 00:38:49,359
می توانیم ببینیم که حداکثر تاریخ در مجموعه داده ما

1196
00:38:49,359 –> 00:38:51,200

1197
00:38:51,200 –> 00:38:54,640
1998.06 30 است. پس چه کاری می خواهیم انجام دهیم آیا

1198
00:38:54,640 –> 00:38:55,119

1199
00:38:55,119 –> 00:38:58,960
می‌خواهیم 90 روز از قبل از آخرین تاریخ در

1200
00:38:58,960 –> 00:39:01,119
نظر بگیریم، بنابراین حداکثر تاریخ را می‌گیریم و

1201
00:39:01,119 –> 00:39:02,240

1202
00:39:02,240 –> 00:39:06,000
دلتای زمانی 90 را کم می‌کنیم، بنابراین این اینجا 90

1203
00:39:06,000 –> 00:39:09,280
است و سپس روز واحد است، بنابراین این

1204
00:39:09,280 –> 00:39:09,760

1205
00:39:09,760 –> 00:39:12,160
برش من خواهد بود. Shift و

1206
00:39:12,160 –> 00:39:13,520
Enter را

1207
00:39:13,520 –> 00:39:17,920
انجام دهید تا بریدگی که دقیقاً در اینجا

1208
00:39:17,920 –> 00:39:22,079
است 1998.0401 باشد، بنابراین این 90 روز

1209
00:39:22,079 –> 00:39:24,800
از آخرین روز است که در اینجا بسیار خوب است، بنابراین این همان

1210
00:39:24,800 –> 00:39:26,800
چیزی است که ما از آن استفاده خواهیم کرد زیرا بریدگی ما

1211
00:39:26,800 –> 00:39:29,920
1 آوریل 1998 است

1212
00:39:29,920 –> 00:39:33,040
و سپس یک in ایجاد می کنیم.

1213
00:39:33,040 –> 00:39:35,599
مجموعه داده و یک مجموعه داده خروجی بنابراین این

1214
00:39:35,599 –> 00:39:37,280
موقتی است ndf

1215
00:39:37,280 –> 00:39:39,119
این همه داده‌هایی است که

1216
00:39:39,119 –> 00:39:40,960
قبل از این تاریخ هستند یا

1217
00:39:40,960 –> 00:39:43,839
کمتر یا مساوی با این تاریخ هستند و سپس

1218
00:39:43,839 –> 00:39:45,119
این پورتال موقت خروجی

1219
00:39:45,119 –> 00:39:47,040
تمام داده‌هایی است که

1220
00:39:47,040 –> 00:39:49,119
بزرگ‌تر از آن است. تاریخ، بنابراین اگر به این زمان نگاه کنم،

1221
00:39:49,119 –> 00:39:50,640

1222
00:39:50,640 –> 00:39:52,160
هیچ یک از مهرهای زمانی، هیچ یک از

1223
00:39:52,160 –> 00:39:54,240
تاریخچه خرید نباید در

1224
00:39:54,240 –> 00:39:57,280
آن باشد. زودتر از این تاریخ در اینجا

1225
00:39:57,280 –> 00:39:59,040
و ما می‌توانیم ببینیم که همه اینها در اواخر

1226
00:39:59,040 –> 00:40:00,839
سال 1998 یا بعد از آن

1227
00:40:00,839 –> 00:40:04,240
0401 یا بالاتر هستند،

1228
00:40:04,240 –> 00:40:06,079
بنابراین اکنون که ما ورود و خروج خود را داریم،

1229
00:40:06,079 –> 00:40:07,520
می‌توانیم شروع به ایجاد ویژگی‌های خود

1230
00:40:07,520 –> 00:40:09,680
از این دو مجموعه داده متفاوت

1231
00:40:09,680 –> 00:40:12,240
کنیم، مهندسی ویژگی عبارت است از

1232
00:40:12,240 –> 00:40:13,440
چالش برانگیزترین بخش

1233
00:40:13,440 –> 00:40:16,079
، نوعی فرآیند گام به گام است، بنابراین

1234
00:40:16,079 –> 00:40:17,119
ما باید ابتدا

1235
00:40:17,119 –> 00:40:19,200
نگاهی به داده های بیرون بیاندازیم و اهدافی را ایجاد کنیم

1236
00:40:19,200 –> 00:40:20,720

1237
00:40:20,720 –> 00:40:21,760
و اینها چیزهایی هستند که ما به آنها

1238
00:40:21,760 –> 00:40:23,440
علاقه مندیم و به سؤالات تجاری ما پاسخ

1239
00:40:23,440 –> 00:40:24,240
می دهند

1240
00:40:24,240 –> 00:40:25,920
و سپس به

1241
00:40:25,920 –> 00:40:28,720
داده‌های پایانی

1242
00:40:28,720 –> 00:40:32,880
دیوانه‌وار نگاه می‌کنیم که ویژگی‌های rfm ما خواهند بود، بنابراین برای ایجاد

1243
00:40:32,880 –> 00:40:35,520
اهدافی که می‌خواهیم شیفت

1244
00:40:35,520 –> 00:40:36,400
موقت خود

1245
00:40:36,400 –> 00:40:38,720
را در اینجا وارد کنیم و کاری که می‌خواهیم

1246
00:40:38,720 –> 00:40:39,680
انجام دهیم این است

1247
00:40:39,680 –> 00:40:41,760
که من با رها کردن ستون مقدار، ما به

1248
00:40:41,760 –> 00:40:43,599
آن نیاز نداریم

1249
00:40:43,599 –> 00:40:45,599
و سپس می‌روم بر اساس شناسه مشتری گروه‌بندی

1250
00:40:45,599 –> 00:40:47,359
می‌کنم،

1251
00:40:47,359 –> 00:40:51,599
خریدهای آنها را

1252
00:40:51,599 –> 00:40:52,640

1253
00:40:52,640 –> 00:40:55,599
جمع‌بندی می‌کنم و سپس می‌روم و نام این چرخش را کل 90 می‌کنم.

1254
00:40:55,599 –> 00:40:56,880
این ویژگی هدف

1255
00:40:56,880 –> 00:40:59,040
کل خرج کردن 90 است و سپس من نیز

1256
00:40:59,040 –> 00:41:00,000

1257
00:41:00,000 –> 00:41:03,040
پرچمی از o را اختصاص خواهم داد به همه اینها خیر، بنابراین

1258
00:41:03,040 –> 00:41:04,960
اینها همه مشتریانی هستند که خرید کرده اند

1259
00:41:04,960 –> 00:41:07,359
و اگر متوجه شدید در

1260
00:41:07,359 –> 00:41:10,880
اینجا 3 9 25 می شود، بنابراین این 90

1261
00:41:10,880 –> 00:41:11,520
روز آینده است،

1262
00:41:11,520 –> 00:41:13,760
بنابراین همه مشتریان در واقع

1263
00:41:13,760 –> 00:41:15,119
فقط 3300

1264
00:41:15,119 –> 00:41:18,640
مشتری از کل 25 مشتری ما حضور ندارند. 000 یا

1265
00:41:18,640 –> 00:41:20,560
بیشتر مشتری حضور دارند،

1266
00:41:20,560 –> 00:41:22,319
بنابراین ما می‌خواهیم این را به‌عنوان اهداف df ذخیره کنیم

1267
00:41:22,319 –> 00:41:23,680

1268
00:41:23,680 –> 00:41:25,920
و این اهدافی هستند که

1269
00:41:25,920 –> 00:41:27,280
در پایان

1270
00:41:27,280 –> 00:41:30,480
به ویژگی‌های rfm

1271
00:41:30,480 –> 00:41:32,079

1272
00:41:32,079 –> 00:41:33,839
خود اضافه می‌کنیم. این از داده های موجود است، بنابراین

1273
00:41:33,839 –> 00:41:35,520
بسیار مهم است که ما داده هایی را دریافت کردیم

1274
00:41:35,520 –> 00:41:37,440
که با آنها کار می کردیم تا اهداف خود را ایجاد کنیم،

1275
00:41:37,440 –> 00:41:39,920
اکنون داده های خود را داریم که قرار است

1276
00:41:39,920 –> 00:41:41,359
با آن کار کنیم تا بتوانیم

1277
00:41:41,359 –> 00:41:42,640

1278
00:41:42,640 –> 00:41:45,599
ویژگی ها را ارزیابی کنیم. ویژگی‌هایی

1279
00:41:45,599 –> 00:41:46,880
که می‌خواهیم رفتار

1280
00:41:46,880 –> 00:41:49,359
خرید آنها را به ۹۰ روز آینده مرتبط کنیم،

1281
00:41:49,359 –> 00:41:50,240

1282
00:41:50,240 –> 00:41:51,839
بنابراین اولین کاری که

1283
00:41:51,839 –> 00:41:53,599
می‌خواهیم انجام دهیم این است که به تازگی به آن‌ها می‌رسیم

1284
00:41:53,599 –> 00:41:55,520
که سپس اینها ویژگی‌های مبتنی بر زمان یا تاریخ

1285
00:41:55,520 –> 00:41:57,359
هستند، بنابراین

1286
00:41:57,359 –> 00:42:00,800
اساساً همان چیزی است که می‌خواهیم انجام دهیم. می دانیم که

1287
00:42:00,800 –> 00:42:03,520
آخرین خرید آنها چقدر اخیر بوده است، بنابراین

1288
00:42:03,520 –> 00:42:04,000
ما می خواهیم ng

1289
00:42:04,000 –> 00:42:05,839
برای ایجاد um ما فقط یک

1290
00:42:05,839 –> 00:42:07,359
مقدار ثابت به نام حداکثر

1291
00:42:07,359 –> 00:42:09,920
تاریخ ایجاد می کنیم که آخرین تاریخی است که

1292
00:42:09,920 –> 00:42:10,640
در

1293
00:42:10,640 –> 00:42:14,839
داده های ما در مجموعه داده های نمونه ما وجود دارد و این

1294
00:42:14,839 –> 00:42:16,160
1998.0401 است

1295
00:42:16,160 –> 00:42:17,520
و کاری که می خواهیم انجام دهیم این است که می

1296
00:42:17,520 –> 00:42:19,200
خواهیم

1297
00:42:19,200 –> 00:42:22,640
محاسبه توسط مشتری چه

1298
00:42:22,640 –> 00:42:24,160
زمانی آخرین خرید آنها

1299
00:42:24,160 –> 00:42:25,680
در مقایسه با

1300
00:42:25,680 –> 00:42:27,200
آخرین تاریخ انجام شده است، بنابراین ما یک

1301
00:42:27,200 –> 00:42:29,440
مقدار منفی از تاریخ ها

1302
00:42:29,440 –> 00:42:32,079
را دریافت می کنیم، بنابراین چگونه این کار را انجام دهیم، ndf زمانی خود را می

1303
00:42:32,079 –> 00:42:34,000
گیریم، شناسه مشتری را می

1304
00:42:34,000 –> 00:42:36,720
گیریم و تاریخ گروه بندی را می گیریم. توسط مشتری

1305
00:42:36,720 –> 00:42:39,839
و سپس ما یک تابع را اعمال می کنیم

1306
00:42:39,839 –> 00:42:42,400
و کاری که قرار است انجام دهد برای هر یک

1307
00:42:42,400 –> 00:42:42,960
از این

1308
00:42:42,960 –> 00:42:44,560
گروه ها در اینجا است، بنابراین ما یک گروه با

1309
00:42:44,560 –> 00:42:47,119
گروه بندی شی بر اساس شناسه مشتری

1310
00:42:47,119 –> 00:42:48,240
داریم. کاری که می خواهیم انجام دهیم این است که ما

1311
00:42:48,240 –> 00:42:50,400
تاریخ را در هر یک از این

1312
00:42:50,400 –> 00:42:51,119

1313
00:42:51,119 –> 00:42:53,359
گروه‌ها حداکثر تاریخ

1314
00:42:53,359 –> 00:42:54,160

1315
00:42:54,160 –> 00:42:58,880
می‌گیریم، بنابراین برای مشتری دوم حداکثر تاریخ 1997 خواهد بود. 12.

1316
00:42:58,880 –> 00:43:00,800
ام، این مشتری سوم، می‌توانید ببینید

1317
00:43:00,800 –> 00:43:02,160

1318
00:43:02,160 –> 00:43:05,119
که تاریخی را انتخاب می‌کند که یا برابر با 1997

1319
00:43:05,119 –> 00:43:07,760
30 است یا اگر آنها خریدهای بیشتری

1320
00:43:07,760 –> 00:43:09,839
داشته باشید ممکن است دیرتر از آن باشد و سپس

1321
00:43:09,839 –> 00:43:12,079
ما می خواهیم محاسبه کنیم تفاوت

1322
00:43:12,079 –> 00:43:15,520

1323
00:43:15,520 –> 00:43:18,640
بین آخرین خرید و حداکثر

1324
00:43:18,640 –> 00:43:19,760
تاریخ،

1325
00:43:19,760 –> 00:43:22,720
بنابراین وقتی این را اجرا می کنیم و در واقع

1326
00:43:22,720 –> 00:43:25,040
این یک ثانیه طول می کشد تا اجرا شود

1327
00:43:25,040 –> 00:43:26,960
زیرا این یک محاسبه عاقلانه است که ما

1328
00:43:26,960 –> 00:43:29,280
گروه های زیادی در مجموعه داده های خود داریم،

1329
00:43:29,280 –> 00:43:31,520
اما کاری که ما انجام خواهیم داد این است می توانید ببینید که ما

1330
00:43:31,520 –> 00:43:32,720

1331
00:43:32,720 –> 00:43:36,240
برای هر شناسه مشتری چند روز

1332
00:43:36,240 –> 00:43:39,040
به این صورت منفی 455 دریافت می کنیم، به این معنی که این

1333
00:43:39,040 –> 00:43:40,880
اولین مشتری

1334
00:43:40,880 –> 00:43:43,040
و آخرین خرید آنها آخرین خرید آنها

1335
00:43:43,040 –> 00:43:45,440
455 روز

1336
00:43:45,440 –> 00:43:48,960
از حداکثر

1337
00:43:48,960 –> 00:43:52,480
تاریخ در مجموعه داده ها بوده است. um

1338
00:43:52,480 –> 00:43:54,480
پس این اساساً کاری است که این کار انجام

1339
00:43:54,480 –> 00:43:56,400
می دهد و ویژگی های جدید ما را ایجاد می کند.

1340
00:43:56,400 –> 00:44:00,560

1341
00:44:00,560 –> 00:44:02,400

1342
00:44:02,400 –> 00:44:04,160

1343
00:44:04,160 –> 00:44:04,960

1344
00:44:04,960 –> 00:44:06,640

1345
00:44:06,640 –> 00:44:08,400
نام به تازگی

1346
00:44:08,400 –> 00:44:10,400
و سپس ویژگی‌های اخیر نهایی ما

1347
00:44:10,400 –> 00:44:11,839
چیزی شبیه به این به نظر می‌رسد که در آن یک

1348
00:44:11,839 –> 00:44:13,440
نام

1349
00:44:13,440 –> 00:44:15,520
تازگی دارد و اساساً آن را

1350
00:44:15,520 –> 00:44:17,440
به یک قاب داده تبدیل می‌کند

1351
00:44:17,440 –> 00:44:19,359
و ایندکس شناسه مشتری است که

1352
00:44:19,359 –> 00:44:21,040
شاخص مهم است زیرا ما

1353
00:44:21,040 –> 00:44:22,000

1354
00:44:22,000 –> 00:44:23,520
همه چیز را با هم ترکیب می‌کنیم. همه چیز

1355
00:44:23,520 –> 00:44:26,400
را با این شناسه مشتری

1356
00:44:26,400 –> 00:44:27,839
با هم ادغام کنید و سپس ویژگی‌های فرکانس را ایجاد می‌کنیم،

1357
00:44:27,839 –> 00:44:30,079
بنابراین

1358
00:44:30,079 –> 00:44:32,240
دوباره با داده‌های in کار می‌کنیم و

1359
00:44:32,240 –> 00:44:33,440
اکنون آنچه ما به آن نگاه می‌کنیم این

1360
00:44:33,440 –> 00:44:36,480
است که مشتریان ما چقدر مرتب

1361
00:44:36,480 –> 00:44:38,079
خرید می‌کنند تا این اولین مشتری فقط

1362
00:44:38,079 –> 00:44:39,359
یک مورد داشته باشد.

1363
00:44:39,359 –> 00:44:40,800
خرید مشتری دوم دو

1364
00:44:40,800 –> 00:44:43,119
خرید خواهد داشت مشتری سوم

1365
00:44:43,119 –> 00:44:45,280
بیشتر از آن خواهد داشت و غیره بنابراین ما

1366
00:44:45,280 –> 00:44:47,119
می خواهیم آن را به چیزی که به

1367
00:44:47,119 –> 00:44:48,880
آن ویژگی فرکانس می گویند تبدیل کنیم و فقط آنها را جمع آوری می کند

1368
00:44:48,880 –> 00:44:49,440

1369
00:44:49,440 –> 00:44:52,640
تا چگونه این کار را انجام دهیم.

1370
00:44:52,640 –> 00:44:54,319
فقط برای گرفتن شناسه مشتری و

1371
00:44:54,319 –> 00:44:58,000
تاریخ که به این صورت است و سپس i

1372
00:44:58,000 –> 00:44:59,359
group by مشتری id

1373
00:44:59,359 –> 00:45:02,319
shift enter ایجاد می کند یک گروه بر اساس شی ایجاد می کند

1374
00:45:02,319 –> 00:45:02,960

1375
00:45:02,960 –> 00:45:06,160
من می خواهم شمارش را اعمال کنم و کاری

1376
00:45:06,160 –> 00:45:07,839
که قرار است انجام دهد این است که تعداد تاریخ

1377
00:45:07,839 –> 00:45:08,720

1378
00:45:08,720 –> 00:45:10,400
هایی را که هستند بشمارم. توسط مشتری و می توانید ببینید

1379
00:45:10,400 –> 00:45:12,160
که 2003 570

1380
00:45:12,160 –> 00:45:15,280
در یک است و می توانید ببینید که این

1381
00:45:15,280 –> 00:45:16,079
مشتری پنجم

1382
00:45:16,079 –> 00:45:18,079
11 خرید داشته است که مشتری سوم

1383
00:45:18,079 –> 00:45:19,440
پنج مشتری دوم دارد، دو

1384
00:45:19,440 –> 00:45:21,680
اول یک است و سپس

1385
00:45:21,680 –> 00:45:22,480
محور را تنظیم می کنیم،

1386
00:45:22,480 –> 00:45:24,240
بنابراین ستون تاریخ i’ من می روم t o

1387
00:45:24,240 –> 00:45:26,319
اساساً فقط آن را روی فرکانس تنظیم کنید،

1388
00:45:26,319 –> 00:45:28,880
بنابراین Shift Enter کنید و اکنون ویژگی‌های فرکانس خود را دارم

1389
00:45:28,880 –> 00:45:31,119

1390
00:45:31,119 –> 00:45:32,480
، کار بعدی که

1391
00:45:32,480 –> 00:45:34,319
می‌خواهیم انجام دهیم این است که ویژگی‌های پولی را

1392
00:45:34,319 –> 00:45:35,599
انجام می‌دهیم، بنابراین دوباره با داده‌های نمونه کار می‌کنیم.

1393
00:45:35,599 –> 00:45:37,680

1394
00:45:37,680 –> 00:45:40,319
این بار تنظیم کنید کاری که می‌خواهیم انجام دهیم این است که روی

1395
00:45:40,319 –> 00:45:41,520
ستون قیمت تمرکز

1396
00:45:41,520 –> 00:45:44,160
کنیم، بنابراین می‌خواهیم یک تجمیع را

1397
00:45:44,160 –> 00:45:46,960

1398
00:45:46,960 –> 00:45:48,800

1399
00:45:48,800 –> 00:45:50,079

1400
00:45:50,079 –> 00:45:53,599
اعمال کنیم. ستون قیمت

1401
00:45:53,599 –> 00:45:56,880
با استفاده از توابع مجموع و میانگین، بنابراین وقتی

1402
00:45:56,880 –> 00:45:57,359

1403
00:45:57,359 –> 00:46:00,560
این کار را انجام می‌دهم، اگر shift را وارد کنم،

1404
00:46:00,560 –> 00:46:04,079
یک شاخص چندگانه ایجاد می‌کند تا

1405
00:46:04,079 –> 00:46:06,880
میانگین قیمت مجموع قیمت را دریافت کنید و سپس کاری که من انجام می‌دهم این است که من دوست ندارم

1406
00:46:06,880 –> 00:46:08,200
با این

1407
00:46:08,200 –> 00:46:10,160
چند شاخص کار کنم. بنابراین می‌خواهم ایجاد کنم

1408
00:46:10,160 –> 00:46:11,760
، محور را روی مجموع قیمت و

1409
00:46:11,760 –> 00:46:12,960
میانگین قیمت تنظیم

1410
00:46:12,960 –> 00:46:14,640
می‌کنم و این چیزی است که این کار فقط به نوعی

1411
00:46:14,640 –> 00:46:16,319
آن را تمیز می‌کند، بنابراین لازم نیست

1412
00:46:16,319 –> 00:46:18,240
نگران کار کردن با قیمت چند شاخصه باشم.

1413
00:46:18,240 –> 00:46:20,400
و اکنون

1414
00:46:20,400 –> 00:46:22,480
من ویژگی های مهندسی شده خود را دارم،

1415
00:46:22,480 –> 00:46:24,880
می توانیم از این تابع به نام pd

1416
00:46:24,880 –> 00:46:26,079
concat استفاده کنیم و سپس

1417
00:46:26,079 –> 00:46:28,720
تمام t را جمع کنیم. او دارای ویژگی‌های rfm است، بنابراین

1418
00:46:28,720 –> 00:46:30,480
من ویژگی‌های جدید خود را دارم،

1419
00:46:30,480 –> 00:46:32,240
ویژگی‌های فرکانس و ویژگی‌های قیمت

1420
00:46:32,240 –> 00:46:33,680
من را با

1421
00:46:33,680 –> 00:46:34,880
دسترسی به یک

1422
00:46:34,880 –> 00:46:38,480
ضربه شیفت جمع‌آوری می‌کنم و آن را وارد می‌کنم، فقط اساساً

1423
00:46:38,480 –> 00:46:40,880
این قاب داده را در اینجا ایجاد می‌کند که

1424
00:46:40,880 –> 00:46:42,000
همه ویژگی‌های مهندسی شده من را

1425
00:46:42,000 –> 00:46:43,760
در آن دارد، سپس من قصد دارم انجام دهم این است که می

1426
00:46:43,760 –> 00:46:45,359
خواهم در

1427
00:46:45,359 –> 00:46:47,280
چارچوب داده های اهداف ترکیب کنم و این یک جور مشکل است

1428
00:46:47,280 –> 00:46:48,720
زیرا

1429
00:46:48,720 –> 00:46:50,800
در ابتدا وقتی این کار را انجام دادم درست

1430
00:46:50,800 –> 00:46:51,760

1431
00:46:51,760 –> 00:46:55,119
انجامش ندادم.

1432
00:46:55,119 –> 00:46:58,240
یک پیوست سمت چپ، بنابراین

1433
00:46:58,240 –> 00:47:00,240
به طور پیش‌فرض فکر می‌کنم فقط یک اتصال داخلی انجام می‌دهد

1434
00:47:00,240 –> 00:47:01,920
و درست نشد

1435
00:47:01,920 –> 00:47:04,880
، من در واقع

1436
00:47:04,880 –> 00:47:06,800
فقط 3000

1437
00:47:06,800 –> 00:47:09,760
ردیف داشتم زیرا سعی می‌کرد آنها را

1438
00:47:09,760 –> 00:47:10,079
در جایی که

1439
00:47:10,079 –> 00:47:14,160
هم داده‌های ورودی

1440
00:47:14,160 –> 00:47:17,280
و هم داده‌های ادغام

1441
00:47:17,280 –> 00:47:20,160
شناسه مشتری یکسانی دارند و

1442
00:47:20,160 –> 00:47:21,520
خیلی خوب کار نمی‌کنند،

1443
00:47:21,520 –> 00:47:23,280
بنابراین فقط مطمئن شوید که hal چپ و

1444
00:47:23,280 –> 00:47:24,640
سپس نمایه سمت چپ درست

1445
00:47:24,640 –> 00:47:26,960
درست است درست است و این همان چیزی است که

1446
00:47:26,960 –> 00:47:27,680
برای من انجام شد،

1447
00:47:27,680 –> 00:47:30,720
بنابراین اگر شیفت کنم و um و وارد کنم

1448
00:47:30,720 –> 00:47:33,839
من به شما نشان خواهم داد که اگر انجام دهم، فقط آن

1449
00:47:33,839 –> 00:47:35,280
را نظر می دهم

1450
00:47:35,280 –> 00:47:39,599
و اوه و این کار را انجام می دهم et 3300 ردیف

1451
00:47:39,599 –> 00:47:42,079
و اگر به آن نگاه کنم پرچم 90 هزینه من همه یک است

1452
00:47:42,079 –> 00:47:43,200

1453
00:47:43,200 –> 00:47:44,640
و می دانم که نباید درست باشد

1454
00:47:44,640 –> 00:47:45,839
زیرا مشتریان زیادی

1455
00:47:45,839 –> 00:47:47,119
هستند که خرید نمی کنند،

1456
00:47:47,119 –> 00:47:50,000
بنابراین ترفند این بود که این مقدار

1457
00:47:50,000 –> 00:47:51,040
باقی بماند

1458
00:47:51,040 –> 00:47:53,440
و سپس و سپس در اینجا نیز خواهید

1459
00:47:53,440 –> 00:47:55,119
دید که مقدار زیادی n وجود دارد که

1460
00:47:55,119 –> 00:47:56,000
به

1461
00:47:56,000 –> 00:47:58,400
دلیل اینکه این مشتریان

1462
00:47:58,400 –> 00:47:59,359
خریدی انجام

1463
00:47:59,359 –> 00:48:02,960
نداده اند، ما می خواهیم که صفر باشد، بنابراین ما

1464
00:48:02,960 –> 00:48:04,880
فقط از fill on a0 استفاده می

1465
00:48:04,880 –> 00:48:07,200
کنیم و ما. این را به‌عنوان قاب داده ویژگی‌های ما ذخیره می‌کنیم،

1466
00:48:07,200 –> 00:48:07,920

1467
00:48:07,920 –> 00:48:11,040
بنابراین اگر شیفت را انجام دهم، قاب داده ویژگی‌های ما را وارد کنید،

1468
00:48:11,040 –> 00:48:12,800
چیزی شبیه به این است

1469
00:48:12,800 –> 00:48:16,640
که در آن اکنون شناسه مشتری

1470
00:48:16,640 –> 00:48:17,520

1471
00:48:17,520 –> 00:48:19,520
نمایه ما است و فرکانس جدید و ویژگی‌های پولی خود را داریم

1472
00:48:19,520 –> 00:48:21,040
و

1473
00:48:21,040 –> 00:48:22,079
می‌خواهیم

1474
00:48:22,079 –> 00:48:23,680
بتوانید این را به هزینه خالص در

1475
00:48:23,680 –> 00:48:24,240

1476
00:48:24,240 –> 00:48:26,559
کل 90 روز آینده و این و اینکه آیا

1477
00:48:26,559 –> 00:48:28,880
آنها پولی خرج کرده اند یا نه، یک یا

1478
00:48:28,880 –> 00:48:29,520
صفر ربط دهید،

1479
00:48:29,520 –> 00:48:31,520
بنابراین اگر آنها پول خرج کرده اند، اگر آنها پولی خرج کرده اند

1480
00:48:31,520 –> 00:48:33,440
، یک اینجا خواهید داشت. شما در اینجا یک صفر خواهید داشت

1481
00:48:33,440 –> 00:48:34,880

1482
00:48:34,880 –> 00:48:36,400
و اگر آنها پول خرج کرده باشند شما

1483
00:48:36,400 –> 00:48:38,319
چقدر در این ستون خواهید داشت و ما ب او می

1484
00:48:38,319 –> 00:48:39,359
تواند

1485
00:48:39,359 –> 00:48:41,839
رفتارهای خرید قبلی خود را تجزیه و تحلیل کند

1486
00:48:41,839 –> 00:48:42,640
تا

1487
00:48:42,640 –> 00:48:44,640
رفتارهای خرید آینده آنها را درک

1488
00:48:44,640 –> 00:48:46,000
کند،

1489
00:48:46,000 –> 00:48:47,520
بنابراین این ایده در اینجا است، هنگامی

1490
00:48:47,520 –> 00:48:50,000
که این ایده را آماده کردید و

1491
00:48:50,000 –> 00:48:52,880
اکنون به یادگیری ماشینی بروید، بنابراین ما

1492
00:48:52,880 –> 00:48:53,599
از

1493
00:48:53,599 –> 00:48:57,359
طبقه بندی کننده xgboose xgb و رگرسیورهای خود استفاده

1494
00:48:57,359 –> 00:48:59,359
خواهیم کرد. همچنین قرار است از گرید

1495
00:48:59,359 –> 00:49:01,119
جست‌وجوی cv استفاده کنیم، ما از امتیاز اعتبارسنجی متقاطع استفاده نمی‌کنیم،

1496
00:49:01,119 –> 00:49:02,000

1497
00:49:02,000 –> 00:49:05,280
بنابراین از شر آن خلاص می‌شوم که می‌توانید

1498
00:49:05,280 –> 00:49:06,800
اینها را اجرا کنید، اما در واقع قبلاً

1499
00:49:06,800 –> 00:49:07,599
آنها

1500
00:49:07,599 –> 00:49:09,680
را در ابتدا اجرا کردم، اما اجرای

1501
00:49:09,680 –> 00:49:11,359
مجدد آن ضرری ندارد.

1502
00:49:11,359 –> 00:49:14,800
برای آنها یک x و یک y می

1503
00:49:14,800 –> 00:49:16,400
سازیم اما چون دو مدل می سازیم y

1504
00:49:16,400 –> 00:49:17,680
ما متفاوت خواهد بود اما x ما

1505
00:49:17,680 –> 00:49:19,040
برای هر دوی اینها یکسان است

1506
00:49:19,040 –> 00:49:20,960
بنابراین x ما جدید بودن ویژگی های ما خواهد بود.

1507
00:49:20,960 –> 00:49:22,559
فرکانس

1508
00:49:22,559 –> 00:49:25,920
و ویژگی های پولی um و اینها

1509
00:49:25,920 –> 00:49:27,280
رگرسیون های ما هستند

1510
00:49:27,280 –> 00:49:30,880
و سپس y ما، بنابراین متغیر هدف

1511
00:49:30,880 –> 00:49:33,839
ما ویژگی هایی خواهد بود که df

1512
00:49:33,839 –> 00:49:34,400

1513
00:49:34,400 –> 00:49:36,720
shift کل را وارد کنید و این فقط

1514
00:49:36,720 –> 00:49:37,760
یک سری پانداها خواهد بود

1515
00:49:37,760 –> 00:49:40,480
و من می خواهم y را برای ما صرف کنید.

1516
00:49:40,480 –> 00:49:42,480
سوال اول که 90 da بعدی است y

1517
00:49:42,480 –> 00:49:43,680

1518
00:49:43,680 –> 00:49:46,240
مشکل رگرسیون را پیش بینی خرج می کند و چیزی که ما

1519
00:49:46,240 –> 00:49:47,520
سعی داریم بفهمیم این است

1520
00:49:47,520 –> 00:49:48,559
که آنها در

1521
00:49:48,559 –> 00:49:50,640
90 روز آینده چقدر هزینه خواهند کرد و ما می خواهیم

1522
00:49:50,640 –> 00:49:53,200
الگوریتم ما 16 را برای این شخص پیش بینی کند

1523
00:49:53,200 –> 00:49:54,800
و ما می خواهیم صفر را برای این

1524
00:49:54,800 –> 00:49:57,119
افراد

1525
00:49:57,119 –> 00:49:59,839
پیش بینی کنیم. ‘قرار است یک رگرسیون xgb ایجاد کنیم،

1526
00:49:59,839 –> 00:50:02,480
بنابراین این مشخصات رگرسیون xgb ما است، ما از تابع

1527
00:50:02,480 –> 00:50:04,160
رگرسیون xgb استفاده می‌کنیم.

1528
00:50:04,160 –> 00:50:06,000

1529
00:50:06,000 –> 00:50:07,760

1530
00:50:07,760 –> 00:50:09,040

1531
00:50:09,040 –> 00:50:12,240
قابل تکرار است

1532
00:50:12,240 –> 00:50:13,680
و سپس از این

1533
00:50:13,680 –> 00:50:15,680
تابع مفید از scikit-learn به نام grid

1534
00:50:15,680 –> 00:50:17,119
search cv استفاده

1535
00:50:17,119 –> 00:50:19,440
می کنیم. یک تخمینگر

1536
00:50:19,440 –> 00:50:21,280
ارائه می کنیم و یک شبکه پارامتر برای آن ارائه می دهیم

1537
00:50:21,280 –> 00:50:22,720
و این

1538
00:50:22,720 –> 00:50:24,319
فضای جستجویی است که آن را بررسی می

1539
00:50:24,319 –> 00:50:26,160
کند. بنابراین یکی از پارامترهای کلیدی

1540
00:50:26,160 –> 00:50:29,440
برای xgboost نرخ یادگیری است،

1541
00:50:29,440 –> 00:50:31,160
بنابراین ما آن را از

1542
00:50:31,160 –> 00:50:35,119
0.01 به 0.1.3.5 تغییر می دهیم،

1543
00:50:35,119 –> 00:50:37,520
بنابراین این یک دو سه

1544
00:50:37,520 –> 00:50:38,319
چهار

1545
00:50:38,319 –> 00:50:41,839
نوع مختلف از مدل تقویت xg را

1546
00:50:41,839 –> 00:50:45,440
در طول تست و سپس امتیازدهی ایجاد می کند.

1547
00:50:45,440 –> 00:50:46,720
ما قصد داریم به آن را th روش نمره دهی

1548
00:50:46,720 –> 00:50:48,640

1549
00:50:48,640 –> 00:50:50,640
خطای میانگین مطلق منفی و کاری که قرار است

1550
00:50:50,640 –> 00:50:51,839
انجام دهد این است که

1551
00:50:51,839 –> 00:50:54,880
میانگین خطای مطلق یا mae

1552
00:50:54,880 –> 00:50:58,079
را محاسبه می کند و آن را به عنوان یک مقدار منفی ارائه می دهد، به

1553
00:50:58,079 –> 00:51:01,280
این معنی که ما به طور متوسط

1554
00:51:01,280 –> 00:51:05,280
ر مقداری که این به ما ارائه می دهد کاهش می ده

1555
00:51:05,280 –> 00:51:07,440
م. دوباره می‌خواهیم بگوییم refit برابر با درست است،

1556
00:51:07,440 –> 00:51:08,800
این مهم است،

1557
00:51:08,800 –> 00:51:11,359
من فکر می‌کنم در واقع پیش‌فرض است، اما

1558
00:51:11,359 –> 00:51:13,119
اتفاقی که قرار است بیفتد این است که ما

1559
00:51:13,119 –> 00:51:16,079
این refit و cv را دست به

1560
00:51:16,079 –> 00:51:16,880
دست

1561
00:51:16,880 –> 00:51:18,800
هم می‌دهیم، بنابراین cv اعتبار متقاطع ما است.

1562
00:51:18,800 –> 00:51:20,559
برای انجام پنج موردی که ب

پاسخ دهید لغو پاسخ

اکانت vip

دوره آموزش پایتون

مطالب تصادفی

فیلم آموزشی: 5386 پاسخ ماژول||55194 زیر ماژول|| پایتون عملی||#tcs #fresco #elevatewings #coding

فیلم آموزشی: ایجاد نقشه های تعاملی در پایتون | فولیوم برای ایجاد نقشه در پایتون | نقشه های تعاملی فولیوم با زیرنویس فارسی

فیلم آموزشی: پایتون سلنیوم – زنجیره های عمل مبتنی بر موش در سلنیوم با زیرنویس فارسی

فیلم آموزشی: نکته سریع پایتون: تفاوت بین \ با زیرنویس فارسی

فیلم آموزشی: آموزش شماره 29 Python Flask – Die Data Transfer Objects

فیلم آموزشی: L25/4 Minibatch SGD در پایتون با زیرنویس فارسی

فیلم آموزشی: نحوه نصب تعویض کننده آب Python Aqueon بر روی سر دوش | تعویض آب برای شیر آب مناسب نیست با زیرنویس فارسی

فیلم آموزشی: QGIS Python (PyQGIS) – به ویژگی های لایه برداری دسترسی پیدا کنید با زیرنویس فارسی

فیلم آموزشی: آموزش پایتون: جمع آوری داده ها از طریق API توییتر با زیرنویس فارسی

فیلم آموزشی: کلت پایتون 2020 در مقابل کلت پایتون اصلی با زیرنویس فارسی

فیلم آموزشی: مبانی SQL: قسمت شماره 27 دوره پایتون API با زیرنویس فارسی

فیلم آموزشی: این یک دوره آموزشی پایتون است که در واقع کار می کند و احتمالاً ارزش خرید دارد! ببین موافقی یا نه! با زیرنویس فارسی

فیلم آموزشی: #37 شروع با پایتون | عملیات درج، به روز رسانی، حذف و جستجو با استفاده از SQLite در پایتون

فیلم آموزشی: تشخیص سرطان سینه با پایتون

فیلم آموزشی: پایتون – به هم پیوستن، تغییر نام، و ترتیب مجدد ستون ها با زیرنویس فارسی

فیلم آموزشی: نحوه تغییر رشته به حروف بزرگ در زبان برنامه نویسی پایتون به روش حروف بزرگ

پشتیبانی سایت

نماد اعتماد اینماد و زیبال

برای دانلود این فیلم ، عضو vip سایت شوید.

دانلود 17000 فیلم پایتون با پرداخت 15 هزار تومان (عضویت یک ماهه)

مطالب مرتبط: