در این مطلب، ویدئو ساخت موتور توصیه Spotify با پایتون (آموزش) با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:25:17
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,560 –> 00:00:03,199
سلام بچه ها به یک ویدیوی دیگر خوش آمدید من در
2
00:00:03,199 –> 00:00:05,680
مورد این ویدیو بسیار هیجان
3
00:00:05,680 –> 00:00:07,120
زده هستم امروز شما را در مورد اینکه
4
00:00:07,120 –> 00:00:09,280
چگونه یک موتور توصیه اسپاتیفای را
5
00:00:09,280 –> 00:00:11,360
از ابتدا در پایتون ساختم توضیح خواهم داد اگر
6
00:00:11,360 –> 00:00:12,480
با معنای صحبت من آشنا نیستید
7
00:00:12,480 –> 00:00:13,360
8
00:00:13,360 –> 00:00:14,799
در پایین هر لیست پخش در
9
00:00:14,799 –> 00:00:16,880
Spotify بخشی وجود دارد که می گوید
10
00:00:16,880 –> 00:00:18,240
اینجا چند آهنگ وجود دارد که فکر می کنید
11
00:00:18,240 –> 00:00:20,560
باید هدف من را برای این ویدیو اضافه
12
00:00:20,560 –> 00:00:22,480
13
00:00:22,480 –> 00:00:24,560
14
00:00:24,560 –> 00:00:26,000
کنید.
15
00:00:26,000 –> 00:00:27,680
16
00:00:27,680 –> 00:00:28,960
17
00:00:28,960 –> 00:00:31,039
قبل از اینکه وارد کد و
18
00:00:31,039 –> 00:00:32,558
دفترچه یادداشت jupyter بشوم، نتایج خیلی بهتر از آنچه انتظار
19
00:00:32,558 –> 00:00:34,160
20
00:00:34,160 –> 00:00:36,160
داشتم ظاهر شد.
21
00:00:36,160 –> 00:00:37,520
22
00:00:37,520 –> 00:00:39,840
23
00:00:39,840 –> 00:00:41,200
و خودتان با آن بازی کنید
24
00:00:41,200 –> 00:00:44,000
همچنین گروه پیوند وبلاگ من در خود لینکدین
25
00:00:44,000 –> 00:00:44,960
26
00:00:44,960 –> 00:00:46,800
همه چیزهایی که فکر می کنم
27
00:00:46,800 –> 00:00:48,000
برای شما بسیار مفید خواهد بود
28
00:00:48,000 –> 00:00:49,760
قطعاً به من بگویید که چه فکر می کنید
29
00:00:49,760 –> 00:00:52,000
و در آخر اگر قبلاً تا به حال نکرده اید لطفاً
30
00:00:52,000 –> 00:00:52,719
مشترک شوید
31
00:00:52,719 –> 00:00:55,039
نظر خود را در مورد خود کانال به من بگویید.
32
00:00:55,039 –> 00:00:56,559
من فکر میکنم که من به تازگی این کار را انجام میدهم
33
00:00:56,559 –> 00:00:58,000
،
34
00:00:58,000 –> 00:01:00,239
بنابراین نوع حمایت شما
35
00:01:00,239 –> 00:01:01,199
بسیار ارزشمند است،
36
00:01:01,199 –> 00:01:02,960
حالا که من آن را از سر
37
00:01:02,960 –> 00:01:06,320
راه برداشتم.
38
00:01:06,640 –> 00:01:08,240
که ما در یک
39
00:01:08,240 –> 00:01:10,400
نوت بوک ژوپیتر هستیم، میخواهم یک قدم به
40
00:01:10,400 –> 00:01:12,000
عقب برگردم و اساساً در مورد
41
00:01:12,000 –> 00:01:13,840
روششناسی فرآیندی که قرار است انجام دهم صحبت
42
00:01:13,840 –> 00:01:14,320
کنم
43
00:01:14,320 –> 00:01:16,960
و در مورد محدودیتها صحبت
44
00:01:16,960 –> 00:01:18,479
کنم، توصیهای که من همیشه
45
00:01:18,479 –> 00:01:21,119
به دانشمندان جوان داده میکنم واقعاً است.
46
00:01:21,119 –> 00:01:22,560
همه چیز را روی کاغذ بیاورید و
47
00:01:22,560 –> 00:01:24,320
نشان دهید که دقیقاً چگونه می خواهید
48
00:01:24,320 –> 00:01:26,400
کارها را انجام دهید زیرا
49
00:01:26,400 –> 00:01:27,920
از هر ده بار 9 بار در زمان شما صرفه جویی می
50
00:01:27,920 –> 00:01:29,680
کند، بهترین
51
00:01:29,680 –> 00:01:31,600
کار مجدد مورد نیاز است، بنابراین بله، می خواهم به
52
00:01:31,600 –> 00:01:33,360
شما نشان دهم که چگونه آن را به تصویر می کشم.
53
00:01:33,360 –> 00:01:34,720
و
54
00:01:34,720 –> 00:01:38,000
امیدوارم در آینده به شما کمک کند، بنابراین
55
00:01:38,000 –> 00:01:40,079
56
00:01:40,079 –> 00:01:42,079
یک فرآیند پنج مرحلهای وجود دارد که
57
00:01:42,079 –> 00:01:43,520
چگونه این الگوریتم را ساختم و این
58
00:01:43,520 –> 00:01:44,079
مدل
59
00:01:44,079 –> 00:01:47,200
را ساختم.
60
00:01:47,200 –> 00:01:49,040
است در واقع کمی
61
00:01:49,040 –> 00:01:50,320
عجیب است که احتمالاً
62
00:01:50,320 –> 00:01:51,119
منطقی نخواهد بود، اما
63
00:01:51,119 –> 00:01:53,600
در حال حاضر فقط فرض کنید این راهی است که
64
00:01:53,600 –> 00:01:56,640
میتوانیم یک لیست پخش را در spotify من
65
00:01:56,640 –> 00:01:58,560
66
00:01:58,560 –> 00:01:59,759
خلاصه کنیم و بر اساس آن خلاصه توصیههایی ایجاد
67
00:01:59,759 –> 00:02:01,200
کنیم.
68
00:02:01,200 –> 00:02:02,880
و اینکه من واقعاً چگونه
69
00:02:02,880 –> 00:02:04,640
این کار را انجام می دهم، اما در حال حاضر این
70
00:02:04,640 –> 00:02:07,680
باید کافی باشد تا شما را در
71
00:02:07,680 –> 00:02:08,000
72
00:02:08,000 –> 00:02:10,720
همان صفحه در مورد نوع الگوریتم جزئیاتی
73
00:02:10,720 –> 00:02:11,680
که ما استفاده
74
00:02:11,680 –> 00:02:13,280
می کنیم، قرار دهیم، بنابراین به طور طبیعی هیچ داده تعامل کاربر نداریم
75
00:02:13,280 –> 00:02:15,680
زیرا من هستم به
76
00:02:15,680 –> 00:02:17,440
نوعی در Spotify کار نمی کنم،
77
00:02:17,440 –> 00:02:19,120
من از مجموعه داده های Kaggle
78
00:02:19,120 –> 00:02:22,000
کار می کنم، بنابراین ما با یک
79
00:02:22,000 –> 00:02:24,640
سیستم توصیه مبتنی بر محتوا کار خواهیم کرد
80
00:02:24,640 –> 00:02:26,879
که فقط از ویژگی ها و
81
00:02:26,879 –> 00:02:28,080
ویژگی های مربوط به
82
00:02:28,080 –> 00:02:31,200
ام یک آهنگ به طور خاص استفاده می کند، بنابراین من
83
00:02:31,200 –> 00:02:32,400
تعامل کاربر ندارم،
84
00:02:32,400 –> 00:02:33,840
باید با چنین الگوریتمی پیش بروم
85
00:02:33,840 –> 00:02:34,640
و
86
00:02:34,640 –> 00:02:36,879
خواهید دید که نتایج
87
00:02:36,879 –> 00:02:39,040
با استفاده از محدودیتهای رویکرد هنوز بسیار خوب هستند،
88
00:02:39,040 –> 00:02:41,920
بنابراین من به شما نشان خواهم داد که واقعاً
89
00:02:41,920 –> 00:02:42,560
به سرعت
90
00:02:42,560 –> 00:02:44,480
با این مجموعه دادههای kaggle کار میکنم
91
00:02:44,480 –> 00:02:46,480
. اوم من هستم با استفاده از پیوند در
92
00:02:46,480 –> 00:02:47,599
نوتبوکها، میتوانید
93
00:02:47,599 –> 00:02:50,560
خودتان نگاهی بیندازید، اما من میخواهم از
94
00:02:50,560 –> 00:02:52,239
آن استفاده کنم، زیرا
95
00:02:52,239 –> 00:02:53,840
ساختن نمونه اولیه را برای من بسیار آسان میکند، میتوانم خیلی سریع چیزها را از روی زمین بیرون بیاورم،
96
00:02:53,840 –> 00:02:54,959
97
00:02:54,959 –> 00:02:58,959
اما اشاره میکنم که مطمئناً
98
00:02:58,959 –> 00:03:02,080
160000 آهنگ در اینجا وجود دارد. این یک
99
00:03:02,080 –> 00:03:03,200
پوشش 100 با
100
00:03:03,200 –> 00:03:06,560
آنچه ممکن است در لیست پخش من یا یا
101
00:03:06,560 –> 00:03:08,720
مکان شما و غیره باشد نیست، بنابراین
102
00:03:08,720 –> 00:03:11,840
آنچه ممکن است ببینید این است
103
00:03:11,840 –> 00:03:14,480
که شاید وقتی به این مجموعه داده نگاه می کنم ممکن است دریافت کنم
104
00:03:14,480 –> 00:03:14,879
شاید
105
00:03:14,879 –> 00:03:18,000
30 درصد یا 60 آهنگ
106
00:03:18,000 –> 00:03:19,599
واقعی در لیست پخش من باشد
107
00:03:19,599 –> 00:03:21,680
مطمئن هستم که اینطور نیست. 100 پوشش دارد، اما
108
00:03:21,680 –> 00:03:23,200
آنقدرها هم بد نیست، زیرا در پایان
109
00:03:23,200 –> 00:03:23,599
روز،
110
00:03:23,599 –> 00:03:26,640
حتی اگر داشته باشم، از زیرمجموعهای
111
00:03:26,640 –> 00:03:28,879
از آهنگهای موجود در فهرست پخش استفاده میکنم،
112
00:03:28,879 –> 00:03:30,560
هنوز هم میتوانم ارزیابی کنم
113
00:03:30,560 –> 00:03:32,239
که آیا سیستم توصیه کار میکند
114
00:03:32,239 –> 00:03:34,000
که من همان چیزی است که من هستم.
115
00:03:34,000 –> 00:03:36,720
واقعاً روی چه چیزی باید تمرکز کنم، بنابراین
116
00:03:36,720 –> 00:03:37,440
حتی اگر این
117
00:03:37,440 –> 00:03:38,959
یک نوع محدودیت است، فکر نمیکنم آنقدرها
118
00:03:38,959 –> 00:03:40,720
هم مشکل باشد، بنابراین من
119
00:03:40,720 –> 00:03:41,920
همچنان ادامه
120
00:03:41,920 –> 00:03:44,799
میدهم و در آخر فقط
121
00:03:44,799 –> 00:03:46,720
ابردادههای ژانر ارائه میشود
122
00:03:46,720 –> 00:03:47,840
تا بتوان دامنه وسیعی داشت. انواع
123
00:03:47,840 –> 00:03:49,680
متادیتا که نقطه واقعی است تیم fy
124
00:03:49,680 –> 00:03:50,319
125
00:03:50,319 –> 00:03:53,200
در مورد من استفاده میکند، من فقط از
126
00:03:53,200 –> 00:03:54,799
توصیفکنندههای ژانر استفاده
127
00:03:54,799 –> 00:03:56,319
میکنم که میبینید کاملاً خوب است، اما
128
00:03:56,319 –> 00:03:58,159
میخواهم به آن توجه داشته باشم و بگویم اگر
129
00:03:58,159 –> 00:03:59,519
ارائهای به
130
00:03:59,519 –> 00:04:01,840
مدیران اجرایی و غیره ارائه دادهام، این همان
131
00:04:01,840 –> 00:04:03,360
جزئیات است. توجه داشته باشید که
132
00:04:03,360 –> 00:04:04,879
همه در یک صفحه باشند و
133
00:04:04,879 –> 00:04:07,680
بدانند چه چیزی را باید انتظار داشته باشند،
134
00:04:07,680 –> 00:04:10,560
همچنین مراحل بسیار متفاوتی
135
00:04:10,560 –> 00:04:11,439
وجود دارد و موارد بسیار متفاوتی وجود دارد که
136
00:04:11,439 –> 00:04:11,840
ما
137
00:04:11,840 –> 00:04:14,799
در این ویدیو به آنها خواهیم پرداخت و در
138
00:04:14,799 –> 00:04:16,560
توضیحات خواهید دید که مراحل زمانی برای هر کدام وجود دارد.
139
00:04:16,560 –> 00:04:18,160
از این بخشها،
140
00:04:18,160 –> 00:04:19,680
لطفاً اگر
141
00:04:19,680 –> 00:04:21,440
واقعاً کنجکاو هستید و
142
00:04:21,440 –> 00:04:23,199
در مورد بخش خاصی
143
00:04:23,199 –> 00:04:25,040
که برای شما وجود دارد میپرسید، ادامه دهید، فقط برای
144
00:04:25,040 –> 00:04:26,560
اطمینان از اینکه میتوانید به بخشی بروید
145
00:04:26,560 –> 00:04:28,479
که واقعاً به آن اهمیت میدهید و
146
00:04:28,479 –> 00:04:31,040
همچنین من نمیروم. در مورد آمادهسازی دادهها،
147
00:04:31,040 –> 00:04:32,720
زیرا
148
00:04:32,720 –> 00:04:35,199
خیلی طول میکشد و فکر میکنم اگر فقط
149
00:04:35,199 –> 00:04:36,479
کد را مرور کنید و تمام
150
00:04:36,479 –> 00:04:37,759
نظراتی را که در آنجا ارائه کردهام مرور کنید، فکر
151
00:04:37,759 –> 00:04:39,280
میکنم میتوانید دقیقاً
152
00:04:39,280 –> 00:04:41,199
بفهمید که چگونه دادهها
153
00:04:41,199 –> 00:04:42,880
را آماده کردم. با این من g میخواهیم مستقیماً
154
00:04:42,880 –> 00:04:44,160
به مهندسی ویژگیها بپریم و به
155
00:04:44,160 –> 00:04:45,680
شما نشان دهیم که چگونه
156
00:04:45,680 –> 00:04:48,560
ویژگیها را ساخته و ساختار دادهایم بهگونهای که
157
00:04:48,560 –> 00:04:49,840
به ما کمک میکند تا توصیهها را تولید
158
00:04:49,840 –> 00:04:51,199
159
00:04:51,199 –> 00:04:56,720
کنیم، بنابراین بیایید به
160
00:04:56,720 –> 00:04:58,560
آنجا برویم تا در
161
00:04:58,560 –> 00:05:00,880
بخش مهندسی ویژگیهای نوتبوک و در
162
00:05:00,880 –> 00:05:02,400
کنار شما باشیم.
163
00:05:02,400 –> 00:05:05,520
من مطمئن شدم که همه چیز دقیقاً
164
00:05:05,520 –> 00:05:06,560
در کد ساختار یافته
165
00:05:06,560 –> 00:05:08,240
است، به طوری که شما دقیقاً می دانید
166
00:05:08,240 –> 00:05:10,560
که چه بخشی از کد انجام می دهد.
167
00:05:10,560 –> 00:05:12,880
168
00:05:12,880 –> 00:05:14,000
169
00:05:14,000 –> 00:05:16,160
نرمال کردن متغیرهای شناور،
170
00:05:16,160 –> 00:05:18,400
171
00:05:18,400 –> 00:05:19,919
اگر به این مجموعه داده در اینجا
172
00:05:19,919 –> 00:05:21,520
نگاه کنید، چیزهایی مانند
173
00:05:21,520 –> 00:05:24,000
بیماری ابزار انرژی، سرزندگی صدای بلند را خواهید دید،
174
00:05:24,000 –> 00:05:25,360
اینها همه
175
00:05:25,360 –> 00:05:28,400
نوعی توصیفکننده فنی
176
00:05:28,400 –> 00:05:31,360
هر آهنگ خاصی هستند، بنابراین شما فقط
177
00:05:31,360 –> 00:05:32,800
متوجه بلندی و سرزندگی
178
00:05:32,800 –> 00:05:34,800
میشوید، اندازهها بسیار متفاوت هستند.
179
00:05:34,800 –> 00:05:36,160
من میخواهم آنها را بگنجانم، اما
180
00:05:36,160 –> 00:05:38,240
میخواهم در یک مقیاس باشند
181
00:05:38,240 –> 00:05:40,000
تا مدل به سمت یک
182
00:05:40,000 –> 00:05:41,440
ویژگی در مقابل ویژگی دیگر منحرف نشود، به
183
00:05:41,440 –> 00:05:44,880
همین دلیل است که میخواهم
184
00:05:44,880 –> 00:05:48,000
آن ویژگیها را مقیاسبندی کنم. سپس یک کدگذاری داغ
185
00:05:48,000 –> 00:05:49,440
ممکن است این را ببینید اوه
186
00:05:49,440 –> 00:05:51,360
این همان کلمه اختصاری است که من برای
187
00:05:51,360 –> 00:05:53,039
یک رمزگذاری داغ استفاده
188
00:05:53,039 –> 00:05:54,240
میکنم، بنابراین اگر زمانی آن را مشاهده کردید، امیدوارم
189
00:05:54,240 –> 00:05:56,240
اگر زمانی ببینید شما را گیج نکند، این به معنای
190
00:05:56,240 –> 00:05:59,520
یک کدگذاری داغ است، بنابراین دو ویژگی وجود دارد
191
00:05:59,520 –> 00:06:01,199
که میخواهم رمزگذاری متوجه میشوید
192
00:06:01,199 –> 00:06:03,759
که تاریخ انتشار و محبوبیت وجود دارد،
193
00:06:03,759 –> 00:06:04,560
من نمیخواهم به
194
00:06:04,560 –> 00:06:06,479
طور طبیعی آن را منتشر کنم، نمیتوانم مانند
195
00:06:06,479 –> 00:06:08,160
محبوبیت وارد
196
00:06:08,160 –> 00:06:09,680
کنم، همچنین نمیخواهم ورودی بدهم که
197
00:06:09,680 –> 00:06:12,479
ترجیح میدهم آن را در گروههای محبوبیت قرار دهم،
198
00:06:12,479 –> 00:06:15,520
199
00:06:15,520 –> 00:06:16,960
پس من قصد دارم انجام دهم این است که یک
200
00:06:16,960 –> 00:06:18,720
ویژگی رمزگذاری شده داغ سال
201
00:06:18,720 –> 00:06:21,440
و یک نسخه سطلی از محبوبیت
202
00:06:21,440 –> 00:06:21,919
ایجاد
203
00:06:21,919 –> 00:06:25,199
کنم که در اینجا خواهید دید، بنابراین این قطعه
204
00:06:25,199 –> 00:06:26,240
کد
205
00:06:26,240 –> 00:06:28,000
اساساً کاری است که من انجام دادم به جای
206
00:06:28,000 –> 00:06:29,680
قرار دادن هر
207
00:06:29,680 –> 00:06:32,319
افزایش محبوبیت به تنهایی
208
00:06:32,319 –> 00:06:34,000
در الگوریتم
209
00:06:34,000 –> 00:06:36,639
من پنج سطل افزایشی ایجاد کردهام، فکر میکنم برای من،
210
00:06:36,639 –> 00:06:37,120
فکر میکنم
211
00:06:37,120 –> 00:06:40,479
انتزاع کردن آن به هیچ
212
00:06:40,479 –> 00:06:42,800
وجه به مدل آسیبی نمیزند، تصور میکنم اگر
213
00:06:42,800 –> 00:06:44,440
معمولاً در حال گوش دادن به موسیقی بین محبوبیت
214
00:06:44,440 –> 00:06:45,840
90 تا 95
215
00:06:45,840 –> 00:06:49,120
میلیمتر هستم، هر توصیهای در
216
00:06:49,120 –> 00:06:49,840
آن وجود داشته باشد. محدوده
217
00:06:49,840 –> 00:06:51,759
احتمالا خوب خواهد بود برای من مناسب است، بنابراین
218
00:06:51,759 –> 00:06:53,360
فکر
219
00:06:53,360 –> 00:06:55,120
میکنم این فرض و منطق به خودی خود
220
00:06:55,120 –> 00:06:57,440
به نوعی در نظر من منطقی است، بنابراین
221
00:06:57,440 –> 00:06:58,960
من میروم و مطمئن میشوم که پیش میروم
222
00:06:58,960 –> 00:07:01,199
و آن سطلهایی را
223
00:07:01,199 –> 00:07:02,560
که میخواهم به آن اشاره کنم درست انجام دهم، این یک
224
00:07:02,560 –> 00:07:05,440
نمونه اولیه است. این سیستم سطل
225
00:07:05,440 –> 00:07:07,039
چیزی است که من قطعاً میخواهم در حین پیشروی آن را
226
00:07:07,039 –> 00:07:08,560
بچشم یا
227
00:07:08,560 –> 00:07:10,639
آزمایش کنم و شاید آن را در مرحله
228
00:07:10,639 –> 00:07:12,960
تولید قرار
229
00:07:12,960 –> 00:07:14,160
دهم، فکر میکنم وقتی میسازید باید به
230
00:07:14,160 –> 00:07:15,599
همه این پارامترها فکر کنید که ممکن است بخواهید
231
00:07:15,599 –> 00:07:16,000
232
00:07:16,000 –> 00:07:18,319
یک b test um بگویید اگر نیستید. آزمایش b آشنا
233
00:07:18,319 –> 00:07:20,080
مانند اجرای آزمایشها برای
234
00:07:20,080 –> 00:07:21,120
فهمیدن اینکه
235
00:07:21,120 –> 00:07:23,440
چه نوع سطل به خوبی کار میکند
236
00:07:23,440 –> 00:07:25,120
و من بعداً به پارامترهای دیگری اشاره خواهم کرد که به
237
00:07:25,120 –> 00:07:26,400
طور بالقوه
238
00:07:26,400 –> 00:07:29,199
میتوانید هنگام نمونهسازی آزمایش کنید و
239
00:07:29,199 –> 00:07:30,720
اینکه آیا برای خودتان نمونهسازی
240
00:07:30,720 –> 00:07:32,240
میکنید یا واقعاً کار میکنید. در یک شرکت بزرگ،
241
00:07:32,240 –> 00:07:34,800
فکر کردن به اینکه چه چیزی را میتوان
242
00:07:34,800 –> 00:07:36,720
پارامتر کرد و بعداً میتوان آن را آزمایش کرد
243
00:07:36,720 –> 00:07:38,240
،
244
00:07:38,240 –> 00:07:41,680
برای یک دانشمند داده بسیار مهم است، بنابراین
245
00:07:41,680 –> 00:07:44,400
این دو ویژگی در
246
00:07:44,400 –> 00:07:45,599
سطل قرار میگیرند و
247
00:07:45,599 –> 00:07:48,400
یک ویژگی رمزگذاری شده داغ ایجاد میکنند. و
248
00:07:48,400 –> 00:07:50,080
سپس به شما نشان خواهم داد
249
00:07:50,080 –> 00:07:59,680
بیایید ببینیم این است که در
250
00:07:59,680 –> 00:08:02,319
اینجا یک مثال وجود دارد که به نظر می رسد
251
00:08:02,319 –> 00:08:03,520
شروع و پایان مجموعه داده
252
00:08:03,520 –> 00:08:05,039
آن چیزی را که من نیاز داشتم
253
00:08:05,039 –> 00:08:07,440
ندارد، اما اساسا آخرین ویژگی
254
00:08:07,440 –> 00:08:08,479
که
255
00:08:08,479 –> 00:08:09,919
ما می خواهیم انجام دهیم این است
256
00:08:09,919 –> 00:08:11,440
لیست ژانر تلفیقی و این
257
00:08:11,440 –> 00:08:12,960
واقعاً الگوریتم را هدایت می کند،
258
00:08:12,960 –> 00:08:16,000
بنابراین با استفاده از رویکردی به نام tf idf
259
00:08:16,000 –> 00:08:17,440
و من دقیقاً به شما نشان می دهم
260
00:08:17,440 –> 00:08:19,120
که معنی آن چیست و
261
00:08:19,120 –> 00:08:22,319
چه کاربردی دارد، می خواهم این داده های متنی را از این
262
00:08:22,319 –> 00:08:23,199
لیست متن بگیرم
263
00:08:23,199 –> 00:08:25,520
و ویژگی های مبتنی بر آن ایجاد کنم. خارج از آن و
264
00:08:25,520 –> 00:08:27,039
همانطور که اشاره کردم،
265
00:08:27,039 –> 00:08:28,960
زیرا اگر
266
00:08:28,960 –> 00:08:30,879
راک ایندی چینی ایندی را ببینید، اگر
267
00:08:30,879 –> 00:08:33,519
بتوانم نوع این ژانرها را در یک
268
00:08:33,519 –> 00:08:34,719
لیست پخش خاص بیاموزم،
269
00:08:34,719 –> 00:08:37,279
احتمالاً میتوانم توصیههای
270
00:08:37,279 –> 00:08:38,240
منطقی
271
00:08:38,240 –> 00:08:42,159
ارائه کنم، بنابراین بدون هیچ مقدمهای بیشتر،
272
00:08:42,159 –> 00:08:43,440
در اینجا برخی از توابع را برای شما آوردهایم. می توانید
273
00:08:43,440 –> 00:08:45,120
آن را در زمان خود انجام دهید، اما این
274
00:08:45,120 –> 00:08:46,880
تابع به من اجازه می دهد تا به سرعت
275
00:08:46,880 –> 00:08:49,680
هر ویژگی را رمزگذاری کنم و
276
00:08:49,680 –> 00:08:51,680
نام ستون های جدید و غیره
277
00:08:51,680 –> 00:08:53,519
را به آن بدهم.
278
00:08:53,519 –> 00:08:56,720
279
00:08:56,720 –> 00:09:01,839
280
00:09:02,080 –> 00:09:04,160
rview بنابراین منابع زیادی آنلاین وجود دارد که
281
00:09:04,160 –> 00:09:06,480
من برخی از آنها را نیز ارائه خواهم کرد، اما
282
00:09:06,480 –> 00:09:08,240
اساساً آنچه من می خواهم شما را
283
00:09:08,240 –> 00:09:10,720
از این نمای کلی حذف کنید این است
284
00:09:10,720 –> 00:09:13,920
که به طور خودکار تأکید می کند، یعنی
285
00:09:13,920 –> 00:09:17,040
مانند وزن دادن به
286
00:09:17,040 –> 00:09:19,680
ژانرهای آهنگ خاص بر اساس تعداد دفعات
287
00:09:19,680 –> 00:09:21,600
ظاهر شدن آنها، بنابراین
288
00:09:21,600 –> 00:09:24,160
اگر وجود داشت مانند راک یا اگر چیزی
289
00:09:24,160 –> 00:09:24,800
عمومی
290
00:09:24,800 –> 00:09:27,440
مانند پاپ اگر پاپ ظاهر شود، من نمیخواهم
291
00:09:27,440 –> 00:09:28,959
وزن خیلی بالایی داشته باشد یا
292
00:09:28,959 –> 00:09:30,880
واقعاً روی مدل تأثیر بگذارد، فقط
293
00:09:30,880 –> 00:09:32,640
به این دلیل
294
00:09:32,640 –> 00:09:34,000
که خیلی عمومی نیست، درست است، اما اگر
295
00:09:34,000 –> 00:09:35,680
واقعاً چیزی خاص باشد مانند
296
00:09:35,680 –> 00:09:38,240
کلاسیک انتزاعی اگر این نشان میدهد من
297
00:09:38,240 –> 00:09:39,680
میخواهم که واقعاً
298
00:09:39,680 –> 00:09:42,320
بر جایی که مدل میرود یا
299
00:09:42,320 –> 00:09:44,480
جهت مدل تأثیر بگذارد،
300
00:09:44,480 –> 00:09:46,560
زیرا بسیار منحصربهفرد است و اگر متوجه شدم
301
00:09:46,560 –> 00:09:47,839
که یک لیست پخش وجود دارد که
302
00:09:47,839 –> 00:09:50,160
مانند 9 یا 60 انتزاعی کلاسیک است،
303
00:09:50,160 –> 00:09:51,760
میخواهم که واقعاً مهم باشد زیرا
304
00:09:51,760 –> 00:09:54,399
فکر میکنم لیست پخش دیگری وجود دارد. آهنگ کلاسیک انتزاعی ام
305
00:09:54,399 –> 00:09:55,680
می تواند
306
00:09:55,680 –> 00:09:59,440
بسیار مناسب باشد، بنابراین
307
00:09:59,440 –> 00:10:00,959
من بعداً به شما نشان خواهم داد که چیزی
308
00:10:00,959 –> 00:10:02,480
به نام شباهت کسینوس وجود دارد که
309
00:10:02,480 –> 00:10:05,600
به جفت شدن این دو با هم کمک می کند، اما در حال حاضر فقط
310
00:10:05,600 –> 00:10:10,240
توجه داشته باشید که این r الگوریتم بسیار ساده و در عین حال
311
00:10:10,240 –> 00:10:12,480
ظریف به من اجازه می دهد تا به راحتی
312
00:10:12,480 –> 00:10:14,560
ملودی خاصی از برچسب ها را بر
313
00:10:14,560 –> 00:10:16,160
اساس تعداد دفعات ظاهر شدن آنها وزن کنم و این بسیار
314
00:10:16,160 –> 00:10:18,959
مهم است و یک چیز را ذکر خواهم کرد.
315
00:10:18,959 –> 00:10:20,399
316
00:10:20,399 –> 00:10:22,240
317
00:10:22,240 –> 00:10:24,720
318
00:10:24,720 –> 00:10:26,880
من احساس می کنم اشتباه نکرده ام،
319
00:10:26,880 –> 00:10:28,800
منظورم این است که این بسیار قدرتمند است، من
320
00:10:28,800 –> 00:10:29,600
از آن در
321
00:10:29,600 –> 00:10:31,760
کد تولید در
322
00:10:31,760 –> 00:10:33,279
نیروی کار خودم در دیزنی استفاده کرده ام که
323
00:10:33,279 –> 00:10:35,040
فکر می کنم شگفت انگیز است، درست است، فکر می کنم بسیار
324
00:10:35,040 –> 00:10:36,800
ساده است اما واقعاً وزن زیادی دارد
325
00:10:36,800 –> 00:10:38,399
326
00:10:38,399 –> 00:10:39,920
بنابراین اکنون که به نوعی در همان
327
00:10:39,920 –> 00:10:42,560
صفحه هستیم تا بدانیم tfidf چیست،
328
00:10:42,560 –> 00:10:44,320
من این ویژگی را داشتم
329
00:10:44,320 –> 00:10:46,320
که اساساً کل قاب داده Spotify را می گیرد و
330
00:10:46,320 –> 00:10:46,959
سپس
331
00:10:46,959 –> 00:10:50,000
یک مجموعه ویژگی بزرگ ایجاد می کند که
332
00:10:50,000 –> 00:10:51,040
در اینجا مشاهده می کنید
333
00:10:51,040 –> 00:10:53,839
امم، می توانم از آن برای تولید
334
00:10:53,839 –> 00:10:55,360
توصیه ها استفاده کنم. بنابراین
335
00:10:55,360 –> 00:10:57,760
شما این ژانر را درست می بینید، این به
336
00:10:57,760 –> 00:10:59,040
نوعی ساختار و
337
00:10:59,040 –> 00:11:00,959
سازماندهی
338
00:11:00,959 –> 00:11:04,000
این نوع ویژگی ها را انجام داده ام و فقط به
339
00:11:04,000 –> 00:11:05,600
نوع دانه بندی بسیاری از
340
00:11:05,600 –> 00:11:07,040
این ویژگی ها
341
00:11:07,040 –> 00:11:10,079
در حال حاضر نگاه می کنم.
342
00:11:10,079 –> 00:11:11,920
احتمالاً متوجه شده اید که چرا فکر می
343
00:11:11,920 –> 00:11:14,399
کنم این برای این مدل بسیار آموزنده و مفید خواهد
344
00:11:14,399 –> 00:11:16,480
بود، فکر می کنم این سطح از
345
00:11:16,480 –> 00:11:17,680
جزئیات می تواند
346
00:11:17,680 –> 00:11:20,079
به من اجازه دهد تا چیزهای زیادی در مورد
347
00:11:20,079 –> 00:11:21,680
انواع آهنگ هایی که در یک
348
00:11:21,680 –> 00:11:22,800
لیست پخش خاص وجود دارند یاد بگیرم و
349
00:11:22,800 –> 00:11:24,399
این نمی تواند باشد. متوجه نشدم که چقدر قدرتمند
350
00:11:24,399 –> 00:11:25,839
است
351
00:11:25,839 –> 00:11:27,839
و من را به فکر وا می دارد که
352
00:11:27,839 –> 00:11:29,519
تصور کنید چه نوع متادیتای
353
00:11:29,519 –> 00:11:31,360
دیگری ممکن است Spotify داشته باشد که آنها
354
00:11:31,360 –> 00:11:34,320
دوست دارند احتمالاً دارای رنگ هایی هستند به جز
355
00:11:34,320 –> 00:11:36,160
آنقدر دانه بندی در آنجا که فکر
356
00:11:36,160 –> 00:11:39,279
می کنم می تواند حتی مدل قوی تری ایجاد کند،
357
00:11:39,279 –> 00:11:40,720
اما اجازه دهید به درست است، بنابراین شما
358
00:11:40,720 –> 00:11:43,440
می توانید برخی از ویژگی های دیگر را در اینجا ببینید،
359
00:11:43,440 –> 00:11:46,560
ام، من از این متنفرم، خیلی خوب است،
360
00:11:46,560 –> 00:11:50,079
بنابراین شما ستون سال را در اینجا می بینید،
361
00:11:50,079 –> 00:11:54,399
بیایید به سمت راست برویم،
362
00:11:55,279 –> 00:11:57,920
بله، همه این ها را می بینید،
363
00:11:57,920 –> 00:11:59,279
به معنای واقعی کلمه، من حتی نمی فهمم
364
00:11:59,279 –> 00:12:00,320
کسی این چنین است
365
00:12:00,320 –> 00:12:02,639
احتمالاً خیلی خارجی است من کاملاً
366
00:12:02,639 –> 00:12:03,680
مطمئن
367
00:12:03,680 –> 00:12:06,880
نیستم که آنها از کدام کشور هستند.
368
00:12:06,880 –> 00:12:09,040
369
00:12:09,040 –> 00:12:10,320
370
00:12:10,320 –> 00:12:11,120
371
00:12:11,120 –> 00:12:12,560
372
00:12:12,560 –> 00:12:15,040
و آنچه در این مورد زیباست
373
00:12:15,040 –> 00:12:17,839
برای این مورد استفاده در این ویدیو است،
374
00:12:17,839 –> 00:12:19,200
من به شما نشان می دهم که چگونه می توانم
375
00:12:19,200 –> 00:12:20,880
توصیه هایی را بر
376
00:12:20,880 –> 00:12:23,600
اساس لیست پخش خود ایجاد کنم، اما می توانم به راحتی از آن استفاده کنم
377
00:12:23,600 –> 00:12:24,800
و بگویم اوه اجازه دهید فقط
378
00:12:24,800 –> 00:1