در این مطلب، ویدئو استخراج ویژگی amplitude envelope از ابتدا در پایتون با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:33:39
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,399 –> 00:00:03,120
سلام به همه و خوش آمدید به یک ویدیوی جدید
2
00:00:03,120 –> 00:00:04,319
در سری
3
00:00:04,319 –> 00:00:06,160
پردازش سیگنال صوتی برای سری یادگیری ماشینی،
4
00:00:06,160 –> 00:00:08,080
این بار
5
00:00:08,080 –> 00:00:11,599
ویژگی پاکت دامنه را از ابتدا پیاده سازی می
6
00:00:11,599 –> 00:00:14,160
کنیم و در این فرآیند
7
00:00:14,160 –> 00:00:16,640
همچنین با librosia
8
00:00:16,640 –> 00:00:17,359
9
00:00:17,359 –> 00:00:19,439
که کتابخانه پردازش صوتی است آشنا می شویم.
10
00:00:19,439 –> 00:00:20,640
در طول این دوره استفاده
11
00:00:20,640 –> 00:00:23,680
خواهم کرد و همچنین شکل موج ها و
12
00:00:23,680 –> 00:00:25,359
خود پاکت دامنه را
13
00:00:25,359 –> 00:00:27,680
قبل از شروع رسم می کنم، می خواستم
14
00:00:27,680 –> 00:00:28,400
15
00:00:28,400 –> 00:00:31,359
مستندات لیبریو را در اینجا به شما نشان دهم تا
16
00:00:31,359 –> 00:00:32,960
بتوانید این را بررسی کنید،
17
00:00:32,960 –> 00:00:34,800
لینک را در توضیحات
18
00:00:34,800 –> 00:00:36,960
زیر برای شما می گذارم.
19
00:00:36,960 –> 00:00:38,879
یک استخراج کننده برای
20
00:00:38,879 –> 00:00:40,800
پاکت دامنه نداریم و بنابراین ما یکی را از
21
00:00:40,800 –> 00:00:42,559
ابتدا می سازیم خوب است،
22
00:00:42,559 –> 00:00:45,440
بنابراین اکنون بیایید شروع کنیم و بنابراین
23
00:00:45,440 –> 00:00:47,200
اولین کاری که می خواهیم انجام دهیم این
24
00:00:47,200 –> 00:00:51,120
است که بله، بیایید با وارد کردن
25
00:00:51,120 –> 00:00:54,640
uh librezia شروع کنیم و می خواهیم
26
00:00:54,640 –> 00:00:58,000
librosa dot را نیز وارد کنیم. صفحه نمایشی
27
00:00:58,000 –> 00:01:01,039
که دارای ابزارهایی برای
28
00:01:01,039 –> 00:01:04,239
نمودارها برای ترسیم چیزها است خوب است،
29
00:01:04,239 –> 00:01:07,280
بنابراین اکنون آنچه می خواهیم انجام دهیم این است که
30
00:01:07,280 –> 00:01:10,880
فایل های صوتی را بارگیری کنیم
31
00:01:10,880 –> 00:01:14,080
و بنابراین امروز از چه فایل های صوتی استفاده می کنیم، خوب
32
00:01:14,080 –> 00:01:15,520
33
00:01:15,520 –> 00:01:18,000
من اینجا دارم در پردازش سیگنال صوتی
34
00:01:18,000 –> 00:01:19,520
برای
35
00:01:19,520 –> 00:01:22,880
پایه کد یادگیری ماشین UH
36
00:01:22,880 –> 00:01:26,240
در اینجا در uh در پوشه هشت
37
00:01:26,240 –> 00:01:28,479
که برای این ویدیوی فعلی
38
00:01:28,479 –> 00:01:30,159
است، یک زیرپوشه به نام
39
00:01:30,159 –> 00:01:32,720
صدا داریم در اینجا ما سه فایل صوتی داریم،
40
00:01:32,720 –> 00:01:34,079
یکی به نام bc
41
00:01:34,079 –> 00:01:37,200
و یک پاساژ 30 ثانیهای است.
42
00:01:37,200 –> 00:01:40,159
یک قطعه ارکسترال از لباس های
43
00:01:40,159 –> 00:01:42,560
توهین آمیز و ما 30 ثانیه از
44
00:01:42,560 –> 00:01:45,680
دوک الینگتون، نوازنده جاز و 30
45
00:01:45,680 –> 00:01:47,200
ثانیه از آهنگی
46
00:01:47,200 –> 00:01:49,200
از فلفل قرمز تند داریم، بنابراین ما
47
00:01:49,200 –> 00:01:50,880
کمی
48
00:01:50,880 –> 00:01:52,960
موسیقی کلاسیک راک و موسیقی جاز در آنجا داریم،
49
00:01:52,960 –> 00:01:54,720
خب
50
00:01:54,720 –> 00:01:58,079
حالا بیایید اوه بسازید
51
00:01:58,079 –> 00:02:01,200
اوه بیایید مسیرها را پیدا
52
00:02:01,200 –> 00:02:04,240
کنیم تا ما debussy um داشته
53
00:02:04,240 –> 00:02:07,840
باشیم، این را فایل bc می نامیم و
54
00:02:07,840 –> 00:02:12,160
این را می توانم از صدا و
55
00:02:12,160 –> 00:02:14,959
سپس اینجا
56
00:02:15,680 –> 00:02:19,520
bc wolf دریافت کنم و سپس می توانم
57
00:02:19,520 –> 00:02:23,680
همین کار را برای
58
00:02:23,680 –> 00:02:26,800
فلفل قرمز تند انجام دهم. ما صدا را انجام می دهیم
59
00:02:26,800 –> 00:02:30,080
و سپس من می گویم نقطه قرمز بافته شده و
60
00:02:30,080 –> 00:02:34,000
همان چیزی را برای
61
00:02:34,000 –> 00:02:38,879
فایل صوتی دوک الینگتون و سپس می گویم
62
00:02:38,879 –> 00:02:42,080
دوک بسیار عالی است بنابراین
63
00:02:42,080 –> 00:02:45,200
اینها مسیرهایی هستند که اکنون
64
00:02:45,200 –> 00:02:47,920
می توانم این کار را انجام دهم زیرا مشتری را
65
00:02:47,920 –> 00:02:48,319
66
00:02:48,319 –> 00:02:51,840
در نوت بوک شروع کردم.
67
00:02:52,000 –> 00:02:55,360
اینجا پس در این سطح اینجا خیلی اساسی
68
00:02:55,360 –> 00:02:56,160
y سپس
69
00:02:56,160 –> 00:02:59,280
می توانم به پوشه audio uh دسترسی پیدا کنم
70
00:02:59,280 –> 00:03:01,519
و سپس بدیهی است که
71
00:03:01,519 –> 00:03:02,720
خود فایل مشکلی ندارد،
72
00:03:02,720 –> 00:03:05,280
بنابراین اولین کاری که می خواهیم در اینجا انجام دهیم
73
00:03:05,280 –> 00:03:05,760
این
74
00:03:05,760 –> 00:03:10,080
است که
75
00:03:11,200 –> 00:03:15,040
این بازی را از ipython وارد کنیم ipd
76
00:03:15,040 –> 00:03:18,400
است
77
00:03:18,400 –> 00:03:22,159
و بنابراین این بسته دارای
78
00:03:22,159 –> 00:03:22,560
79
00:03:22,560 –> 00:03:25,680
ابزارهای جالبی است که می توانیم از آنها
80
00:03:25,680 –> 00:03:28,480
استفاده کنیم. مانند گوش دادن به موسیقی اینجا
81
00:03:28,480 –> 00:03:30,159
در نوت بوک jopliton،
82
00:03:30,159 –> 00:03:33,040
بنابراین بیایید نگاهی به این بیندازیم تا صدای
83
00:03:33,040 –> 00:03:34,799
ipd dot را انجام دهیم
84
00:03:34,799 –> 00:03:38,239
و سپس
85
00:03:38,239 –> 00:03:41,840
فایل wc را در اینجا منتقل کنیم و
86
00:03:41,840 –> 00:03:46,480
ناگهان ما پخش کننده صوتی شگفت انگیز خود را
87
00:03:46,480 –> 00:03:49,040
در اینجا داریم. میتوانم
88
00:03:49,040 –> 00:03:50,400
این موسیقی را دوست داشته باشم، اما
89
00:03:50,400 –> 00:03:53,599
بیایید ابتدا موسیقی دیگر
90
00:03:53,599 –> 00:03:56,959
را بارگذاری کنیم، بنابراین یک فایل نقطه قرمز
91
00:03:56,959 –> 00:04:00,480
را اینجا بارگذاری میکنیم و سپس
92
00:04:00,480 –> 00:04:03,840
93
00:04:04,400 –> 00:04:06,400
فایل jig ellington را بارگیری میکنیم، خوب، پس بیایید
94
00:04:06,400 –> 00:04:08,120
به این موسیقی گوش دهیم
95
00:04:08,120 –> 00:04:13,439
[Music]،
96
00:04:13,439 –> 00:04:16,399
پس این یک موسیقی است قطعه ارکستری
97
00:04:16,399 –> 00:04:18,798
به نام
98
00:04:18,959 –> 00:04:22,320
تارهای زیادی در اینجا وجود دارد و همانطور که خواهید
99
00:04:22,320 –> 00:04:23,600
100
00:04:23,600 –> 00:04:26,240
دید اینجا یک نقطه اوج وجود دارد که شدت
101
00:04:26,240 –> 00:04:28,080
آن بالا می رود
102
00:04:28,080 –> 00:04:31,290
و سپس محو می شود
103
00:04:31,290 –> 00:04:34,320
[موسیقی]
104
00:04:34,320 –> 00:04:43,840
بسیار خوب است،
105
00:04:50,639 –> 00:04:52,639
خوب شما ایده را دریافت می کنید و سپس ما
106
00:04:52,639 –> 00:04:54,560
107
00:04:54,560 –> 00:04:58,590
آهنگی از دوک الینگتون داریم که بسیار فنری است. jazzy
108
00:04:58,590 –> 00:05:04,160
[موسیقی]
109
00:05:04,160 –> 00:05:07,600
بسیار عالی است، بنابراین شما دارید
110
00:05:07,600 –> 00:05:09,440
ایده ای که ما
111
00:05:09,440 –> 00:05:12,800
از نظر موسیقی یا نشانه های صوتی
112
00:05:12,800 –> 00:05:15,440
در اینجا با آن سر و کار داریم، بسیار خوب است، بنابراین اکنون می خواهیم
113
00:05:15,440 –> 00:05:16,400
114
00:05:16,400 –> 00:05:20,400
این فایل های wav را با استفاده از یک کتابخانه بارگذاری کنیم و
115
00:05:20,400 –> 00:05:24,080
برای انجام این کار می توانیم از یک
116
00:05:24,080 –> 00:05:26,160
روش اصلی از بورسا استفاده کنیم که به
117
00:05:26,160 –> 00:05:27,440
آن بارگذاری می گویند.
118
00:05:27,440 –> 00:05:31,520
جای تعجب نیست، بنابراین اوم
119
00:05:31,520 –> 00:05:35,440
در اینجا این روش
120
00:05:35,440 –> 00:05:37,600
خود سیگنال را به ما برمی گرداند که در این مورد
121
00:05:37,600 –> 00:05:39,199
ما دقیقاً مانند bc آن را فراخوانی می کنیم
122
00:05:39,199 –> 00:05:41,440
و سپس نرخ نمونه را به ما برمی گرداند
123
00:05:41,440 –> 00:05:42,880
و بنابراین ما یک بارگذاری نقطه لیبروسا را انجام می دهیم و س
124
00:05:42,880 –> 00:05:46,400
125
00:05:46,400 –> 00:05:49,600
س ما اینجا هس
126
00:05:49,600 –> 00:05:52,720
یم باید فایل را ارسال کند،
127
00:05:52,720 –> 00:05:56,000
بنابراین اکنون
128
00:05:56,000 –> 00:05:57,759
تعدادی پارامتر وجود دارد.
129
00:05:57,759 –> 00:05:59,360
130
00:05:59,360 –> 00:06:02,000
131
00:06:02,000 –> 00:06:02,800
132
00:06:02,800 –> 00:06:06,400
133
00:06:06,400 –> 00:06:09,600
134
00:06:09,600 –> 00:06:12,960
در
135
00:06:12,960 –> 00:06:14,880
صورتی که ما اینجا داریم یا منظورم
136
00:06:14,880 –> 00:06:18,520
مقدار پیشفرضی است که librose از آن استفاده میکند
137
00:06:18,520 –> 00:06:21,199
2250 است که یک نرخ نمونهبرداری کاملاً مناسب
138
00:06:21,199 –> 00:06:21,840
139
00:06:21,840 –> 00:06:24,720
برای نیازهای ما است و بنابراین من
140
00:06:24,720 –> 00:06:26,400
آن را تغییر نمیدهم و سپس
141
00:06:26,400 –> 00:06:28,880
گزینه دیگری مانند گزینه دیگری به نام داریم.
142
00:06:28,880 –> 00:06:30,160
مونو که یک است
143
00:06:30,160 –> 00:06:32,479
پارامتر bull بنابراین این مونو میتواند
144
00:06:32,479 –> 00:06:33,600
برابر با true
145
00:06:33,600 –> 00:06:36,160
یا false باشد و اساساً به
146
00:06:36,160 –> 00:06:38,639
کتابخانهها میگوید که چه بخواهیم
147
00:06:38,639 –> 00:06:42,160
فایل صوتی را همانطور که هست بارگذاری کنیم،
148
00:06:42,160 –> 00:06:43,440
میتواند یک فایل استریو
149
00:06:43,440 –> 00:06:46,400
با دو کانال باشد یا مانند بسیاری از
150
00:06:46,400 –> 00:06:47,199
151
00:06:47,199 –> 00:06:50,400
رفتار پیشفرض بارگذاری. این است
152
00:06:50,400 –> 00:06:53,280
که مانیتور دوستداران صوتی را بارگیری کنید و
153
00:06:53,280 –> 00:06:55,120
این کاملاً خوب است و ما
154
00:06:55,120 –> 00:06:58,400
معمولاً با سیگنالهای مونو کار
155
00:06:58,400 –> 00:06:59,440
میکنیم زیرا واقعاً
156
00:06:59,440 –> 00:07:01,759
وقتی با صدای مونو سروکار دارید اطلاعات زیادی را از دست
157
00:07:01,759 –> 00:07:03,120
نمیدهید
158
00:07:03,120 –> 00:07:06,080
در مقایسه با صدای استریو مانند آه
159
00:07:06,080 –> 00:07:08,240
بله. به عنوان مثال،
160
00:07:08,240 –> 00:07:09,919
واضح است که این میتواند از مشکلی
161
00:07:09,919 –> 00:07:11,280
به مشکل دیگر تغییر کند، اما
162
00:07:11,280 –> 00:07:13,599
امروز ما فقط از حالت
163
00:07:13,599 –> 00:07:14,560
پیشفرض یا
164
00:07:14,560 –> 00:07:17,840
مونو استفاده میکنیم، پس حالا بیایید
165
00:07:17,840 –> 00:07:21,360
قرمز داغ را نیز بارگیری کنیم
166
00:07:21,360 –> 00:07:23,360
و در اینجا من از خط زیر استفاده میکنم
167
00:07:23,360 –> 00:07:24,960
زیرا نرخ نمونه را مانند آن خواهیم داشت.
168
00:07:24,960 –> 00:07:26,800
اینجا و همینطور خواهد بود، بنابراین ما
169
00:07:26,800 –> 00:07:27,520
نمی
170
00:07:27,520 –> 00:07:29,759
خواهیم ما به آن متغیر اهمیتی نمی دهیم
171
00:07:29,759 –> 00:07:30,639
اکنون
172
00:07:30,639 –> 00:07:34,080
بسیار خوب، بنابراین اینجا این فایل bc به
173
00:07:34,080 –> 00:07:38,160
فایل قلب قرمز تبدیل می شود
174
00:07:38,160 –> 00:07:42,240
و سپس i duke
175
00:07:42,240 –> 00:07:45,520
را انجام می دهیم و یک بار دیگر این کار را انجام می دهیم librosa dot
176
00:07:45,520 –> 00:07:48,560
load و از اینجا عبور خواهیم کرد در
177
00:07:48,560 –> 00:07:52,160
فایل اوه دوک،
178
00:07:52,160 –> 00:07:55,919
خوب، خوب، پس اکنون ما
179
00:07:55,919 –> 00:07:57,759
همه این افراد را بارگیری کرده ایم، من
180
00:07:57,759 –> 00:08:00,560
فقط با یکی از این موارد با دبوسی کار
181
00:08:00,560 –> 00:08:04,160
خواهم کرد تا به شما موارد مشابهی را نشان دهم،
182
00:08:04,160 –> 00:08:05,919
مانند آنچه بارگذاری کرده ایم، اما پس از آن
183
00:08:05,919 –> 00:08:07,759
زمانی که من میخواهم این را مقایسه کنم، بدیهی است که
184
00:08:07,759 –> 00:08:09,199
اگر میپرسید چند نمونه در سیگنال داریم، همه این سه سیگنال مختلف را از دست
185
00:08:09,199 –> 00:08:09,919
186
00:08:09,919 –> 00:08:12,639
187
00:08:12,639 –> 00:08:13,280
188
00:08:13,280 –> 00:08:16,960
189
00:08:16,960 –> 00:08:18,000
190
00:08:18,000 –> 00:08:21,120
میدهم، بنابراین میتوانیم اندازه نقطهای را انجام دهیم و خواهید دید که ما
191
00:08:21,120 –> 00:08:21,680
این
192
00:08:21,680 –> 00:08:26,240
تعداد نمونه تقریباً 700
193
00:08:26,240 –> 00:08:29,919
000 داریم. نمونهها خوب است، پس حالا اجازه دهید به
194
00:08:29,919 –> 00:08:30,800
195
00:08:30,800 –> 00:08:34,479
مدت زمان یک
196
00:08:34,479 –> 00:08:38,000
نمونه نگاهی بیندازیم، بنابراین این کار را
197
00:08:38,000 –> 00:08:42,320
انجام دهید، اجازه دهید این مدت زمان نمونه را بنامیم
198
00:08:42,320 –> 00:08:45,360
و این برابر است با معکوس
199
00:08:45,360 –> 00:08:48,399
محدوده نمونهبرداری و
200
00:08:48,399 –> 00:08:51,279
اجازه دهید این را چاپ کنیم تا دیدن آن زیباتر شود
201
00:08:51,279 –> 00:08:51,600
202
00:08:51,600 –> 00:08:54,959
و ما بگوییم که
203
00:08:54,959 –> 00:08:58,560
مدت زمان یک نمونه
204
00:08:58,560 –> 00:09:01,680
است و در اینجا ما
205
00:09:01,680 –> 00:09:05,680
از مدت زمان نمونه عبور می کنیم و سپس می خواهیم
206
00:09:05,680 –> 00:09:07,519
مشخص کنیم که ما فقط
207
00:09:07,519 –> 00:09:11,040
شش مقدار اعشاری می خواهیم و این در
208
00:09:11,040 –> 00:09:13,839
ثانیه اشکالی ندارد، بنابراین اجازه دهید به
209
00:09:13,839 –> 00:09:15,600
این و مدت زمان
210
00:09:15,600 –> 00:09:20,399
یک نمونه نگاهی بیندازیم. 0.000
211
00:09:20,399 –> 00:09:23,200
45 ثانیه است، بنابراین این مانند یک نسخه بسیار است y
212
00:09:23,200 –> 00:09:23,600
مدت زمان کوتاه است،
213
00:09:23,600 –> 00:09:26,240
پس حالا چرا
214
00:09:26,240 –> 00:09:28,800
مدت زمان نمونه را خوب می خواهیم زیرا می خواهم
215
00:09:28,800 –> 00:09:32,240
216
00:09:32,240 –> 00:09:36,160
مدت زمان سیگنال صوتی را
217
00:09:36,160 –> 00:09:39,360
بر حسب ثانیه محاسبه کنم خوب است
218
00:09:39,360 –> 00:09:43,040
و بنابراین برای آن باید نسبتی را انجام دهیم
219
00:09:43,040 –> 00:09:46,480
و در اینجا
220
00:09:46,480 –> 00:09:50,720
باید مدت زمان برابر با
221
00:09:50,720 –> 00:09:53,760
مدت زمان نمونه باشد. مدت زمان
222
00:09:53,760 –> 00:09:56,880
یک نمونه را ضرب کنید و
223
00:09:56,880 –> 00:10:00,240
آن را در تعداد کل نمونه هایی که
224
00:10:00,240 –> 00:10:00,640
225
00:10:00,640 –> 00:10:04,000
226
00:10:04,000 –> 00:10:09,600
در سیگنال داریم ضرب کنید و اجازه دهید این را بگیرم تا این
227
00:10:09,600 –> 00:10:13,200
کار را انجام دهم مدت زمان
228
00:10:13,200 –> 00:10:16,800
سیگنال است
229
00:10:16,800 –> 00:10:22,640
و در اینجا از مدت
230
00:10:23,839 –> 00:10:28,399
زمان عبور می کنیم. در اینجا بسیار خوب است
231
00:10:28,399 –> 00:10:30,160
و مدت زمان سیگنال همانطور که
232
00:10:30,160 –> 00:10:32,480
انتظار می رود 30 ثانیه است،
233
00:10:32,480 –> 00:10:35,760
بنابراین این طول
234
00:10:35,760 –> 00:10:37,519
فایل های صوتی است که در حال حاضر با آنها سروکار داریم،
235
00:10:37,519 –> 00:10:39,360
پس اجازه دهید من فقط
236
00:10:39,360 –> 00:10:42,560
روی چند مورد از این کادرها کلیک کنم
237
00:10:42,560 –> 00:10:45,760
زیرا در غیر این صورت کمی بیش از حد به هم
238
00:10:45,760 –> 00:10:48,800
ریخته است. همه چیز خوب است، بنابراین
239
00:10:48,800 –> 00:10:51,200
اکنون ما مدت زمان سیگنال
240
00:10:51,200 –> 00:10:53,120
را می دانیم، بنابراین کاری که من می خواهم در اینجا انجام دهم این
241
00:10:53,120 –> 00:10:56,160
است
242
00:10:56,160 –> 00:10:59,519
که شکل موج ها را تجسم کنم خوب است، بنابراین
243
00:10:59,519 –> 00:11:02,160
چگونه می توانیم این کار را به خوبی انجام دهیم، با توجه به اینکه می
244
00:11:02,160 –> 00:11:04,640
خواهیم کاری کمی دقیق انجام دهیم،
245
00:11:04,640 –> 00:11:05,279
می خواهم
246
00:11:05,279 –> 00:11:08,560
وارد کنم. مت اوه
247
00:11:08,560 –> 00:11:12,720
طرح نقطه جهش pi نمودار
248
00:11:12,720 –> 00:11:15,760
s plt خوب
249
00:11:15,760 –> 00:11:19,839
است، بله، من یک نوع دیگر در اینجا دارم،
250
00:11:19,839 –> 00:11:23,040
بسیار خوب، بنابراین ما یک شکل ایجاد می کنیم و بنابراین
251
00:11:23,040 –> 00:11:24,000
ما
252
00:11:24,000 –> 00:11:27,360
شکل نقطه های نمودار
253
00:11:27,360 –> 00:11:30,320
را انجام می دهیم و در پارامتری به نام اندازه ثابت عبور می کنیم
254
00:11:30,320 –> 00:11:31,200
255
00:11:31,200 –> 00:11:34,320
و این برابر می شود
256
00:11:34,320 –> 00:11:37,680
بله، ما 15 را برای عرض و 17 را
257
00:11:37,680 –> 00:11:40,079
برای ارتفاع قرار می دهیم و اکنون
258
00:11:40,079 –> 00:11:42,000
سه نمودار فرعی متفاوت خواهیم داشت و می
259
00:11:42,000 –> 00:11:42,480
260
00:11:42,480 –> 00:11:45,760
خواهیم شکل موج ها را برای همه
261
00:11:45,760 –> 00:11:46,320
262
00:11:46,320 –> 00:11:49,120
سیگنال های صوتی مختلف روی هم قرار دهیم، اوه به صورت عمودی خوب است، بنابراین
263
00:11:49,120 –> 00:11:50,000
ما یک نمودار فرعی نقطه طرح را انجام می دهیم.
264
00:11:50,000 –> 00:11:53,600
نمودار
265
00:11:53,600 –> 00:11:56,880
و در اینجا می گوییم که
266
00:11:56,880 –> 00:11:59,920
سه ردیف یک ستون می خواهیم و این نمودار
267
00:11:59,920 –> 00:12:00,480
فرعی در
268
00:12:00,480 –> 00:12:04,079
شاخص یک است و بنابراین در اینجا ما i uh را انجام می دهیم
269
00:12:04,079 –> 00:12:07,839
بنابراین در اینجا کاری که می توانیم انجام دهیم این
270
00:12:07,839 –> 00:12:10,959
است که
271
00:12:10,959 –> 00:12:14,240
نمایش نقطه ای librosa
272
00:12:14,240 –> 00:12:17,600
را انجام دهیم و یک موج انجام می دهیم طرح
273
00:12:17,600 –> 00:12:21,519
خوب است و بنابراین در اینجا باید
274
00:12:21,519 –> 00:12:25,680
سیگنال را پاس کنیم و سیگنال در این
275
00:12:25,680 –> 00:12:29,760
مورد اتوبوس ها هستند، بنابراین ابتدا کامپیوتر را در اختیار
276
00:12:29,760 –> 00:12:33,440
خواهیم داشت سپس عنوان نقطه طرح را انجام می دهیم
277
00:12:33,440 –> 00:12:35,920
و عنوان در این مورد
278
00:12:35,920 –> 00:12:36,560
279
00:12:36,560 –> 00:12:39,600
debussy و داده می شود. من می دانم که
280
00:12:39,600 –> 00:12:43,120
این شکل موج
281
00:12:43,120 –> 00:12:45,120
بین 1- و 1 نرمال
282
00:12:45,120 –> 00:12:49,680
می شود، می خواهم محدوده ای را روی um
283
00:12:49,680 –> 00:12:52,880
در محور y تنظیم کنم و آن را
284
00:12:52,880 –> 00:12:56,480
t
285
00:12:59,200 –> 00:13:02,880
باید 1- و 1 باشد.
286
00:13:02,880 –> 00:13:06,240
بسیار خوب، پس
287
00:13:06,240 –> 00:13:10,079
این کار را چند بار تکرار می کنیم،
288
00:13:10,079 –> 00:13:14,800
اما اکنون این برای
289
00:13:15,120 –> 00:13:19,760
اوه قرمز داغ است و بنابراین ما آن را
290
00:13:19,760 –> 00:13:23,279
فلفل قرمز قرمز می نامیم و سپس
291
00:13:23,279 –> 00:13:26,320
همان کار را برای اوه انجام می دهیم دوک
292
00:13:26,320 –> 00:13:27,360
الینگتون
293
00:13:27,360 –> 00:13:30,560
و ما اسمش را می گذاریم g اوه
294
00:13:30,560 –> 00:13:34,000
دوک الینگتون باشه
295
00:13:34,000 –> 00:13:37,200
و در نهایت اینجا یک نمایش نقطه طرح
296
00:13:37,200 –> 00:13:40,000
انجام می دهیم حالا بیایید نگاهی به این بیندازیم اگر
297
00:13:40,000 –> 00:13:41,120
اشتباه نکرده ام
298
00:13:41,120 –> 00:13:44,160
باید نتیجه را ببینیم و در واقع به
299
00:13:44,160 –> 00:13:45,920
هم ریخته ام کمی
300
00:13:45,920 –> 00:13:49,199
بنابراین در اینجا شما مانند تمام
301
00:13:49,199 –> 00:13:52,720
نمودارهای موج um مختلف
302
00:13:52,720 –> 00:13:55,760
Uh مانند روشن در همان نمودار Uh دارید،
303
00:13:55,760 –> 00:13:58,320
درست است، بنابراین ما می خواهیم آن را تغییر دهیم
304
00:13:58,320 –> 00:13:59,279
305
00:13:59,279 –> 00:14:01,680
و به همین دلیل است که ما این نمودار فرعی را داشتیم، بنابراین
306
00:14:01,680 –> 00:14:02,320
در اینجا
307
00:14:02,320 –> 00:14:05,680
این را در شاخص دو و اینجا قرار می دهیم در نمایه
308
00:14:05,680 –> 00:14:06,399
سه نیز
309
00:14:06,399 –> 00:14:09,199
کار دیگری که میخواهم انجام دهم این است که
310
00:14:09,199 –> 00:14:11,440
کمی شفافیت را
311
00:14:11,440 –> 00:14:13,600
در اینجا اضافه کنم زیرا ظاهر آن
312
00:14:13,600 –> 00:14:14,639
زیباتر میشود،
313
00:14:14,639 –> 00:14:19,519
بنابراین در این طرحهای وب،
314
00:14:19,519 –> 00:14:22,399
این کار را انجام
315
00:14:22,399 –> 00:14:23,440
میدهیم.
316
00:14:23,440 –> 00:14:26,720
در اینجا ما طرحهای
317
00:14:26,720 –> 00:14:29,199
موج متفاوتی را برای آهنگ دبوسی
318
00:14:29,199 –> 00:14:30,480
فلفل قرمز تند
319
00:14:30,480 –> 00:14:33,920
و قطعه دوک الینگتون داریم، بنابراین
320
00:14:33,920 –> 00:14:36,480
ما ج با مقایسه این افراد در اینجا به نتیجهگیری میرسیم، مانند آنچه قبلاً
321
00:14:36,480 –> 00:14:38,560
شبیه
322
00:14:38,560 –> 00:14:42,160
بودیم، به طوری که میتوانید به طور کلی مشاهده کنید که
323
00:14:42,160 –> 00:14:45,680
طرح موج bc به نوعی شبیه به
324
00:14:45,680 –> 00:14:49,279
یک پاکت بسیار روان است،
325
00:14:49,279 –> 00:14:52,320
بنابراین در اینجا تقریباً مانند پایدار است،
326
00:14:52,320 –> 00:14:54,079
سپس شما مانند یک
327
00:14:54,079 –> 00:14:57,120
افزایش شدید تنش
328
00:14:57,120 –> 00:15:00,480
و افزایش انرژی در
329
00:15:00,480 –> 00:15:02,079
اینجا، شما نقطه اوج را خواهید داشت و سپس
330
00:15:02,079 –> 00:15:04,079
331
00:15:04,079 –> 00:15:05,839
اگر آن را با
332
00:15:05,839 –> 00:15:07,519
آهنگ فلفل قرمز تند مقایسه کنیم، کاملاً متفاوت است،
333
00:15:07,519 –> 00:15:08,639
زیرا در
334
00:15:08,639 –> 00:15:12,399
اینجا پاکت کلی تمایل دارد به
335
00:15:12,399 –> 00:15:15,040
همان شکل باقی بماند. و این یک ویژگی است
336
00:15:15,040 –> 00:15:16,079
337
00:15:16,079 –> 00:15:19,040
که همیشه اغلب در موسیقی محبوب خواهید یافت و
338
00:15:19,040 –> 00:15:20,160
در اینجا می توانیم
339
00:15:20,160 –> 00:15:23,279
مانند موسیقی پاپ موسیقی راک یا
340
00:15:23,279 –> 00:15:26,959
به عنوان مثال edm در مورد آن صحبت کنیم و در اینجا همچنین متوجه
341
00:15:26,959 –> 00:15:27,360
342
00:15:27,360 –> 00:15:31,120
جهش های خاصی در شکل موج uh
343
00:15:31,120 –> 00:15:33,600
و این اسپک ها خواهید شد. می توانم ببینم که
344
00:15:33,600 –> 00:15:34,480
345
00:15:34,480 –> 00:15:36,800
در زمان های معمولی هستند و همانطور که حدس زدید
346
00:15:36,800 –> 00:15:37,839
این ها
347
00:15:37,839 –> 00:15:41,199
مانند تله ضربه ای هستند، بنابراین کیت درام
348
00:15:41,199 –> 00:15:42,639
درست وارد می شود
349
00:15:42,639 –> 00:15:45,360
و اگر این را با اوه
350
00:15:45,360 –> 00:15:46,240
دوک الینگتون مقایسه
351
00:15:46,240 –> 00:15:48,079
کنیم، کمی شبیه به این
352
00:15:48,079 –> 00:15:49,440
دو خواهید بود. دنیاهای اینجا درست است
353
00:15:49,440 –> 00:15:52,880
و موسیقی کلاسیک و موسیقی راک،
354
00:15:52,880 –> 00:15:54,399
بنابراین تنوع بسیار زیادی
355
00:15:54,399 –> 00:15:55,920
356
00:15:55,920 –> 00:15:59,120
مانند شدت وجود دارد، اما بیشتر
357
00:15:59,120 –> 00:16:02,480
شبیه به میکرو در سطح کلان نیست و
358
00:16:02,480 –> 00:16:05,040
بنابراین اساساً
359
00:16:05,040 –> 00:16:06,480
نکته مهم اینجاست که
360
00:16:06,480 –> 00:16:08,480
وقتی شما دوباره با موسیقی کلاسیک سروکار دارید
361
00:16:08,480 –> 00:16:10,240
که
362
00:16:10,240 –> 00:16:12,320
مشخصاً از سازهای
363
00:16:12,320 –> 00:16:13,440
آکوستیک و عمدتا آکوستیک
364
00:16:13,440 –> 00:16:16,240
استفاده می کند، در این صورت شما
365
00:16:16,240 –> 00:16:17,279
تغییرات زیادی
366
00:16:17,279 –> 00:16:18,720
در شکل موج خواهید داشت در حالی که مانند
367
00:16:18,720 –> 00:16:20,880
موسیقی عامه پسند که بیشتر
368
00:16:20,880 –> 00:16:23,759
شبیه سازهای الکترونیکی الکترونیکی
369
00:16:23,759 –> 00:16:24,480
است
370
00:16:24,480 –> 00:16:26,560
و سپس مانند شکل موج.
371
00:16:26,560 –> 00:16:27,920
372
00:16:27,920 –> 00:16:30,480
بدیهی است که بسته به صدا می تواند مقدار زیادی تغییر کند،
373
00:16:30,480 –> 00:16:31,680
اما
374
00:16:31,680 –> 00:16:33,360
این مانند یک قانون
375
00:16:33,360 –> 00:16:34,800
کلی است، خوب است،
376
00:16:34,800 –> 00:16:37,440
بنابراین اکنون مرحله بعدی که می خواهیم انجام دهیم این
377
00:16:37,440 –> 00:16:38,000
است که
378
00:16:38,000 –> 00:16:41,920
در واقع دامنه دامنه را محاسبه کنیم
379
00:16:41,920 –> 00:16:45,120
380
00:16:45,120 –> 00:16:48,399
خوب است و بنابراین من
381
00:16:48,399 –> 00:16:50,880
یک تابع برای انجام آن ایجاد خواهم کرد که
382
00:16:50,880 –> 00:16:51,920
در واقع دو تابع ایجاد می کنم