در این مطلب، ویدئو خواندن و تجسم فایل های صوتی در پایتون (ماژول librosa) با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:13:18
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,030 –> 00:00:02,280
سلام بچه ها در این ویدیو می خواهم به
2
00:00:02,280 –> 00:00:04,470
شما نشان دهم که چگونه فایل های خود را در
3
00:00:04,470 –> 00:00:07,580
پایتون بخوانید، این موضوع کاملاً جدید برای من است و
4
00:00:07,580 –> 00:00:09,870
برای این جلسه می خواهم
5
00:00:09,870 –> 00:00:13,710
فقط مفهوم اساسی را به شما نشان دهم که چگونه می توانید با
6
00:00:13,710 –> 00:00:17,580
یک فایل رفتار کنید و بصری سازی کنید. از اینکه
7
00:00:17,580 –> 00:00:23,070
دامنه شما چگونه است و اوکی برای این
8
00:00:23,070 –> 00:00:27,119
درس من از مجموعه داده استفاده می کنم که می توانید
9
00:00:27,119 –> 00:00:30,859
از Monteagle آرام دانلود کنید
10
00:00:30,859 –> 00:00:36,660
حدود 111 مگابایت مصرف شده است و من
11
00:00:36,660 –> 00:00:38,940
این مجموعه داده را در رایانه خود دانلود کرده ام
12
00:00:38,940 –> 00:00:43,110
و همانطور که می بینید در پوشه پروژه من موجود است
13
00:00:43,110 –> 00:00:45,930
و ما به این پوشه بروید و
14
00:00:45,930 –> 00:00:49,260
ما باید مجموعه های فایل های صوتی
15
00:00:49,260 –> 00:00:53,730
a و مجموعه های B را انجام دهیم و به عنوان مثال در مجموعه a
16
00:00:53,730 –> 00:00:58,740
ما 176 فایل صوتی
17
00:00:58,740 –> 00:01:03,390
داریم و در گفتمان Oh بسیار بیشتر
18
00:01:03,390 –> 00:01:08,280
داریم حدوداً بیش از 650 داریم بنابراین برای این
19
00:01:08,280 –> 00:01:10,980
شخص چون ما از مجموعه a زمان بری استفاده می کنیم
20
00:01:10,980 –> 00:01:15,740
و همانطور که می بینید یک
21
00:01:15,740 –> 00:01:20,220
فایل WAV است و اجرا می شود که یک
22
00:01:20,220 –> 00:01:23,690
فایل است. متشکرم
23
00:01:25,970 –> 00:01:33,020
خوب چیزی که شماره یک را مورد حمله قرار می دهد
24
00:01:35,830 –> 00:01:39,490
خوب چیزی گریفن صداهای خاصی را در
25
00:01:39,490 –> 00:01:43,620
پس زمینه انجام می دهد و آخرین مورد
26
00:01:46,579 –> 00:01:50,899
مشکلی ندارد بنابراین مرموز است. واقعا
27
00:01:50,899 –> 00:01:54,750
جالبه چطور چگونه می توانید
28
00:01:54,750 –> 00:02:00,600
این فایل ها و پایتون را تجسم کنید و بیایید شروع کنیم
29
00:02:00,600 –> 00:02:03,799
و در ابتدا ما در حال وارد کردن
30
00:02:03,799 –> 00:02:07,979
ماژول ها و بسته ها هستیم و مانند همیشه ما
31
00:02:07,979 –> 00:02:10,199
numpy مهم برای
32
00:02:10,199 –> 00:02:13,769
محاسبات عددی ما پانداها را برای تولید
33
00:02:13,769 –> 00:02:18,510
فریم های داده ارسال
34
00:02:18,510 –> 00:02:21,720
35
00:02:21,720 –> 00:02:30,299
می کنیم. باید مدل globe را برای
36
00:02:30,299 –> 00:02:36,390
خواندن فایل ها وارد کنیم و از همه مهمتر
37
00:02:36,390 –> 00:02:40,770
باید مدل broza را وارد کنیم و
38
00:02:40,770 –> 00:02:41,310
Broza
39
00:02:41,310 –> 00:02:44,420
یک کتابخانه ویژه برای خواندن و
40
00:02:44,420 –> 00:02:48,480
دستکاری با فایل های صوتی است و شما می توانید
41
00:02:48,480 –> 00:02:53,550
برای نصب مرورگر توسط
42
00:02:53,550 –> 00:02:57,810
ترمینال ویندوز فقط ترمینال را به عنوان
43
00:02:57,810 –> 00:03:00,410
administrator
44
00:03:00,410 –> 00:03:08,210
و سمت راست را اجرا کنید. IP install lib Rosa این
45
00:03:08,210 –> 00:03:10,850
تمام چیزی است که من هنوز نصب کردهام، بنابراین میتوانیم
46
00:03:10,850 –> 00:03:16,100
این درس را ادامه دهیم بله، همه
47
00:03:16,100 –> 00:03:19,490
کتابخانهها وارد شدهاند و بیایید برویم و
48
00:03:19,490 –> 00:03:22,160
مرحله بعدی تنظیم دایرکتوری
49
00:03:22,160 –> 00:03:24,890
برای فایلهای منبع yep
50
00:03:24,890 –> 00:03:30,380
source برای فایلهای منبع است و برای این کار
51
00:03:30,380 –> 00:03:37,390
باید ایجاد کنید. یک متغیر داده و بله
52
00:03:37,390 –> 00:03:44,110
همانطور که به شما نشان دادم صدای ضربان قلب استاندارد آن
53
00:03:44,620 –> 00:03:46,790
54
00:03:46,790 –> 00:03:50,750
که صداهای خوب به نظر می رسد پوشه است و ما در
55
00:03:50,750 –> 00:03:57,560
حال انتخاب مجموعه a برای تنظیم a هستیم و در
56
00:03:57,560 –> 00:04:01,459
مرحله بعدی در بخش باید
57
00:04:01,459 –> 00:04:05,510
تمام فایل های صوتی را از این دایرکتوری
58
00:04:05,510 –> 00:04:09,650
به آرایه فایل ها بخوانیم، بنابراین آرایه
59
00:04:09,650 –> 00:04:15,019
فایل های شما را فراخوانی می کند که ما
60
00:04:15,019 –> 00:04:18,260
از مدل زیر استفاده می کنیم و globe
61
00:04:18,260 –> 00:04:30,010
داده های ما را از دایرکتوری ما می خواند بنابراین با استفاده از +
62
00:04:31,580 –> 00:04:38,740
all فایلهایی که دارای w/e ما هستند،
63
00:04:41,490 –> 00:04:45,780
بیایید سعی کنیم خوب نه دیگران و به عنوان مثال
64
00:04:45,780 –> 00:04:49,669
خانه چند فایل شما را
65
00:04:51,860 –> 00:04:58,770
داشتهایم بله این مشکل است و چرا ما راه صفر داریم
66
00:04:58,770 –> 00:05:05,840
برخی اشتباه میگویند صدای ضربان قلب
67
00:05:08,260 –> 00:05:11,440
من غلط املایی کلر دارم بله
68
00:05:11,440 –> 00:05:17,230
صداهای ضربان قلب و ما به 176 اهمیت میدهیم.
69
00:05:17,230 –> 00:05:22,060
فایلهای صوتی موجود در آرایه ما خوب است
70
00:05:22,060 –> 00:05:25,600
و قدم بعدی خواندن اولین
71
00:05:25,600 –> 00:05:28,420
فایل صوتی و ایجاد یک آرایه زمانی و
72
00:05:28,420 –> 00:05:31,210
آرایه زمانی است که میتوانیم یک خط زمانی
73
00:05:31,210 –> 00:05:35,050
برای فایل صوتی تکی فراخوانی کنیم و بسیار خوب، بیایید این کار
74
00:05:35,050 –> 00:05:42,270
را در اینجا انجام دهیم
75
00:05:42,270 –> 00:05:47,920
فرکانس بر حسب ثانیه برای این رابطه
76
00:05:47,920 –> 00:05:50,800
با پردازنده، پردازنده
77
00:05:50,800 –> 00:05:54,510
فایل صوتی ما را
78
00:05:56,450 –> 00:06:01,620
به این صورت بارگذاری می کند، بنابراین بسیار خوب، بیایید سعی کنیم
79
00:06:01,620 –> 00:06:05,160
اولین فایل صوتی را از آرایه بخوانیم
80
00:06:05,160 –> 00:06:07,380
و اولی برابر با صفر شاخص
81
00:06:07,380 –> 00:06:14,010
صفر و جدول زمانی برابر با هیچ است.
82
00:06:14,010 –> 00:06:20,430
ترتیب کراوات از صفر است
83
00:06:20,430 –