در این مطلب، ویدئو آموزش پایتون: مقدمه ای بر داده های صوتی در پایتون با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:04:00
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,000 –> 00:00:02,879
سلام و به این دوره خوش آمدید نام من
2
00:00:02,879 –> 00:00:04,740
دانیل برک است و
3
00:00:04,740 –> 00:00:07,649
برای شروع به کار مربی شما خواهم بود، ابتدا
4
00:00:07,649 –> 00:00:09,510
می خواهیم ببینیم که پردازش گفتار و صدا
5
00:00:09,510 –> 00:00:12,269
با انواع دیگر
6
00:00:12,269 –> 00:00:15,179
پردازش داده ها متفاوت است، مانند سایر انواع داده ها،
7
00:00:15,179 –> 00:00:17,520
فایل های صوتی که وارد می شوند. بسیاری از
8
00:00:17,520 –> 00:00:25,140
فرمتهای مختلف مانند mp3 wav m4a و flak، اما
9
00:00:25,140 –> 00:00:27,269
هر یک از این فرمتها دارای
10
00:00:27,269 –> 00:00:30,510
اندازهگیری استاندارد فرکانس هستند که بر
11
00:00:30,510 –> 00:00:32,729
حسب کیلوهرتز اندازهگیری میشود، اما
12
00:00:32,729 –> 00:00:37,890
به عنوان کیلوهرتز یا نرخ نمونهبرداری نیز نامیده میشود،
13
00:00:37,890 –> 00:00:39,899
دقیقاً مانند اینکه یک فیلم 30 گام در
14
00:00:39,899 –> 00:00:42,270
ثانیه را نشان میدهد که مغز ما ثبت میکند.
15
00:00:42,270 –> 00:00:45,030
تصاویر متحرک است نرخ نمونه برداری
16
00:00:45,030 –> 00:00:47,820
یک فایل صوتی اندازه گیری تعداد
17
00:00:47,820 –> 00:00:51,300
تکه های داده در ثانیه است که برای نمایش
18
00:00:51,300 –> 00:00:54,270
صدای دیجیتال با یک کیلوهرتز
19
00:00:54,270 –> 00:00:57,629
برابر با 1000 قطعه اطلاعات در
20
00:00:57,629 –> 00:01:01,230
ثانیه استفاده می شود، به عنوان مثال آهنگی که شما پخش
21
00:01:01,230 –> 00:01:03,840
می کنید معمولاً نمونه برداری 32 کیلوهرتز دارد.
22
00:01:03,840 –> 00:01:08,549
این یعنی 32000
23
00:01:08,549 –> 00:01:11,909
قطعه اطلاعات در هر ثانیه و
24
00:01:11,909 –> 00:01:15,270
کتاب های صوتی معمولاً بین 8 تا 16
25
00:01:15,270 –> 00:01:18,390
کیلوهرتز هستند که بعداً به برخی از آنها نگاه خواهیم کرد
26
00:01:18,390 –> 00:01:21,570
27
00:01:21,570 –> 00:01:24,450
فایل های صوتی حدس زده شده با داده های جدولی یا متنی متفاوت هستند
28
00:01:24,450 –> 00:01:27,360
زیرا نمی توانید بلافاصله
29
00:01:27,360 –> 00:01:30,990
داده هایی را که با آنها کار می کنید تا
30
00:01:30,990 –> 00:01:32,670
فایل های صوتی زبان گفتاری را به
31
00:01:32,670 –> 00:01:35,280
چیزی که می توانیم ببینیم و دستکاری کنیم، مشاهده کنید.
32
00:01:35,280 –> 00:01:37,740
ابتدا باید فایل صوتی را با
33
00:01:37,740 –> 00:01:41,700
پایتون های داخلی باز کنیم.
34
00:01:41,700 –> 00:01:43,890
ماژول WAV میتوانیم با اجرای فرمان import wave کار با ماژول WAV را شروع
35
00:01:43,890 –> 00:01:48,000
کنیم، اکنون یک
36
00:01:48,000 –> 00:01:48,780
فایل صوتی داریم
37
00:01:48,780 –> 00:01:52,979
38
00:01:52,979 –> 00:01:55,520
صبح بخیر WAV آماده است که شامل شخصی است که کلمات صبح بخیر
39
00:01:55,520 –> 00:01:59,930
برای وا