در این مطلب، ویدئو کانولوشن پد و گام | آموزش عمیق 25 (Tensorflow2.0، Keras و Python) با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:06:35
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,640 –> 00:00:02,480
2
00:00:02,480 –> 00:00:03,360
3
00:00:03,360 –> 00:00:06,480
اگر به یاد داشته باشید ویدیوی cnn من را به خاطر دارید در این ویدیو می خواهیم در مورد بالشتک کانولوشن و گام
4
00:00:06,480 –> 00:00:07,839
برداری
5
00:00:07,839 –> 00:00:10,559
بحث کنیم که در مورد تشخیص رقم دست نویس بحث
6
00:00:10,559 –> 00:00:11,280
7
00:00:11,280 –> 00:00:14,559
کردیم و
8
00:00:14,559 –> 00:00:17,520
به سه فیلتر یا
9
00:00:17,520 –> 00:00:19,199
آشکارسازهای مختلف
10
00:00:19,199 –> 00:00:22,560
برای رقم 9 رسیدیم
11
00:00:22,560 –> 00:00:24,880
که آشکارساز الگوی حلقه ای بودند که مانند یک
12
00:00:24,880 –> 00:00:27,359
سر است.
13
00:00:27,359 –> 00:00:29,599
آشکارساز خط عمودی رقم نهم که یک قسمت میانی است
14
00:00:29,599 –> 00:00:30,800
15
00:00:30,800 –> 00:00:33,040
و دم که یک فیلتر خط مورب است
16
00:00:33,040 –> 00:00:34,239
17
00:00:34,239 –> 00:00:36,880
و وقتی این فیلتر را اعمال می کنیم چیزی که
18
00:00:36,880 –> 00:00:39,440
پیدا می
19
00:00:39,840 –> 00:00:43,600
کنیم این است که
20
00:00:43,600 –> 00:00:46,399
اندازه ورودی را کمی کاهش می دهیم بنابراین در این
21
00:00:46,399 –> 00:00:47,280
22
00:00:47,280 –> 00:00:49,680
حالت ورودی پنج در هفت بود که با
23
00:00:49,680 –> 00:00:51,920
اعمال فیلتر
24
00:00:51,920 –> 00:00:55,520
سه در سه، نقشه ویژگی سه در پنج را دریافت می کنید
25
00:00:55,520 –> 00:00:59,120
که یک خروجی است و فرمول
26
00:00:59,120 –> 00:01:03,039
m در f به اضافه 1 به n با f به اضافه 1 است
27
00:01:03,039 –> 00:01:06,479
بنابراین در اینجا m بعد این
28
00:01:06,479 –> 00:01:09,840
ورودی فی 7 و
29
00:01:09,840 –> 00:01:12,479
f بعد فیلتر است و اگر ریاضی را انجام دهید،
30
00:01:12,479 –> 00:01:13,439
31
00:01:13,439 –> 00:01:16,320
سه در پنج به دست می آورید، به این می گویند
32
00:01:16,320 –> 00:01:17,119
33
00:01:17,119 –> 00:01:20,240
کانولوشن معتبر یا بالشتک معتبر معتبر
34
00:01:20,240 –> 00:01:24,240
، مشکل این رویکرد این
35
00:01:24,240 –> 00:01:27,360
است که پیکسل های
36
00:01:27,360 –> 00:01:30,960
گوشه
37
00:01:30,960 –> 00:01:33,360
نقش مهمی در تشخیص ویژگی ندارند. به
38
00:01:33,360 –> 00:01:34,799
عنوان مثال این پیکسل را که من با این رنگ هایلایت کرده ام
39
00:01:34,799 –> 00:01:35,680
،
40
00:01:35,680 –> 00:01:39,040
41
00:01:39,040 –> 00:01:42,079
فقط در یک عمل کانولوشن
42
00:01:42,079 –> 00:01:45,280
که این گوشه است شرکت می کند، در حالی که اگر
43
00:01:45,280 –> 00:01:47,040
به این پیکسل نگاه
44
00:01:47,040 –> 00:01:49,040
کنید، می تواند در این
45
00:01:49,040 –> 00:01:50,880
پیچیدگی خاص
46
00:01:50,880 –> 00:01:54,079
و همینطور این رنگ شرکت کند،
47
00:01:54,079 –> 00:01:57,520
بنابراین می بینید که در چندین
48
00:01:57,520 –> 00:01:59,759
هه شرکت می کند. پیچیدگیها و جهتهای چندگانه ویژگی،
49
00:01:59,759 –> 00:02:02,240
بنابراین
50
00:02:02,240 –> 00:02:05,680
این ایدهآل نیست
51
00:02:05,680 –> 00:02:08,959
اساساً پیکسلهای گوشهها
52
00:02:08,959 –> 00:02:12,000
نقش مهمی برای
53
00:02:12,000 –> 00:02:14,800
تشخیص ویژگی در طبقهبندی تصویر شما بازی نمیکنند
54
00:02:14,800 –> 00:02:16,959
تا این مشکل را حل کنیم.
55
00:02:16,959 –> 00:02:18,480
56
00:02:18,480 –> 00:02:21,920
57
00:02:21,920 –> 00:02:23,280
در این مورد
58
00:02:23,280 –> 00:02:26,640
من از یک لایه استفاده می کنم بنابراین
59
00:02:26,640 –> 00:02:30,480
در هر طرف مستطیل
60
00:02:30,480 –> 00:02:33,519
شما یک
61
00:02:33,519 –> 00:02:36,160
ردیف یا یک ستون از پیکسل های خالی مانند
62
00:02:36,160 –> 00:02:37,120
این اضافه می کنیم
63
00:02:37,120 –> 00:02:39,120
و می توانید مقادیری مانند منهای
64
00:02:39,120 –> 00:02:41,040
یک را در اینجا قرار دهید منهای یک
65
00:02:41,040 –> 00:02:43,920
اساساً یک پس زمینه سیاه را نشان می دهد بنابراین منهای
66
00:02:43,920 –> 00:02:44,879
یک در همه جا خوب است
67
00:02:44,879 –> 00:02:46,800
من وقت نداشتم در هر گوشه منهای یک بکشم
68
00:02:46,800 –> 00:02:48,239
اما فقط
69
00:02:48,239 –> 00:02:50,000
70
00:02:50,000 –> 00:02:52,239
وقتی که سه در t را اعمال می کنید منهای یک را در همه جا تصور کنید فیلتر hree
71
00:02:52,239 –> 00:02:53,760
میتوانید از گوشهای شروع کنید
72
00:02:53,760 –> 00:02:57,840
و میتوانید به این شکل بروید،
73
00:02:57,840 –> 00:03:01,120
بنابراین به این ترتیب، حتی
74
00:03:01,120 –> 00:03:04,239
این پیکسل گوشه مانند این منهای
75
00:03:04,239 –> 00:03:07,360
یک نقش زیادی بازی میکند،
76
00:03:07,360 –> 00:03:10,000
زیرا میبینید که در
77
00:03:10,000 –> 00:03:10,720
این یکی کمک میکند،
78
00:03:10,720 –> 00:03:14,400
سپس وقتی این فیلتر به سمت پایین حرکت می کند
79
00:03:14,400 –> 00:03:17,599
در زمان شناسایی این ویژگی ها نقشی را در چندین بار بازی می کند،
80
00:03:17,599 –> 00:03:19,920
81
00:03:19,920 –> 00:03:21,599
82
00:03:21,599 –> 00:03:24,239
اگر به ابعاد
83
00:03:24,239 –> 00:03:26,480
تصویر اصلی پنج در هفت فکر کنید،
84
00:03:26,480 –> 00:03:28,720
اما ما اضافه کردیم که دو ستون و دو
85
00:03:28,720 –> 00:03:30,239
ردیف را ببینید، بنابراین
86
00:03:30,239 –> 00:03:32,159
هفت در نه شد، بنابراین به این توجه کنید.
87
00:03:32,159 –> 00:03:33,840
عدد 5 در
88
00:03:33,840 –> 00:03:38,720
7 بود اما اکنون با بالشتک 1 تبدیل به 7 در 9 می شود
89
00:03:38,720 –> 00:03:41,