در این مطلب، ویدئو طبقهبندی تصویر با استفاده از CNN (مجموعه دادههای CIFAR10) | آموزش عمیق 24 (Tensorflow و Python) با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:28:11
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,480 –> 00:00:02,960
در آخرین ویدیو ما به شبکه عصبی کانولوشنال نگاه کردیم،
2
00:00:02,960 –> 00:00:04,640
3
00:00:04,640 –> 00:00:06,560
اگر آن را ندیدهاید، به شدت
4
00:00:06,560 –> 00:00:08,800
توصیه میکنم قبل از
5
00:00:08,800 –> 00:00:10,559
ادامه این ویدیو،
6
00:00:10,559 –> 00:00:12,799
امروز طبقهبندی تصویر
7
00:00:12,799 –> 00:00:14,080
8
00:00:14,080 –> 00:00:17,359
60000 تصویر کوچک را انجام دهیم و این مجموعه
9
00:00:17,359 –> 00:00:19,520
داده از tensorflow میآید. خود کتابخانه به
10
00:00:19,520 –> 00:00:22,240
نام پایگاه داده cifar10
11
00:00:22,240 –> 00:00:24,640
دارای اشیاء مختلفی مانند
12
00:00:24,640 –> 00:00:25,439
13
00:00:25,439 –> 00:00:29,519
میزبان قورباغه کشتی هواپیما و غیره است و ما
14
00:00:29,519 –> 00:00:31,840
طبقه بندی تصاویر را با استفاده از
15
00:00:31,840 –> 00:00:32,880
شبکه عصبی کانولوشن
16
00:00:32,880 –> 00:00:35,280
انجام خواهیم داد بنابراین بلافاصله وارد کدنویسی می شویم
17
00:00:35,280 –> 00:00:36,719
و سپس در
18
00:00:36,719 –> 00:00:38,719
پایان تمرینی برای شما دارم پس مطمئن شوید
19
00:00:38,719 –> 00:00:39,920
شما تا آن زمان تماشا می کنید
20
00:00:39,920 –> 00:00:42,480
و تمرین را خودتان انجام می دهید
21
00:00:42,480 –> 00:00:44,079
مجموعه داده ای که قرار
22
00:00:44,079 –> 00:00:47,440
است در این ویدیو استفاده کنیم دارای 60 000 تصویر
23
00:00:47,440 –> 00:00:51,199
32 در 32 رنگی با سه کانال rgb است
24
00:00:51,199 –> 00:00:52,719
25
00:00:52,719 –> 00:00:55,920
و ما به
26
00:00:55,920 –> 00:00:56,559
یکی از
27
00:00:56,559 –> 00:00:58,480
10 دسته طبقه بندی می کنیم. بنابراین اینها همه 10
28
00:00:58,480 –> 00:01:00,559
دسته ای هستند که ما داریم،
29
00:01:00,559 –> 00:01:03,199
من چندین کتابخانه ضروری را اینجا بارگذاری کرده
30
00:01:03,199 –> 00:01:04,159
ام
31
00:01:04,159 –> 00:01:06,560
و اولین کاری که می خواهم انجام دهم این است
32
00:01:06,560 –> 00:01:09,040
که
33
00:01:09,040 –> 00:01:12,799
پایگاه داده cfar10 را در نوت بوک ژوپیتر خود بارگذاری کنم
34
00:01:12,799 –> 00:01:17,360
تا n شما این روش داده بارگذاری را نام میبرید،
35
00:01:17,360 –> 00:01:20,240
چیزی که به عنوان مقدار برگشتی دریافت میکنید، این است،
36
00:01:20,240 –> 00:01:20,880
بنابراین شما باید
37
00:01:20,880 –> 00:01:25,680
x کرنش y قطار خود را داشته باشید
38
00:01:25,680 –> 00:01:29,439
و سپس x تست سفید،
39
00:01:29,439 –> 00:01:34,640
x طعم و مزه دارید
40
00:01:34,640 –> 00:01:37,680
و من فقط به
41
00:01:37,680 –> 00:01:42,000
سرعت شکل افراطی که میبینید را بررسی میکنم. که
42
00:01:42,000 –> 00:01:45,200
نمونه های آموزشی 50 000 است که
43
00:01:45,200 –> 00:01:48,240
هر نمونه 32 در 32 تصویر است
44
00:01:48,240 –> 00:01:52,240
و سه مورد برای کانال های rgb است
45
00:01:52,240 –> 00:01:57,200
حالا بیایید به تست نگاه کنیم
46
00:01:58,479 –> 00:02:00,719
بنابراین در تست ما 10 000 تصویر داریم بنابراین
47
00:02:00,719 –> 00:02:03,040
این مجموعه داده به نوعی
48
00:02:03,040 –> 00:02:06,479
اندازه مناسبی دارد شما می دانید که خیلی هم نیست. کوچک
49
00:02:06,479 –> 00:02:09,840
اکنون میخواهم هر یک از نمونههای آموزشی را بررسی کنم،
50
00:02:09,840 –> 00:02:10,560
51
00:02:10,560 –> 00:02:14,160
بنابراین وقتی این x train را انجام میدهید،
52
00:02:14,160 –> 00:02:17,200
بیایید بگوییم صفر،
53
00:02:17,200 –> 00:02:20,480
میدانید که این آرایه سه بعدی 32
54
00:02:20,480 –> 00:02:21,760
در 32
55
00:02:21,760 –> 00:02:24,959
را به سه تبدیل میکنید، کانالهای rgb را میشناسید،
56
00:02:24,959 –> 00:02:28,080
اوه، میخواهم سریع
57
00:02:28,080 –> 00:02:31,599
این را ترسیم کنم تا ببینم شما می دانید که این چیز چگونه به
58
00:02:31,599 –> 00:02:32,560
نظر می رسد
59
00:02:32,560 –> 00:02:35,120
بنابراین می توانید روش را انجام دهید. می دانید matplotlib
60
00:02:35,120 –> 00:02:38,480
ما قبلاً به عنوان plt اینجا وارد کرده ایم
61
00:02:38,480 –> 00:02:43,680
و این تابعی به نام i am show دارد
62
00:02:45,760 –> 00:02:48,800
و دریافت می کنید که در واقع یک قورباغه است و
63
00:02:48,800 –> 00:02:51,120
اگر یکی را انجام دهید این یک کامیون است
64
00:02:51,120 –> 00:02:54,160
اما تصویر بسیار بزرگ است بنابراین می خواهم
65
00:02:54,160 –> 00:02:54,480
فقط
66
00:02:54,480 –> 00:02:58,720
اندازه آن را کنترل کنم تصویر
67
00:02:59,360 –> 00:03:01,599
تا بدانید وقتی تصویر کمی
68
00:03:01,599 –> 00:03:02,640
کوچکتر است،
69
00:03:02,640 –> 00:03:05,360
به وضوح می توانید ببینید که این یک کامیون است
70
00:03:05,360 –> 00:03:07,280
و این یک قورباغه است،
71
00:03:07,280 –> 00:03:09,599
فقط برای راحتی کار، من می خواهم
72
00:03:09,599 –> 00:03:10,319
تابعی
73
00:03:10,319 –> 00:03:13,599
به نام نمونه طرح را در اینجا بنویسم و این تا
74
00:03:13,599 –> 00:03:15,360
75
00:03:15,360 –> 00:03:18,879
ع x و y و شاخص را می گی
76
00:03:18,879 –> 00:03:22,239
د و در حال چاپ آن
77
00:03:22,239 –> 00:03:26,560
نمونه تصویر خاص uh، بنابراین در اینجا این خواهد بود
78
00:03:26,560 –> 00:03:29,440
و من می خواهم روی برچسب x
79
00:03:29,440 –> 00:03:30,239
چاپ
80
00:03:30,239 –> 00:03:33,440
81
00:03:33,440 –> 00:03:33,840
82
00:03:33,840 –> 00:03:37,280
83
00:03:37,280 –> 00:03:40,239
84
00:03:40,239 –> 00:03:42,319
کنم.
85
00:03:42,319 –> 00:03:45,680
automobile یک و غیره خواهد بود،
86
00:03:45,680 –> 00:03:49,040
بنابراین من فقط
87
00:03:49,040 –> 00:03:52,879
متغیر لیستی به نام کلاس ها را تعریف می کنم تا
88
00:03:52,879 –> 00:03:54,480
89
00:03:54,480 –> 00:03:57,760
خوب باشد و سپس
90
00:03:57,760 –> 00:04:01,360
می توانیم از این کلاس ها در اینجا
91
00:04:01,360 –> 00:04:04,959
استفاده کنیم.
92
00:04:04,959 –> 00:04:06,080
93
00:04:06,080 –> 00:04:08,510
94
00:04:08,510 –> 00:04:09,920
[موسیقی]
95
00:04:09,920 –> 00:04:13,200
در واقع شما می دانید، پس
96
00:04:13,200 –> 00:04:17,199
بیایید بررسی کنیم که چه چیزی در y وجود دارد،
97
00:04:17,199 –> 00:04:21,519
بنابراین اگر شما شکل نقطه ای
98
00:04:21,519 –> 00:04:24,720
را انجام دهید، 50000 نمونه و
99
00:04:24,720 –> 00:04:26,320
آرایه یک بعدی دریافت خواهید کرد، بنابراین بیایید به
100
00:04:26,320 –> 00:04:29,520
سرعت پنج نمونه اول را بررسی کنیم،
101
00:04:29,520 –> 00:04:32,160
بنابراین آنچه که من متوجه می شوم این است که
102
00:04:32,160 –> 00:04:32,960
اعدادی که می دانید
103
00:04:32,960 –> 00:04:36,320
شش خواهد بود خوب باشد که شش صفر است
104
00:04:36,320 –> 00:04:41,199
یک دو سه چهار پنج شش شش قورباغه است
105
00:04:41,199 –> 00:04:43,840
سپس نه ما دیدیم که یک کشتی است بنابراین
106
00:04:43,840 –> 00:04:44,320
نه یک
107
00:04:44,320 –> 00:04:47,680
کشتی است اما این یک آرایه دو بعدی است
108
00:04:47,680 –> 00:04:49,360
در واقع ما
109
00:04:49,360 –> 00:04:50,639
در اینجا
110
00:04:50,639 –> 00:04:54,400
به آرایه دو بعدی نیاز نداریم زیرا فقط نیاز داریم مستقیم دسته uh
111
00:04:54,400 –> 00:04:57,840
درست است، بنابراین من قصد دارم
112
00:04:57,840 –> 00:05:00,880
این قطار خاص uh y را تغییر شکل
113
00:05:00,880 –> 00:05:03,280
دهم، بنابراین من کاری که انجام خواهم داد این است که همین الان ببینید به
114
00:05:03,280 –> 00:05:06,240
نظر می رسد خوب است،
115
00:05:06,880 –> 00:05:10,160
اکنون انجام خواهم داد اگر در مورد
116
00:05:10,160 –> 00:05:13,919
آرایه های numpy اطلاع دارید، می دانید که برای تغییر شکل
117
00:05:13,919 –> 00:05:16,400
y شما را آموزش می دهد فقط می توانید y train det
118
00:05:16,400 –> 00:05:17,919
reshape
119
00:05:17,919 –> 00:05:20,960
را صدا بزنید و روشی که می خواهید تغییر شکل دهید
120
00:05:20,960 –> 00:05:22,960
بعد اول است که 10 000 است و می خواهید
121
00:05:22,960 –> 00:05:24,000
آن را همانطور که
122
00:05:24,000 –> 00:05:26,000
هست نگه دارید بنابراین وقتی نمی خواهید آن بعد را تغییر
123
00:05:26,000 –> 00:05:29,039
دهید فقط می گویید منهای یک
124
00:05:29,039 –> 00:05:32,080
و بعد دوم آیا
125
00:05:32,080 –> 00:05:35,360
می خواهید این را مسطح کنید، بنابراین به جای
126
00:05:35,360 –> 00:05:38,400
اینکه 6 یک آرایه باشد، یک شش ساده می خواهید،
127
00:05:38,400 –> 00:05:41,120
بنابراین فقط این را خالی می گذارید
128
00:05:41,120 –> 00:05:44,080
و در نتیجه آنچه اتفاق می افتد این است
129
00:05:44,080 –> 00:05:47,440
که اکنون وقتی فایل قطار را انجام می دهید
130
00:05:47,440 –> 00:05:52,240
، می گوید
131
00:05:52,240 –> 00:05:56,479
آه، باید انجام دهم تغییر شکل در واقع خوب است
132
00:05:56,479 –> 00:05:58,960
تا به جای دو بعدی متوجه تفاوت شوید
133
00:05:58,960 –> 00:06:00,240
آرایه onal
134
00:06:00,240 –> 00:06:02,960
در حال حاضر این یک آرایه یک بعدی
135
00:06:02,960 –> 00:06:04,080
کامل است،
136
00:06:04,080 –> 00:06:08,639
بنابراین اکنون به سادگی اگر من
137
00:06:08,639 –> 00:06:11,919
آرایه کلاس هایی مانند این داشته باشم و
138
00:06:11,919 –> 00:06:15,759
اگر درس نهم را
139
00:06:15,759 –> 00:06:19,039
بگذرانم، کامیون خوب می شوم، بنابراین
140
00:06:19,039 –> 00:06:23,360
می توانم از آن شاخص در اینجا استفاده کنم
141
00:06:23,360 –> 00:06:27,759
و آن شاخص y از شاخص
142
00:06:27,759 –> 00:06:30,960
Okay خواهد بود. بنابراین
143
00:06:30,960 –> 00:06:34,319
این y از شاخص خواهد بود و من
144
00:06:34,319 –> 00:06:35,039
این را اجرا می کنم
145
00:06:35,039 –> 00:06:38,960
و حالا وقتی می گویم نمونه طرح
146
00:06:38,960 –> 00:06:42,880
بیایید در نمونه آموزشی خود بگویم
147
00:06:42,880 –> 00:06:45,919
و در اینجا من تمرین y را انجام خواهم
148
00:06:45,919 –> 00:06:48,639
داد ، فرض کنید صفر می دهم بنابراین برای صفر
149
00:06:48,639 –> 00:06:49,599
قورباغه می گیرم ببینید این
150
00:06:49,599 –> 00:06:51,919
برچسب x فقط این را چاپ می کند برچسب خاص
151
00:06:51,919 –> 00:06:53,599
152
00:06:53,599 –> 00:06:58,880
و اگر انجام دادید، فرض
153
00:06:58,880 –> 00:07:01,039
کنید یک کامیون دریافت میکنید، این یک کامیون است
154
00:07:01,039 –> 00:07:02,639
، کشتی نیست، شاید
155
00:07:02,639 –> 00:07:05,039
اشتباه کردم، اما یک کامیون است، بنابراین نه عدد
156
00:07:05,039 –> 00:07:08,400
زده میشود، هشت عدد کشتی است،
157
00:07:08,400 –> 00:07:12,160
بنابراین میتوانید نمونههای مختلف را بررسی کنید
158
00:07:12,160 –> 00:07:14,160
که نمونه این نیز چیست کامیون ببینید
159
00:07:14,160 –> 00:07:18,560
این یک گوزن است و غیره
160
00:07:18,560 –> 00:07:20,880
پس این یک بخش اکتشاف داده سریع است
161
00:07:20,880 –> 00:07:21,759
162
00:07:21,759 –> 00:07:25,120
که ما اکنون انجام
163
00:07:25,120 –> 00:07:28,240
دادیم اوه می خواهیم داده های خود را عادی سازی کنیم که در آموزش
164
00:07:28,240 –> 00:07:29,759
های قبلی خود دیدیم
165
00:07:29,759 –> 00:07:32,319
که هر زمان که
166
00:07:32,319 –> 00:07:33,360
تصویری
167
00:07:33,360 –> 00:07:37,360
داشتید می خواهید تقسیم کنید
168
00:07:37,360 –> 00:07:40,400
مقدار هر پیکسل 255 به دلیل
169
00:07:40,400 –> 00:07:44,160
پیکسل val ue از 0 تا 255
170
00:07:44,160 –> 00:07:47,280
برای هر یک از کانال های rg و b است
171
00:07:47,280 –> 00:07:50,960
و اگر آن را بر 255 تقسیم
172
00:07:50,960 –> 00:07:54,720
کنید، آن را به یک محدوده 0 تا 1 نرمال می کنید،
173
00:07:54,720 –> 00:07:55,759
174
00:07:55,759 –> 00:07:59,840
بنابراین بیایید دوباره سریع این را بررسی کنیم،
175
00:08:01,039 –> 00:08:05,520
می بینید که مقادیر در اینجا 103 59 هستند و
176
00:08:05,520 –> 00:08:06,319
به همین ترتیب بسیار
177
00:08:06,319 –> 00:08:13,520
خوب است. حالا اگر این کار را انجام دهم،
178
00:08:13,520 –> 00:08:16,639
می بینید که این قدرت آرایه numpy است،
179
00:08:16,639 –> 00:08:17,919
فقط می توانید
180
00:08:17,919 –> 00:08:20,800
آن را بر 255 تقسیم کنید، هر عنصر در کل آرایه را تقسیم می کند
181
00:08:20,800 –> 00:08:21,680
،
182
00:08:21,680 –> 00:08:24,840
بنابراین
183
00:08:24,840 –> 00:08:29,599
اکنون می توانم به سادگی بگویم کرنش x
184
00:08:29,599 –> 00:08:33,360
شدید است تقسیم بر 255
185
00:08:34,240 –> 00:08:37,279
طعم بعدی اشکالی ندارد،
186
00:08:39,200 –> 00:08:42,399
بنابراین اکنون مقادیر عادی شده اند،
187
00:08:42,399 –> 00:08:45,440
ابتدا یک شبکه عصبی مصنوعی ساده می سازیم
188
00:08:45,440 –> 00:08:46,800
189
00:08:46,800 –> 00:08:49,040
تا مدل
190
00:08:49,040 –> 00:08:50,240
191
00:08:50,240 –> 00:08:53,200
192
00:08:53,200 –> 00:08:54,080
193
00:08:54,080 –> 00:08:56,399
194
00:08:56,399 –> 00:08:57,920
195
00:08:57,920 –> 00:08:59,920
را آموزش دهیم.
196
00:08:59,920 –> 00:09:01,920
همان
197
00:09:01,920 –> 00:09:06,399
مجموعه داده c par 10، بنابراین من می خواهم از
198
00:09:06,399 –> 00:09:09,360
آن نوت بوک استفاده کنم که در github من در اینجا قرار دارد
199
00:09:09,360 –> 00:09:11,279
و فقط مقداری کد را از آنجا کپی می
200
00:09:11,279 –> 00:09:12,800
کنم،
201
00:09:12,800 –> 00:09:16,320
بنابراین در اینجا ما یک شبکه عصبی مصنوعی ساده ساختیم،
202
00:09:16,320 –> 00:09:17,200
203
00:09:17,200 –> 00:09:19,440
بنابراین این همان شبکه عصبی است. من
204
00:09:19,440 –> 00:09:20,240
خواهم ساخت
205
00:09:20,240 –> 00:09:23,279
و h خوب کار می کند
206
00:09:23,279 –> 00:09:26,240
بنابراین در اینجا
207
00:09:26,800 –> 00:09:30,399
می بینید که بسیار ساده است لایه ورودی
208
00:09:30,399 –> 00:09:32,560
یک لایه مسطح است، اولین
209
00:09:32,560 –> 00:09:35,519
لایه است که شکل 32 در 32 در 3 را می پذیرد
210
00:09:35,519 –> 00:09:37,200
211
00:09:37,200 –> 00:09:40,320
سپس ما دو لایه عمیق داریم که یکی
212
00:09:40,320 –> 00:09:42,640
دارای سه هزار نورون است و دیگری
213
00:09:42,640 –> 00:09:44,399
دارای یک هزار نورون است
214
00:09:44,399 –> 00:09:47,519
و آخرین لایه دارای ده دسته uh است
215
00:09:47,519 –> 00:09:49,120
زیرا ما در مجموع ده
216
00:09:49,120 –> 00:09:50,240
دسته داریم درست ببینید
217
00:09:50,240 –> 00:09:53,519
این مانند 10 است بنابراین وقتی
218
00:09:53,519 –> 00:09:56,640
این شبکه عصبی را آموزش می دهید از
219
00:09:56,640 –> 00:09:59,200
یک شبکه عصبی مصنوعی متراکم با
220
00:09:59,200 –> 00:10:00,959
همه این پارامترها استفاده می کند که
221
00:10:00,959 –> 00:10:03,839
بهینه ساز sgd است و مقدار آنتروپی متقاطع مقوله ای عبوری وجود دارد.
222
00:10:03,839 –> 00:10:05,279
223
00:10:05,279 –> 00:10:08,399
یک ورودی
224
00:10:08,399 –> 00:10:11,760
در آن آموزش به این صورت که من از یک
225
00:10:11,760 –> 00:10:14,240
آنتروپی متقاطع طبقهبندی استفاده میکنم و اگر
226
00:10:14,240 –> 00:10:16,079
میخواهید تفاوت بین
227
00:10:16,079 –> 00:10:20,880
مقولههای طبقهای و پراکنده
228
00:10:20,880 –> 00:10:23,040
را بدانید، ببینید من این تصویر زیبا را دارم که میتواند
229
00:10:23,040 –> 00:10:25,040
شما را توضیح دهد،
230
00:10:25,040 –> 00:10:28,640
بنابراین هر وقت
231
00:10:28,640 –> 00:10:30,720
خواستید اجازه دهید من وارد شوم. حالت ارائه ما،
232
00:10:30,720 –> 00:10:33,360
233
00:10:33,360 –> 00:10:37,839
بنابراین هر زمان که um
234
00:10:38,240 –> 00:10:42,880
y خود را به عنوان یک بردار رمزگذاری شده داغ دارید،
235
00:10:42,880 –> 00:10:45,839
بنابراین فرض کنید که در اینجا ارسال دارید که
236
00:10:45,839 –> 00:10:46,800
شماره نه است
237
00:10:46,800 –> 00:10:48,880
و اگر y شما چیزی شبیه به این است
238
00:10:48,880 –> 00:10:50,640
که i با کدگذاری یک قلب،
239
00:10:50,640 –> 00:10:53,519
شما از آنتروپی متقاطع طبقهای استفاده خواهید کرد،
240
00:10:53,519 –> 00:10:54,399
اما اگر
241
00:10:54,399 –> 00:10:56,399
y مستقیماً یک مقدار باشد که عدد
242
00:10:56,399 –> 00:10:58,000
هشت است، از
243
00:10:58,000 –> 00:11:01,360
آنتروپی متقاطع طبقهای پراکنده در آن
244
00:11:01,360 –> 00:11:03,440
ویدیوی عملکرد gpu استفاده میکنید
245
00:11:03,440 –> 00:11:05,760
که ما آن را به دستهبندی تبدیل کردیم، به همین دلیل
246
00:11:05,760 –> 00:11:07,680
از categorical استفاده
247
00:11:07,680 –> 00:11:11,279
میکنیم اما در اینجا مستقیماً از مقدار استفاده میکنیم.
248
00:11:11,279 –> 00:11:15,200
8 و غیره و به همین دلیل است که
249
00:11:15,200 –> 00:11:17,040
ما در اینجا بعد از آموزش از آنتروپی متقاطع مقولهای پراکنده استفاده میکنیم،
250
00:11:17,040 –> 00:11:19,519
251
00:11:19,680 –> 00:11:22,720
اوه، میبینید که
252
00:11:22,720 –> 00:11:25,920
دقت من فقط پنج جعبه را اجرا میکنم،
253
00:11:25,920 –> 00:11:28,480
اما دقت بسیار پایین است 48 درصد،
254
00:11:28,480 –> 00:11:30,880
255
00:11:30,880 –> 00:11:33,600
وقتی آن را در نمونههای آزمایشی ارزیابی میکنید، 48.58 را در نمونههای آموزشی مشاهده میکنید.
256
00:11:33,600 –> 00:11:35,279
257
00:11:35,279 –> 00:11:38,959
47 درصد است، بنابراین شبکه عصبی مصنوعی
258
00:11:38,959 –> 00:11:39,920
259
00:11:39,920 –> 00:11:43,519
در این مجموعه داده با پنج دوره بسیار بد عمل می کند،
260
00:11:43,519 –> 00:11:43,920
261
00:11:43,920 –> 00:11:47,760
من همچنین
262
00:11:47,760 –> 00:11:48,640
263
00:11:48,640 –> 00:11:51,120
یک گزارش طبقه بندی را در اینجا چاپ کرده ام و این
264
00:11:51,120 –> 00:11:53,279
گزارش طبقه بندی به
265
00:11:53,279 –> 00:11:55,440
یادآوری دقیق نمره f1 در هر یک از
266
00:11:55,440 –> 00:11:56,000
کلاس ها می
267
00:11:56,000 –> 00:11:58,880
دهد، به عنوان مثال این 9 9 همان
268
00:11:58,880 –> 00:12:00,399
کامیون است.
269
00:12:00,399 –> 00:12:03,600
یا یک کشتی ممکن است کشتی نه این یک کامیون است
270
00:12:03,600 –> 00:12:04,560
در واقع مشکلی ندارد،
271
00:12:04,560 –> 00:12:07,920
بنابراین برای کلاس کامیون دقت 59
272
00:12:07,920 –> 00:12:10,880
درصد است فراخوانی 48 درصد است
273
00:12:10,880 –> 00:12:13,279
و می توانید ببینید اگر از
274
00:12:13,279 –> 00:12:15,040
پس زدن دقیق و امتیاز f1 اطلاعی ندارید، این ماتریس ها را
275
00:12:15,040 –> 00:12:15,760
276
00:12:15,760 –> 00:12:18,639
دوباره در این مجموعه آموزشی من مشاهده می کنید
277
00:12:18,639 –> 00:12:19,760
، یک ویدیو در
278
00:12:19,760 –> 00:12:22,079
مورد این شرایط وجود دارد، بنابراین بهتر است اگر
279
00:12:22,079 –> 00:12:24,959
این فیلم ها را به ترتیب تماشا کنید،
280
00:12:24,959 –> 00:12:28,079
اکنون می خواهیم از cnn
281
00:12:28,079 –> 00:12:30,079
uh برای بهبود استفاده کنیم. عملکرد این
282
00:12:30,079 –> 00:12:33,040
مدل چگونه از cnn به خوبی استفاده می کنید
283
00:12:33,040 –> 00:12:37,440
در ویدیوی قبلی ما دیدیم که
284
00:12:37,440 –> 00:12:40,320
cnn بنابراین اجازه دهید من آن ارائه را
285
00:12:40,320 –> 00:12:41,120
اینجا
286
00:12:41,120 –> 00:12:44,800
بکشم تا cnn
287
00:12:44,800 –> 00:12:47,600
چند لایه داشته باشد تا آن لایه ها
288
00:12:47,600 –> 00:12:48,320
289
00:12:48,320 –> 00:12:51,519
معمولاً لایه کانولوشن داشته باشید
290
00:12:51,519 –> 00:12:54,320
سپس شما باید داشته باشید. مقداری که
291
00:12:54,320 –> 00:12:55,440
فعال سازی است و سپس
292
00:12:55,440 –> 00:12:57,920
کشیدن و سپس دوباره مقدار کانولوشن و
293
00:12:57,920 –> 00:12:58,639
کشش
294
00:12:58,639 –> 00:13:01,279
و سپس شما یک شبکه متراکم دارید
295
00:13:01,279 –> 00:13:03,200
بنابراین شبکه متراکم را
296
00:13:03,200 –> 00:13:05,279
در مقابل شبکه متراکم فعلی خود نگه می دارید
297
00:13:05,279 –> 00:13:06,639
تنها کاری که می خواهیم انجام دهیم این
298
00:13:06,639 –> 00:13:09,760
است که مقداری کانولوشن و
299
00:13:09,760 –> 00:13:12,880
یک لایه کششی اضافه کنیم.
300
00:13:12,880 –> 00:13:17,360
بیایید این کار را انجام دهیم، بنابراین اجازه دهید من فقط
301
00:13:17,360 –> 00:13:21,839
این کد را اینجا کپی کنم،
302
00:13:24,000 –> 00:13:28,800
پس اینجا cnn خواهد بود
303
00:13:28,800 –> 00:13:31,120
و
304
00:13:32,160 –> 00:13:36,240
بنابراین شما چند لایه cnn در اینجا
305
00:13:36,240 –> 00:13:40,320
خواهید داشت، خوب و این شبکه متراکم شما خواهد بود،
306
00:13:40,320 –> 00:13:44,079
بنابراین وقتی
307
00:13:44,079 –> 00:13:45,600
در لایه میانی هستید، این کار را نمی کنید.
308
00:13:45,600 –> 00:13:47,360
نیازی به تعیین
309
00:13:47,360 –> 00:13:51,000
شکل نیست زیرا شبکه می تواند آن را به
310
00:13:51,000 –> 00:13:52,560
طور خودکار تشخیص دهد
311
00:13:52,560 –> 00:13:55,120
و فقط برای ساده نگه داشتن چیزها من
312
00:13:55,120 –> 00:13:57,600
فقط یک شبکه متراکم را نگه می
313
00:13:57,600 –> 00:14:00,639
دارم زیرا cnn من
314
00:14:00,639 –> 00:14:02,000
بیشتر کار را انجام می دهد بنابراین به نورون های زیادی نیاز ندارم
315
00:14:02,000 –> 00:14:05,120
و بسیاری از لایه های عمیق بسیار خوب است و
316
00:14:05,120 –> 00:14:07,040
من می خواهم از یک تابع میکس نرم استفاده
317
00:14:07,040 –> 00:14:08,720
کنم
318
00:14:08,720 –> 00:14:10,480
این یکی از عملکردهای فعال سازی محبوب
319
00:14:10,480 –> 00:14:13,279
320
00:14:13,279 –> 00:14:16,399
321
00:14:16,399 –> 00:14:18,880
322
00:14:18,880 –> 00:14:19,760
323
00:14:19,760 –> 00:14:23,680
است. احتمالاتی
324
00:14:23,680 –> 00:14:24,240
مانند
325
00:14:24,240 –> 00:14:26,720
فرض کنید دو کلاس شما کلاس یک است
326
00:14:26,720 –> 00:14:27,279
، فرض کنید