در این مطلب، ویدئو آموزش 30 – پردازش اولیه تصویر با استفاده از opencv در پایتون با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:13:38
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,000 –> 00:00:02,700
سلام به همه خوش آمدید به آموزش 30 از
2
00:00:02,700 –> 00:00:04,560
3
00:00:04,560 –> 00:00:07,470
سری آموزش های مقدماتی Python برای پردازش تصویر ما در حال حاضر در این
4
00:00:07,470 –> 00:00:08,580
آموزش قصد دارم یک
5
00:00:08,580 –> 00:00:12,210
نمای کلی از کتابخانه OpenCV ارائه دهم در واقع
6
00:00:12,210 –> 00:00:13,889
چند کار اساسی پردازش تصویر
7
00:00:13,889 –> 00:00:16,410
را با استفاده از کتابخانه OpenCV
8
00:00:16,410 –> 00:00:17,880
در آموزش قبلی توضیح خواهم داد.
9
00:00:17,880 –> 00:00:21,240
آموزش شماره 29 من به
10
00:00:21,240 –> 00:00:24,000
بررسی کلی تصویر روانی یا اصول
11
00:00:24,000 –> 00:00:26,430
اولیه تصویر روانی پرداختم و اینها دو
12
00:00:26,430 –> 00:00:28,199
کتابخانه اصلی برای پردازش
13
00:00:28,199 –> 00:00:31,830
تصویر تصویر روانی هستند و CV باز اکنون CV باز
14
00:00:31,830 –> 00:00:35,070
یک کتابخانه شگفت انگیز برای
15
00:00:35,070 –> 00:00:37,460
نوع بینایی ماشین است که روی تصاویر عالی کار می کند.
16
00:00:37,460 –> 00:00:40,200
17
00:00:40,200 –> 00:00:42,780
اگر بخواهید ویدیوها به خصوص ویدیوهای بلادرنگ،
18
00:00:42,780 –> 00:00:44,820
توسعه زیادی در CV باز انجام شده است و در
19
00:00:44,820 –> 00:00:46,739
درجه اول فکر میکنم در ابتدا
20
00:00:46,739 –> 00:00:50,250
به عنوان یک کتابخانه C یا C++ شروع شد، اما
21
00:00:50,250 –> 00:00:52,230
البته پایتون وجود دارد که در پایتون در دسترس است
22
00:00:52,230 –> 00:00:54,750
تا ما از آن استفاده کنیم. پرش
23
00:00:54,750 –> 00:00:57,800
به عنکبوت تا بتوانیم به
24
00:00:57,800 –> 00:01:00,750
چند اصل از CV باز نگاهی بیندازیم و دوباره همانطور
25
00:01:00,750 –> 00:01:02,430
که در آخرین آموزش ذکر کردم
26
00:01:02,430 –> 00:01:05,220
قصد دارم بیشتر در مورد open توضیح دهم. CV
27
00:01:05,220 –> 00:01:08,189
در آموزشهای آینده زمانی که
28
00:01:08,189 –> 00:01:10,439
بیشتر بر روی برنامه یا کار تمرکز میکنیم
29
00:01:10,439 –> 00:01:12,420
تا روی خود کتابخانه،
30
00:01:12,420 –> 00:01:14,460
یعنی اگر میخواهیم
31
00:01:14,460 –> 00:01:18,119
هموارسازی گاوسی یا تشخیص لبه را انجام دهیم،
32
00:01:18,119 –> 00:01:20,070
کتابخانههای مناسب را پیدا میکنیم، چه
33
00:01:20,070 –> 00:01:23,400
تصویر کیت Sai باشد یا C B را باز کنیم. بنابراین
34
00:01:23,400 –> 00:01:27,330
فعلاً بیایید روی رزومه باز تمرکز کنیم و طبق معمول
35
00:01:27,330 –> 00:01:29,340
من ما را کپی کردم، چند
36
00:01:29,340 –> 00:01:31,610
خط کد را قبلاً نوشته ام، بنابراین اجازه دهید ادامه دهم و
37
00:01:31,610 –> 00:01:35,100
سعی کنم آنها را کپی و جایگذاری کنم و
38
00:01:35,100 –> 00:01:37,950
خط به خط آنها را توضیح دهم تا یادداشت برداری کنم تا
39
00:01:37,950 –> 00:01:39,990
مطمئن شوم که صحبت کرده ام. در مورد آن وقتی که دارم این را
40
00:01:39,990 –> 00:01:42,509
توضیح می دهم همانطور که قبلاً گفتم
41
00:01:42,509 –> 00:01:45,119
ذکر کردم این یک کتابخانه برای توابع برنامه نویسی
42
00:01:45,119 –> 00:01:48,149
برای بینایی کامپیوتر است، خوب
43
00:01:48,149 –> 00:01:52,500
CV را باز کنید و بیایید وارد شویم و ببینیم اکنون
44
00:01:52,500 –> 00:01:55,680
اول از همه برای نصب OpenCV برو جلو
45
00:01:55,680 –> 00:02:00,060
و پیپ نصب OpenCV – python خوب است
46
00:02:00,060 –> 00:02:02,610
درست مثل psicic image برای نصب آن
47
00:02:02,610 –> 00:02:05,579
را روانی انجام می دهید – image اما وقتی از
48
00:02:05,579 –> 00:02:07,950
آن استفاده می کنید از SK image استفاده می کنید وقتی آن را وارد می
49
00:02:07,950 –> 00:02:09,869
کنید با Open CV در هنگام نصب همان چیزی است
50
00:02:09,869 –> 00:02:12,840
که pip install OpenCV – python
51
00:02:12,840 –> 00:02:14,129
اما وقتی وارد
52
00:02:14,129 –> 00:02:18,599
می کنید با فراخوانی import آن را وارد می کنید cv2 این
53
00:02:18,599 –> 00:02:22,530
مخفف CV باز است – خوب پس CV – حالا برای
54
00:02:22,530 –> 00:02:24,749
خواندن دوباره یک تصویر، خواندن یک
55
00:02:24,749 –> 00:02:26,760
عکس را در مورد خواندن تصاویر در
56
00:02:26,760 –> 00:02:28,650
موضوعات قبلی پوشش دادم، بنابراین نمیخواهم
57
00:02:28,650 –> 00:02:30,629
زمان زیادی روی این موضوع بگذارم، بنابراین برای خواندن تصویری
58
00:02:30,629 –> 00:02:33,230
که میخواهیم CV را تا نقطه M بخوانید و
59
00:02:33,230 –> 00:02:36,689
هر مسیر تصویری که باشد و
60
00:02:36,689 –> 00:02:40,230
مقدار 1 را انجام دهید به این معنی است که آن را با رنگ خوب بخوانید
61
00:02:40,230 –> 00:02:43,950
بنابراین من این را در زیر تصاویر به شما نشان می دهم
62
00:02:43,950 –> 00:02:47,189
باید یک تصویر به نام RGB Y dot jpg داشته باشم، خوب
63
00:02:47,189 –> 00:02:48,980
این چیزی است که ما در تلاشیم خواندن و
64
00:02:48,980 –> 00:02:53,280
رنگ BGR است نه RGB و
65
00:02:53,280 –> 00:02:55,319
ذکر این نکته بسیار مهم است زیرا اگر من
66
00:02:55,319 –> 00:02:58,590
PLT را انجام دهم آن کتابخانه را وارد نکرده ام
67
00:02:58,590 –> 00:03:03,230
پس بیایید جلوتر برویم و این کار را از
68
00:03:03,230 –> 00:03:09,750
matplotlib import pie نمودار به صورت PLT
69
00:03:09,750 –> 00:03:11,879
انجام دهیم، بنابراین وقتی این کار را انجام دادیم اکنون می توانیم در واقع PLT
70
00:03:11,879 –> 00:03:15,419
dot m نشان می دهد که ما می خواهیم چه چیزی را نشان دهیم IMG
71
00:03:15,419 –> 00:03:18,120
خوب بیایید ادامه دهیم و این خطوط را فعلا اجرا کنیم،
72
00:03:18,120 –> 00:03:22,049
بنابراین اکنون می توانید تصویر اصلی من را ببینید
73
00:03:22,049 –> 00:03:27,599
این تصویر اصلی من است
74
00:03:27,599 –> 00:03:30,540
چیزی که به من نشان می دهد این است که به این معنی است
75
00:03:30,540 –> 00:03:33,659
که آبی من قرمز شده است. قرمز چشمک زن آبی
76
00:03:33,659 –> 00:03:36,750
سبز سبز است زرد من هر چه برعکس قرمز شد تبدیل شد
77
00:03:36,750 –> 00:03:39,120
و مخلوط آبی
78
00:03:39,120 –> 00:03:42,239
بسیار خوب است، بنابراین این یک چیز کلیدی است که
79
00:03:42,239 –> 00:03:44,849
باید در مورد OpenCV به خاطر بسپارید،
80
00:03:44,849 –> 00:03:48,720
اگر می خواهید تصاویر را به صورت BG R می خواند نه RGB،
81
00:03:48,720 –> 00:03:50,370
می توانید آن را تغییر دهید، می توانید آن را
82
00:03:50,370 –> 00:03:54,209
به gr به RGB تغییر دهید و سپس اگر شما را
83
00:03:54,209 –> 00:03:56,430
راحت می کند. این
84
00:03:56,430 –> 00:03:58,500
اشکالی ندارد، من فکر می کنم تمام تلاش ما این است که
85
00:03:58,500 –> 00:04:00,540
پردازش تصویر را انجام دهیم و
86
00:04:00,540 –> 00:04:03,629
شما اگر با CV باز پایبند باشید، مشکلی ندارید، بنابراین این
87
00:04:03,629 –> 00:04:06,599
یک نکته است و بیایید جلوتر برویم و اندازه تصاویرمان را تغییر
88
00:04:06,599 –> 00:04:09,569
دهیم، خوب است، به طوری که اندازه شما را تغییر دهید.
89
00:04:09,569 –> 00:04:13,560
تصویر در رزومه باز تغییر اندازه نقطه v2 را ببینید اشکالی
90
00:04:13,560 –> 00:04:15,049
91
00:04:15,049 –> 00:04:18,209
ندارد البته می توانید تغییر اندازه را
92
00:04:18,209 –> 00:04:21,418
از CV باز وارد کنید اما اوم این
93
00:04:21,418 –> 00:04:24,240
هم مشکلی ندارد بنابراین من این تصویر تغییر اندازه
94
00:04:24,240 –> 00:04:26,760
را به عنوان تغییر اندازه ذخیره می کنم و این تغییر اندازه نقطه si v2 است
95
00:04:26,760 –> 00:04:27,630
و
96
00:04:27,630 –> 00:04:30,390
ما اندازه را تغییر می دهیم این آرایه ناقص به نام IMG
97
00:04:30,390 –> 00:04:32,570
و ادامه دهید و به
98
00:04:32,570 –> 00:04:34,890
اسناد تغییر اندازه نگاه کنید تا ببینید
99
00:04:34,890 –> 00:04:38,310
واقعاً چه چیزی به عنوان آرگومان وارد می شود، به
100
00:04:38,310 –> 00:04:41,940
عنوان مثال FX و FY بر اساس چه فاکتوری
101
00:04:41,940 –> 00:04:43,860
می خواهید اندازه آن را تغییر دهید، بنابراین من می خواهم
102
00:04:43,860 –> 00:04:46,590
اندازه آن را 2 برابر تغییر دهم که به این معنی
103
00:04:46,590 –> 00:04:48,120
است که تصویر خروجی
104
00:04:48,120 –> 00:04:51,210
من 2 برابر بزرگتر خواهد شد بازنویسی
105
00:04:51,210 –> 00:04:52,650
تصویر چگونه میخواهید این
106
00:04:52,650 –> 00:04:54,900
پیکسلهای اضافی را که اضافه میکنیم با
107
00:04:54,900 –> 00:04:58,410
درونیابی با استفاده از inter cubic okay پر کنید، بنابراین
108
00:04:58,410 –> 00:05:00,120
این خط اساساً به این معنی است
109
00:05:00,120 –> 00:05:02,820
و سپس من میخواهم از
110
00:05:02,820 –> 00:05:04,950
عکس اصلی و تغییر اندازه مطمئن شوم، بنابراین اجازه دهید ادامه دهیم
111
00:05:04,950 –> 00:05:08,190
و آن را اجرا کنیم. این عکس تغییر اندازه من است
112
00:05:08,190 –> 00:05:11,070
و این تصویر اصلی ورودی من است،
113
00:05:11,070 –> 00:05:14,040
بنابراین این تصویر 2 در 2 4 برابر بزرگتر
114
00:05:14,040 –> 00:05:17,130
از تصویر ورودی من است، بنابراین
115
00:05:17,130 –> 00:05:19,770
اندازه شما اینگونه تغییر می کند و دوباره من از PLT استفاده نمی
116
00:05:19,770 –> 00:05:22,080
کنم اما از CV برای نشان دادن نقطه M استفاده می کنم. برای اینکه
117
00:05:22,080 –> 00:05:24,060
به این تصاویر نگاهی بیندازم تا بتوانم آنها را
118
00:05:24,060 –> 00:05:26,280
به وضوح ببینم، در ضمن وقتی
119
00:05:26,280 –> 00:05:29,400
واقعاً آن را در CV باز باز می کنم، رنگ ها رنگ های
120
00:05:29,400 –> 00:05:31,470
صحیح هستند در اینجا می بینید که
121
00:05:31,470 –> 00:05:34,110
مانند این رنگ ها نیستند، به این دلیل است که من
122
00:05:34,110 –> 00:05:37,130
از CV باز و باز استفاده می کنم. CV می داند که چگونه
123
00:05:37,130 –> 00:05:39,840
تصاویر BGR را درک کند، به همین دلیل است که اگر
124
00:05:39,840 –> 00:05:42,480
با یک CV باز بمانید، وقتی
125
00:05:42,480 –> 00:05:44,190
با تصاویر رنگی سروکار دارید خوب هستید، اما
126
00:05:44,190 –> 00:05:45,870
رنگ کاملاً درست نسبی است، منظورم این است که اگر
127
00:05:45,870 –> 00:05:47,670
رنگ برای شما معنایی دارد، پس
128
00:05:47,670 –> 00:05:50,910
دقت کنید بسیار خوب است، بنابراین مرحله بعدی. این است که
129
00:05:50,910 –> 00:05:54,690
بیایید جلو برویم و یک کار سرگرم کننده انجام
130
00:05:54,690 –> 00:05:59,280
دهیم چه جالب است بیایید این تصویر را بخوانیم
131
00:05:59,280 –> 00:06:02,550
این تصویر RGB Y بیایید به آن بچسبیم و
132
00:06:02,550 –> 00:06:05,070
سپس به شکل این
133
00:06:05,070 –> 00:06:07,290
تصویر نگاه کنیم خوب پس بیایید جلوتر برویم و شکل را چاپ کنیم
134
00:06:07,290 –> 00:06:09,630
شکل این تصویر 586 در
135
00:06:09,630 –> 00:06:14,460
415 در 3 است.
136
00:06:14,460 –> 00:06:18,720
حالا به گوشه بالا سمت چپ نگاه کنید، من فقط میتوانم 0 در 0 را انجام دهم
137
00:06:18,720 –> 00:06:20,460
که همیشه بالا سمت چپ است،
138
00:06:20,460 –> 00:06:23,550
بنابراین بالا سمت چپ چاپ کنید و سپس
139
00:06:23,550 –> 00:06:26,100
مقادیر پیکسلها را در بالا
140
00:06:26,100 –> 00:06:26,610
سمت چپ چاپ میکند،
141
00:06:26,610 –> 00:06:29,370
خوب، مقادیر 38 و 3 هستند، بنابراین
142
00:06:29,370 –> 00:06:35,010
اغلب دوباره آبی است. BGR مقدار 3 از 3
143
00:06:35,010 –> 00:06:36,740
به رنگ سبز و 0 به رنگ قرمز است،
144
00:06:36,740 –> 00:06:40,250
خوب حالا اینجا میتوانید در واقع
145
00:06:40,250 –> 00:06:43,190
میتوانید 586 را ببخشید برای 15 یا چیزی دیگر، اما
146
00:06:43,190 –> 00:06:45,919
بیایید این خط بالا سمت راست را اجرا
147
00:06:45,919 –> 00:06:48,979
کنیم تا بالا سمت راست همان چیزی باشد که
148
00:06:48,979 –> 00:06:51,979
زرد بالا سمت راست ا