در این مطلب، ویدئو بیایید یک پروژه Computer Vision را با پایتون و Opencv در تلفن کدنویسی کنیم با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:39:07
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,080 –> 00:00:01,839
اوه، اینها کل
2
00:00:01,839 –> 00:00:04,640
پروژه های بینایی کامپیوتری هستند که به طور کامل با تلفن پایتون نوشته شده اند
3
00:00:04,640 –> 00:00:06,960
،
4
00:00:06,960 –> 00:00:09,280
سلام به این ویدیوی جدید خوش آمدید،
5
00:00:09,280 –> 00:00:10,480
نام من سرجیو است، من یک
6
00:00:10,480 –> 00:00:12,960
توسعه دهنده و مشاور بینایی کامپیوتر هستم و به
7
00:00:12,960 –> 00:00:15,599
شرکت های آزاد و دانشجویان کمک می کنم تا امروز به
8
00:00:15,599 –> 00:00:17,359
راحتی و کارآمد پروژه های بینایی کامپیوتر را بسازند.
9
00:00:17,359 –> 00:00:19,680
10
00:00:19,680 –> 00:00:21,520
ما یک پروژه یک پروژه بینایی کامپیوتری را
11
00:00:21,520 –> 00:00:24,800
از ابتدا با استفاده از تلفن می سازیم،
12
00:00:24,800 –> 00:00:27,439
بنابراین می خواهم نشان دهم که
13
00:00:27,439 –> 00:00:29,359
اگر به اینترنت دسترسی داشته باشید، همه چیز حتی با یک تلفن امکان پذیر است
14
00:00:29,359 –> 00:00:31,439
و ما
15
00:00:31,439 –> 00:00:33,520
یک پروژه ساده خواهیم ساخت که در آن
16
00:00:33,520 –> 00:00:36,239
یک تصویر ما اشیایی را که در تصویر هستند شناسایی می کنیم،
17
00:00:36,239 –> 00:00:37,760
بنابراین اگر افراد
18
00:00:37,760 –> 00:00:40,160
وجود داشته باشند، اگر کامپیوتر یا چیزهای دیگر وجود داشته
19
00:00:40,160 –> 00:00:42,079
باشد، این برنامه به
20
00:00:42,079 –> 00:00:43,840
طور خودکار گزارشی از
21
00:00:43,840 –> 00:00:45,520
تصویر ایجاد می کند، بنابراین چیزی
22
00:00:45,520 –> 00:00:48,079
شبیه به این را در این تصویر می گوید، دو مورد وجود دارد.
23
00:00:48,079 –> 00:00:50,800
لپتاپهای سه نفره و غیره و سپس
24
00:00:50,800 –> 00:00:52,559
یک فایل متنی را ذخیره
25
00:00:52,559 –> 00:00:55,120
میکنیم که تصویر را توصیف میکند و
26
00:00:55,120 –> 00:00:59,840
همه کارها را در حال حاضر انجام میدهیم، بنابراین بیایید
27
00:01:00,399 –> 00:01:02,320
یک یادداشت خیلی سریع انجام دهیم. برای گوشی
28
00:01:02,320 –> 00:01:03,920
، مهم نیست که کدام گوشی را
29
00:01:03,920 –> 00:01:05,519
دارید تا زمانی که مرورگر دارید و
30
00:01:05,519 –> 00:01:07,040
به اینترنت دسترسی دارید، بنابراین آیا
31
00:01:07,040 –> 00:01:08,960
آیفون اندرویدی دارید و سپس
32
00:01:08,960 –> 00:01:11,520
هر مرورگری را که دارید، خوب است
33
00:01:11,520 –> 00:01:13,200
و آماده هستید و اکنون
34
00:01:13,200 –> 00:01:15,119
بیایید همه چیز را دقیقاً در اینجا دنبال کنیم چه
35
00:01:15,119 –> 00:01:17,200
اتفاقی می افتد من همه چیز را
36
00:01:17,200 –> 00:01:19,520
در زمان واقعی نشان می دهم اول از همه به
37
00:01:19,520 –> 00:01:22,400
مرورگر می رویم ، یک برگه جدید باز
38
00:01:22,400 –> 00:01:24,640
می کنیم و به Google call up دسترسی
39
00:01:24,640 –> 00:01:26,640
خواهیم داشت و تماس خواهیم گرفت یک سرویس رایگان ارائه شده
40
00:01:26,640 –> 00:01:29,439
توسط گوگل است که در آن ما می توانیم کد پایتون خود
41
00:01:29,439 –> 00:01:30,320
را به صورت
42
00:01:30,320 –> 00:01:31,520
آنلاین
43
00:01:31,520 –> 00:01:32,560
44
00:01:32,560 –> 00:01:34,880
45
00:01:35,079 –> 00:01:36,640
بنویسیم و آن colab.research.google.com است، بنابراین شما باید
46
00:01:36,640 –> 00:01:37,720
47
00:01:37,720 –> 00:01:40,479
code.research.google.com را تایپ کنید و سپس اجازه دهید
48
00:01:40,479 –> 00:01:41,439
اینتر را در اینجا فشار دهید،
49
00:01:41,439 –> 00:01:43,840
50
00:01:45,600 –> 00:01:48,720
اکنون می توانیم هر کدام را انتخاب کنیم
51
00:01:48,720 –> 00:01:51,439
اگر شما نوتبوکهای قدیمیتری داریم، میتوانیم از
52
00:01:51,439 –> 00:01:53,759
آنها استفاده کنیم، بنابراین اگر قبلاً پروژهای را
53
00:01:53,759 –> 00:01:56,000
انجام دادهاید، میتوانید پروژههای خود را ببینید،
54
00:01:56,000 –> 00:01:57,360
55
00:01:57,360 –> 00:01:59,520
حتی اگر آنها را با رایانه نوشتهاید،
56
00:01:59,520 –> 00:02:02,000
یا میتوانیم پروژه جدید خود را شروع کنیم، بنابراین من
57
00:02:02,000 –> 00:02:05,200
به هر حال برای دسترسی به نوتبوک جدید میروم.
58
00:02:05,200 –> 00:02:07,920
اگر دارید باید یک اکانت گوگل
59
00:02:07,920 –> 00:02:09,520
داشته باشید یک جیمیل که مطمئناً یک
60
00:02:09,520 –> 00:02:10,878
حساب Google
61
00:02:10,878 –> 00:02:13,200
دارید اگر ندارید می توانید آن را بسازید
62
00:02:13,200 –> 00:02:15,280
و کاملاً رایگان است
63
00:02:15,280 –> 00:02:17,040
، حساب رایگان است و استفاده از
64
00:02:17,040 –> 00:02:20,000
سرویس ستون گوگل که من در
65
00:02:20,000 –> 00:02:22,560
حال حاضر از
66
00:02:22,560 –> 00:02:25,280
آن استفاده می کنم رایگان است، بنابراین چند ثانیه طول می کشد. برای
67
00:02:25,280 –> 00:02:30,000
اجرای نوت بوک، پس صبر
68
00:02:30,640 –> 00:02:33,440
کنیم، این همان چیزی است که یک نوت بوک به نظر می
69
00:02:33,440 –> 00:02:36,480
رسد، یک صفحه خالی است که در آن سلولی داریم
70
00:02:36,480 –> 00:02:38,879
که می توانید سلول را با دکمه پخش
71
00:02:38,879 –> 00:02:40,720
که همانجا می بینید، بشناسید، زیرا اینجاست که
72
00:02:40,720 –> 00:02:43,120
می توانیم کد پایتون را اجرا کنیم تا
73
00:02:43,120 –> 00:02:46,560
به نظر برسد. چیزی شبیه به این را چاپ می
74
00:02:46,560 –> 00:02:49,840
کنم و سپس مانند
75
00:02:49,840 –> 00:02:53,599
ابتدایی ترین کد پایتون را اجرا می کنم مانند hello
76
00:02:53,599 –> 00:02:55,920
و سپس اجازه دهید این یکی را ببندیم و
77
00:02:55,920 –> 00:02:58,720
اکنون می خواهم این را چاپ کنم تا اجرا شود و
78
00:02:58,720 –> 00:03:00,560
اکنون سلولی را خواهید دید
79
00:03:00,560 –> 00:03:03,040
که قرار است اجرا
80
00:03:03,040 –> 00:03:05,519
در اولین اجرا کمی طول می کشد
81
00:03:05,519 –> 00:03:07,040
تا اجرا شود زیرا اول از همه
82
00:03:07,040 –> 00:03:09,760
یک حافظه را اختصاص می دهد بنابراین به
83
00:03:09,760 –> 00:03:13,040
شما فضایی می دهد که می بینید یک رم و دیسک ظاهر شده است
84
00:03:13,040 –> 00:03:15,040
و اکنون بعداً همه چیز بسیار
85
00:03:15,040 –> 00:03:19,360
سریعتر می شود بنابراین ما کد سلام را
86
00:03:19,360 –> 00:03:22,239
می بینیم. این را ببندید ما می توانیم به تعداد
87
00:03:22,239 –> 00:03:25,920
سلول های خود قرار دهیم
88
00:03:26,000 –> 00:03:28,080
میخواهیم در بالا سمت چپ داشته باشیم، این
89
00:03:28,080 –> 00:03:30,480
علامت مثبت را داریم و میتوانیم سلولها را دقیقاً
90
00:03:30,480 –> 00:03:33,480
در اینجا
91
00:03:34,799 –> 00:03:37,519
اضافه کنیم به علاوه میتوانیم با رفتن به این منو در بالا سمت چپ، فایلها را
92
00:03:37,519 –> 00:03:39,760
در داخل حافظه فراخوانی گوگل قرار
93
00:03:39,760 –> 00:03:42,480
94
00:03:42,480 –> 00:03:43,599
95
00:03:43,599 –> 00:03:46,319
دهیم و میتوانیم به تنظیمات مختلف این دسترسی داشته باشیم.
96
00:03:46,319 –> 00:03:48,400
نوت بوک ما
97
00:03:48,400 –> 00:03:49,840
وارد جزئیات
98
00:03:49,840 –> 00:03:51,840
همه چیز نمی شویم زیرا شما به آن نیاز ندارید
99
00:03:51,840 –> 00:03:53,920
و فقط گیج کننده تر خواهد بود اما
100
00:03:53,920 –> 00:03:56,400
ما فقط مرورگر فایل را نشان می دهیم
101
00:03:56,400 –> 00:03:59,439
که گزینه سوم از
102
00:03:59,439 –> 00:04:02,400
مرورگر فایل نمایش بالا است
103
00:04:02,400 –> 00:04:05,280
در اینجا فایل هایی است که ما داریم. در
104
00:04:05,280 –> 00:04:07,360
حال حاضر چیزی قرار ندادم بنابراین هیچ چیز دیگری وجود
105
00:04:07,360 –> 00:04:09,360
ندارد به جز چند داده ساده که
106
00:04:09,360 –> 00:04:11,040
به طور پیش فرض وجود دارد،
107
00:04:11,040 –> 00:04:14,560
اما ما می توانیم فایل های خود را بارگیری کنیم تا
108
00:04:14,560 –> 00:04:17,358
آیکونی را ببینیم که نمادی برای آپلود است
109
00:04:17,358 –> 00:04:19,918
و اولین نمادی
110
00:04:19,918 –> 00:04:22,639
که می توانیم روی آن کلیک می کنیم. یا فایل را از دوربین خود آپلود کنیم، به
111
00:04:22,639 –> 00:04:24,320
این معنی است که می توانیم
112
00:04:24,320 –> 00:04:27,040
در زمان واقعی یک عکس یا یک ویدیو بگیریم و
113
00:04:27,040 –> 00:04:28,720
آنها را در collab قرار دهیم
114
00:04:28,720 –> 00:04:31,120
یا می توانیم انتخاب کنیم که فایل ها را
115
00:04:31,120 –> 00:04:32,479
از گالری خود آپلود کنیم،
116
00:04:32,479 –> 00:04:34,720
بنابراین من قصد ندارم عکسی بگیرم.
117
00:04:34,720 –> 00:04:36,560
شما می توانید این کار را انجام دهید اگر می خواهید من
118
00:04:36,560 –> 00:04:39,919
قصد دارم از th استفاده کنم گالری الکترونیکی
119
00:04:40,639 –> 00:04:43,520
و من همینجا چند عکس دارم، پس
120
00:04:43,520 –> 00:04:46,960
بیایید اولین
121
00:04:46,960 –> 00:04:49,040
عکسی را که عمداً این عکس را در
122
00:04:49,040 –> 00:04:50,639
دفتر گرفتم بارگذاری کنیم، زیرا عناصر زیادی وجود دارد
123
00:04:50,639 –> 00:04:52,960
که می توانیم آنها را شناسایی کنیم، بنابراین
124
00:04:52,960 –> 00:04:54,720
افرادی هستند که چند لپ تاپ وجود دارد و وجود دارد.
125
00:04:54,720 –> 00:04:56,560
همچنین اشیاء دیگری که ما قادر خواهیم بود آنها
126
00:04:56,560 –> 00:04:58,960
را تشخیص دهیم،
127
00:04:58,960 –> 00:05:01,759
حالا که اوم تصویر بارگذاری شده است،
128
00:05:01,759 –> 00:05:03,600
می توانیم تصویر را دقیقاً در اینجا ببینیم، بنابراین
129
00:05:03,600 –> 00:05:06,000
pex را به عنوان سلول های عامیانه می بینیم که نام
130
00:05:06,000 –> 00:05:07,919
تصویر بسیار طولانی است، بنابراین من
131
00:05:07,919 –> 00:05:09,520
اول از همه به نام این نام را تغییر دهید زیرا
132
00:05:09,520 –> 00:05:11,840
بعداً باید این عکس را بارگذاری کنیم
133
00:05:11,840 –> 00:05:14,240
و من یک نام بسیار ساده
134
00:05:14,240 –> 00:05:16,160
می خواهم بنابراین
135
00:05:16,160 –> 00:05:18,160
روی سه نقطه کلیک می کنم
136
00:05:18,160 –> 00:05:21,520
تا بتوانم به تنظیمات عکس دسترسی پیدا کنم
137
00:05:21,520 –> 00:05:24,560
و سپس کلیک کنم در تغییر نام
138
00:05:24,560 –> 00:05:27,600
فایل و من فقط این office
139
00:05:27,600 –> 00:05:30,000
dot را jpg صدا
140
00:05:30,000 –> 00:05:32,639
می زنم و همچنین اکنون می خواهم
141
00:05:32,639 –> 00:05:35,520
این برگه را همینجا ببندم
142
00:05:35,520 –> 00:05:39,120
و اجازه دهید اکنون کد خود را بنویسیم
143
00:05:39,120 –> 00:05:40,479
به علاوه
144
00:05:40,479 –> 00:05:42,400
با وارد کردن
145
00:05:42,400 –> 00:05:43,919
کتابخانه opencv که کتابخانه بینایی کامپیوتری
146
00:05:43,919 –> 00:05:45,680
است شروع می کنیم. قرار است برای انجام
147
00:05:45,680 –> 00:05:48,400
تمام پردازش ها و
148
00:05:48,400 –> 00:05:50,800
نمایش تصویر نمایش داده می شود بنابراین c vitsu را وارد می
149
00:05:50,800 –> 00:05:52,720
کنیم که اتفاقاً قبلاً
150
00:05:52,720 –> 00:05:55,280
نصب شده است.
151
00:05:55,280 –> 00:05:57,759
152
00:05:57,759 –> 00:05:59,440
153
00:05:59,440 –> 00:06:01,280
154
00:06:01,280 –> 00:06:04,479
155
00:06:04,479 –> 00:06:06,720
شما تنظیمات صفحه کلید را تغییر می دهید
156
00:06:06,720 –> 00:06:08,319
زیرا عملکرد تکمیل خودکار وجود دارد
157
00:06:08,319 –> 00:06:09,919
158
00:06:09,919 –> 00:06:12,720
و زمانی
159
00:06:12,720 –> 00:06:14,639
که می نویسید چگونه عملکرد تکمیل خودکار را داشته باشید بسیار دردناک
160
00:06:14,639 –> 00:06:15,680
است
161
00:06:15,680 –> 00:06:18,160
بنابراین حداقل در اندروید این نماد تنظیمات وجود دارد
162
00:06:18,160 –> 00:06:19,440
163
00:06:19,440 –> 00:06:21,919
که می توانید روی آن کلیک کنید
164
00:06:21,919 –> 00:06:23,759
و فقط می توانید ابتدا متن را بروید
165
00:06:23,759 –> 00:06:27,759
تصحیح باید تصحیح خودکار را غیرفعال کنید،
166
00:06:27,759 –> 00:06:29,440
بنابراین تصحیح را می بینید،
167
00:06:29,440 –> 00:06:32,479
این تصحیح خودکار فقط آن را غیرفعال کنید،
168
00:06:32,479 –> 00:06:34,639
زیرا کار را
169
00:06:34,639 –> 00:06:36,720
با تصحیح بیرونی هنگام نوشتن کد بسیار سخت می کند،
170
00:06:36,720 –> 00:06:38,080
171
00:06:38,080 –> 00:06:40,600
سپس
172
00:06:40,600 –> 00:06:43,039
حروف بزرگ خودکار دیگری را باید غیرفعال کنید
173
00:06:43,039 –> 00:06:44,560
زیرا ما نمی خواهیم همیشه حرف اول
174
00:06:44,560 –> 00:06:45,840
بزرگ است اما ما
175
00:06:45,840 –> 00:06:48,160
همه چیز را با حروف کوچک می خواهیم، یعنی زمانی که در حال نو
176
00:06:48,160 –> 00:06:49,919
تن کدها هستیم، بنابراین این دو گزینه که
177
00:06:49,919 –> 00:06:52,639
عمولا در هر گوشی به طور پیش فرض وجود دا
178
00:06:52,639 –> 00:06:55,120
ند باید غیرفعال شود تا زندگی ما راحت تر شود،
179
00:06:55,120 –> 00:06:56,160
در غیر این صورت
180
00:06:56,160 –> 00:06:58,720
من سعی کردم با آنها فعال شود درد بزرگی بود،
181
00:06:58,720 –> 00:07:02,880
بنابراین فقط آنها را غیرفعال کنید تا cv2 را وارد کرده ایم،
182
00:07:02,880 –> 00:07:05,280
بیایید اکنون تصویری را
183
00:07:05,280 –> 00:07:09,919
که در آنجا داریم بارگذاری کنیم. emg برابر است
184
00:07:10,160 –> 00:07:12,800
با cv2
185
00:07:12,800 –> 00:07:14,319
dot
186
00:07:14,319 –> 00:07:15,120
در
187
00:07:15,120 –> 00:07:17,680
خواندن
188
00:07:17,680 –> 00:07:19,599
و سپس اینجا ما نیاز داریم برای ضربه زدن به
189
00:07:19,599 –> 00:07:20,800
مسیر تصویر
190
00:07:20,800 –> 00:07:23,440
i have office dot
191
00:07:23,440 –> 00:07:25,680
jpg اگر تصویر خود را دارید باید
192
00:07:25,680 –> 00:07:27,840
193
00:07:27,840 –> 00:07:31,840
عنوان تصویر خود را تایپ کنید
194
00:07:31,919 –> 00:07:34,400
و اکنون اجازه دهید این سلول را اجرا کنیم تا ببینیم
195
00:07:34,400 –> 00:07:35,599
آیا همه چیز وجود دارد
196
00:07:35,599 –> 00:07:38,720
پس اکنون ما این کد را اجرا می کنیم و می بینیم
197
00:07:38,720 –> 00:07:39,680
198
00:07:39,680 –> 00:07:41,520
اینکه ما هیچ خطایی دریافت نکردیم به این معنی است
199
00:07:41,520 –> 00:07:43,599
که همه چیز به درستی اجرا شده است
200
00:07:43,599 –> 00:07:45,039
البته ما هیچ خروجی نمی بینیم
201
00:07:45,039 –> 00:07:46,240
زیرا ما
202
00:07:46,240 –> 00:07:48,560
خروجی را اضافه نکردیم اما می توانیم
203
00:07:48,560 –> 00:07:50,800
همین الان این کار را انجام دهیم بنابراین می خواهیم
204
00:07:50,800 –> 00:07:53,199
این تصویر را نشان دهیم که ما
205
00:07:53,199 –> 00:07:56,240
برای نمایش یک تصویر در گوگل بارگذاری شده است، ما همچنین باید
206
00:07:56,240 –> 00:07:57,680
207
00:07:57,680 –> 00:07:59,440
کتابخانه را برای نشان دادن یک تصویر وارد کنیم، بنابراین ما
208
00:07:59,440 –> 00:08:03,199
یک پچ داریم که
209
00:08:03,680 –> 00:08:05,680
از google
210
00:08:05,680 –> 00:08:08,560
dot colab
211
00:08:08,560 –> 00:08:10,400
call up
212
00:08:10,400 –> 00:08:13,599
dot buy
213
00:08:13,599 –> 00:08:15,919
import
214
00:08:15,919 –> 00:08:18,479
cv2
215
00:08:18,479 –> 00:08:20,080
underscore
216
00:08:20,080 –> 00:08:22,800
imshow است
217
00:08:23,759 –> 00:08:27,759
و حالا بیایید این زیرخط cv2 را
218
00:08:27,759 –> 00:08:29,360
219
00:08:29,360 –> 00:08:31,919
در show
220
00:08:33,760 –> 00:08:35,599
emg
221
00:08:35,599 –> 00:08:37,519
و تست کنیم. من با t بسیار کند هستم او تلفن
222
00:08:37,519 –> 00:08:38,880
من عادت ندارم زیاد با
223
00:08:38,880 –> 00:08:40,719
گوشی بنویسم پس احتمالا برای شما باید
224
00:08:40,719 –> 00:08:41,519
225
00:08:41,519 –> 00:08:43,760
خیلی سریعتر از من باشد اگر از تلفن زیاد استفاده می کنید
226
00:08:43,760 –> 00:08:44,800
227
00:08:44,800 –> 00:08:47,279
این کد است بیایید اکنون این را اجرا کنیم و
228
00:08:47,279 –> 00:08:48,800
اگر همه چیز درست است باید
229
00:08:48,800 –> 00:08:51,519
فقط آن را ببینیم بنابراین هیچ چیز
230
00:08:51,519 –> 00:08:53,839
خارقالعادهای در این مورد وجود ندارد و ما تصویر را میبینیم،
231
00:08:53,839 –> 00:08:55,440
232
00:08:55,440 –> 00:08:58,640
بنابراین اولین قدم اکنون به دست آمده است،
233
00:08:58,640 –> 00:09:00,800
حالا بیایید به کارت برویم تا
234
00:09:00,800 –> 00:09:02,160
هیجانانگیزترین چیز
235
00:09:02,160 –> 00:09:06,080
را شناسایی
236
00:09:06,800 –> 00:09:09,279
کنیم، بیایید سلول دیگری اضافه کنیم تا این یکی در
237
00:09:09,279 –> 00:09:10,880
مورد تشخیص اشیا در آنجا باشد.
238
00:09:10,880 –> 00:09:13,519
راههای زیادی برای شناسایی اشیاء برای
239
00:09:13,519 –> 00:09:15,920
این یکی وجود دارد، من میخواهم
240
00:09:15,920 –> 00:09:18,320
کتابخانهای را از github خود که
241
00:09:18,320 –> 00:09:21,360
قبلاً ایجاد کردهام بارگذاری کنم تا همه چیز بسیار
242
00:09:21,360 –> 00:09:23,519
ساده و سریع باشد
243
00:09:23,519 –> 00:09:25,040
و اجازه دهید این
244
00:09:25,040 –> 00:09:27,519
کار را انجام دهیم، اجازه دهید ابتدا کلون git
245
00:09:27,519 –> 00:09:29,200
detection
246
00:09:29,200 –> 00:09:31,040
247
00:09:31,040 –> 00:09:33,120
248
00:09:33,120 –> 00:09:34,839
http را نصب کنیم.
249
00:09:34,839 –> 00:09:36,480
به صورت
250
00:09:36,480 –> 00:09:37,519
251
00:09:37,519 –> 00:09:38,880
دوبار
252
00:09:38,880 –> 00:09:40,959
اسلش کولون،
253
00:09:40,959 –> 00:09:44,440
سپس github.com
254
00:09:45,839 –> 00:09:47,200
اسلش
255
00:09:47,200 –> 00:09:51,440
پی منبع 7
256
00:09:52,480 –> 00:09:55,040
و سپس
257
00:09:58,800 –> 00:10:02,200
تشخیص ساده،
258
00:10:06,880 –> 00:10:09,600
تشخیص ساده
259
00:10:09,600 –> 00:10:13,200
و بعد از این،
260
00:10:13,760 –> 00:10:15,839
بیایید اکنون این یکی را اجرا
261
00:10:15,839 –> 00:10:17,360
کنیم تا کتابخانه اکشن شی نصب شود
262
00:10:17,360 –> 00:10:19,839
و ما داریم که در واقع این کار بود.
263
00:10:19,839 –> 00:10:21,760
خیلی سریع
264
00:10:21,760 –> 00:10:23,360
اکنون میتوانیم
265
00:10:23,360 –> 00:10:26,560
کد خود را برای بارگذاری این کد ایجاد
266
00:10:26,560 –> 00:10:29,120
کنیم که تشخیص ساده را نصب میکنیم و میخواهیم
267
00:10:29,120 –> 00:10:30,959
اشیاء موجود در این
268
00:10:30,959 –> 00:10:33,760
تصویر را شناسایی کنیم، از یک مدل یادگیری عمیق از پیش آموزشدیده استفاده میکنیم
269
00:10:33,760 –> 00:10:35,120
که قادر است
270
00:10:35,120 –> 00:10:37,120
80 دسته مختلف را شناسایی کند.
271
00:10:37,120 –> 00:10:39,440
رایج ترین اشیاء در میان این
272
00:10:39,440 –> 00:10:41,200
موارد مانند افرادی هستند که
273
00:10:41,200 –> 00:10:42,640
لپ تاپ
274
00:10:42,640 –> 00:10:45,839
قلم کتاب حیوانات مختلف ماشین
275
00:10:45,839 –> 00:10:49,279
وسایل نقلیه مختلف بنابراین همه 80 دسته بسیار رایج Uh
276
00:10:49,279 –> 00:10:51,600
ما قادر خواهیم بود آنها را شناسایی کنیم
277
00:10:51,600 –> 00:10:53,360
و آنها را
278
00:10:53,360 –> 00:10:56,240
با یک جعبه در این تصویر احاطه
279
00:10:56,240 –> 00:10:58,640
کنیم.
280
00:10:58,640 –> 00:11:01,519
عمل بیایید فقط یک نظر اضافه کنیم
281
00:11:01,519 –> 00:11:05,040
این تشخیص شی در اینجا اتفاق می افتد.
282
00:11:05,040 –> 00:11:06,320
283
00:11:06,320 –> 00:11:08,079
284
00:11:08,079 –> 00:11:10,720
285
00:11:10,720 –> 00:11:12,880
286
00:11:12,880 –> 00:11:16,000
287
00:11:16,000 –> 00:11:18,320
288
00:11:18,320 –> 00:11:19,279
289
00:11:19,279 –> 00:11:24,160
290
00:11:24,160 –> 00:11:26,320
291
00:11:26,320 –> 00:11:29,040
292
00:11:29,040 –> 00:11:32,040
293
00:11:32,720 –> 00:11:33,600
294
00:11:33,600 –> 00:11:34,959
295
00:11:34,959 –> 00:11:37,839
296
00:11:41,040 –> 00:11:43,519
وارد کردن تشخیص شی نقطهای
297
00:11:43,519 –> 00:11:46,000
اکنون uh do باید در این
298
00:11:46,000 –> 00:11:50,000
شیء حروف بزرگ باشد و اکنون
299
00:11:50,000 –> 00:11:53,720
تشخیص حروف بزرگ
300
00:11:57,440 –> 00:11:59,760
و
301
00:11:59,760 –> 00:12:01,839
اکنون که اینها را داریم، آن را نیز بارگذاری میکنیم،
302
00:12:01,839 –> 00:12:03,040
303
00:12:03,040 –> 00:12:04,720
304
00:12:04,720 –> 00:12:07,920
بنابراین بیایید od w را ایجاد کنیم. hich فقط یک
305
00:12:07,920 –> 00:12:10,000
نام بسیار کوتاه برای عمل شیء است،
306
00:12:10,000 –> 00:12:11,440
ما اکنون میخواهیم اکشن شی را بارگیری
307
00:12:11,440 –> 00:12:14,000
کنیم تا بعداً بتوانید از
308
00:12:14,000 –> 00:12:15,279
آن استفاده کنیم.
309
00:12:15,279 –> 00:12:16,560
310
00:12:16,560 –> 00:12:18,880
311
00:12:18,880 –> 00:12:20,880
312
00:12:20,880 –> 00:12:22,639
نامی را که ترجیح میدهید
313
00:12:22,639 –> 00:12:24,480
تشخیص شیء را انتخاب کنید، اما باید
314
00:12:24,480 –> 00:12:26,800
دقیقاً همانطور باشد که در اینجا
315
00:12:26,800 –> 00:12:29,600
316
00:12:29,680 –> 00:12:31,279
317
00:12:31,279 –> 00:12:33,040
318
00:12:33,040 –> 00:12:33,920
319
00:12:33,920 –> 00:12:36,160
320
00:12:36,160 –> 00:12:37,519
321
00:12:37,519 –> 00:12:39,680
میبینید.
322
00:12:39,680 –> 00:12:41,600
حالت پس این دانلود
323
00:12:41,600 –> 00:12:43,360
مدل است، مدل یادگیری عمیق است که می تواند اشیاء را
324
00:12:43,360 –> 00:12:44,560
شناسایی
325
00:12:44,560 –> 00:12:46,399
کند
326
00:12:46,399 –> 00:12:48,880
و پس از این شما آماده استفاده از آن خواهید بود
327
00:12:48,880 –> 00:12:49,760
328
00:12:49,760 –> 00:12:51,440
و ما هیچ خطایی دریافت نکردیم، بنابراین اگر
329
00:12:51,440 –> 00:12:52,800
هیچ خطایی دریافت نکردید،
330
00:12:52,800 –> 00:12:55,680
همه چیز را به درستی انجام می دهیم و اکنون بیایید
331
00:12:55,680 –> 00:13:00,000
با مراحل بعدی حرکت
332
00:13:00,639 –> 00:13:02,800
کنیم، تصویر را بارگذاری کردیم، تصویر را نشان
333
00:13:02,800 –> 00:13:05,760
دادیم، مدل تشخیص صدا را نصب کردیم،
334
00:13:05,760 –> 00:13:08,560
حالا میخواهیم چه کار کنیم، میخواهیم انجام دهیم
335
00:13:08,560 –> 00:13:09,519
336
00:13:09,519 –> 00:13:11,920
یکی از هستههای این برنامه
337
00:13:11,920 –> 00:13:14,959
شناسایی اشیاء،
338
00:13:14,959 –> 00:13:16,399
بیایید
339
00:13:16,399 –> 00:13:18,800
انجام دهیم چگونه اعتراض cts میتوانیم
340
00:13:18,800 –> 00:13:21,600
از تابع od استفاده کنیم، بنابراین از عملکرد شیء،
341
00:13:21,600 –> 00:13:24,399
از detect استفاده میکنیم
342
00:13:24,480 –> 00:13:26,730
و میخواهیم
343
00:13:26,730 –> 00:13:28,560
[موسیقی] را
344
00:13:28,560 –> 00:13:31,279
در جایی که در emg میخواهید به اشیاء روی emg حمله کنید،
345
00:13:31,279 –> 00:13:33,839
بنابراین emg این است، بنابراین ما
346
00:13:33,839 –> 00:13:35,279
تصویر را بارگذاری
347
00:13:35,279 –> 00:13:37,600
کردیم که اولین سلول emg برابر است. cbt در
348
00:13:37,600 –> 00:13:40,240
read بنابراین این تصویری است که
349
00:13:40,240 –> 00:13:42,079
اکنون روی آن تصویر داریم و
350
00:13:42,079 –> 00:13:45,360
در ازای آن به اشیا حمله میکنیم،
351
00:13:45,360 –> 00:13:48,000
این سه چیز به
352
00:13:48,000 –> 00:13:49,519
ما میدهد وقتی از اکشن شی استفاده میکنیم، به
353
00:13:49,519 –> 00:13:52,160
طبقهبندی id کلاس نیاز داریم که بگوییم
354
00:13:52,160 –> 00:13:54,800
آه آن شی چیست. یک و
355
00:13:54,800 –> 00:13:56,560
بعداً خواهیم دید که چگونه شناسه کلاس
356
00:13:56,560 –> 00:13:58,079
را به نام تبدیل کنیم، بنابراین اگر صفر است، فرض کنید که
357
00:13:58,079 –> 00:14:00,079
یک شخص است اگر یک است، اگر
358
00:14:00,079 –> 00:14:03,360
دو است، یک دوچرخه است، چیزی شبیه به آن،
359
00:14:03,360 –> 00:14:05,440
پس شناسههای کلاس
360
00:14:05,440 –> 00:14:08,079
361
00:14:08,480 –> 00:14:10,079
مانند این
362
00:14:10,079 –> 00:14:13,199
دوم امتیاز پس چقدر مطمئن است.
363
00:14:13,199 –> 00:14:13,920
364
00:14:13,920 –> 00:14:15,519
مدل یادگیری عمیق در مورد تشخیص،
365
00:14:15,519 –> 00:14:18,959
بنابراین این یک ماشین است و من در مورد آن
366
00:14:18,959 –> 00:14:21,120
80 درصد مطمئن هستم به عنوان مثال، بنابراین این
367
00:14:21,120 –> 00:14:22,079
امتیاز است،
368
00:14:22,079 –> 00:14:24,880
بنابراین
369
00:14:25,199 –> 00:14:28,079
امتیاز می گیرد
370
00:14:28,160 –> 00:14:30,000
و سپس
371
00:14:30,000 –> 00:14:32,000
جعبه های مرزی، زیرا البته ما
372
00:14:32,000 –> 00:14:34,240
موقعیت اطراف را نیز می خواهیم، بنابراین می دا
373
00:14:34,240 –> 00:14:35,920
یم که وجود دارد یک شی اما
374
00:14:35,920 –> 00:14:37,600
کجاست این شی قرار گرفته است بنابراین
375
00:14:37,600 –> 00:14:40,320
مختصات کادرهای مرزبندی را بدست می آوریم جعبه
376
00:14:40,320 –> 00:14:43,440
b
377
00:14:43,440 –> 00:14:47,839
boxes و سپس برابر است
378
00:14:50,320 –> 00:14:53,040
و حالا بیایید به یک خط جدید برویم
379
00:14:53,040 –> 00:14:55,199
حالا بیایید چیزی از این چاپ کنیم
380
00:14:55,199 –> 00:14:57,440
مثلاً بیایید کلاس id
381
00:14:57,440 –> 00:14:59,839
چاپ کنیم
382
00:15:00,880 –> 00:15:04,079
کلاس ids کلاس چاپ
383
00:15:04,800 –> 00:15:08,000
384
00:15:08,000 –> 00:15:10,639
کنیم و ببینیم چه چیزی میگیریم
385
00:15:10,639 –> 00:15:13,839
اجازه دهید این یکی را اجرا کنیم،
386
00:15:13,920 –> 00:15:16,240
بنابراین باید خیلی سریع باشد، فقط
387
00:15:16,240 –> 00:15:18,160
اشیاء را روی یک تصویر شناسایی میکند و این
388
00:15:18,160 –> 00:15:20,480
چیزی است که
389
00:15:20,480 –> 00:15:23,519
ما داریم، یک آرایه با اعداد مختلف
390
00:15:23,519 –> 00:15:25,760
در داخل داریم، این بدان معناست که
391
00:15:25,760 –> 00:15:28,480
روی هر شیء اشیاء متفاوتی داریم، اکنون یک شناسه کلاس
392
00:15:28,480 –> 00:15:29,440
393
00:15:29,440 –> 00:15:30,880
مرتبط است.
394
00:15:30,880 –> 00:15:33,040
معمولاً کاری که باید انجام دهیم
395
00:15:33,040 –> 00:15:35,600
این است که همه چیز را حلقه بزنیم تا
396
00:15:35,600 –> 00:15:37,360
برای اولین شی که می دانیم اول
397
00:15:37,360 –> 00:15:40,480
شیء id 63 است،
398
00:15:40,480 –> 00:15:43,519
سپس آن شی در کجا قرار دارد،
399
00:15:43,519 –> 00:15:45,759
بیایید این کار را انجام دهیم و همچنین بعداً خواهیم دید
400
00:15:45,759 –> 00:15:47,759
که آنها چه اشیایی هستند،
401
00:15:47,759 –> 00:15:50,880
بنابراین بیایید چهار کار را انجام دهیم.
402
00:15:50,959 –> 00:15:54,399
403
00:15:54,399 –> 00:15:58,240
شناسه کلاس برای امتیاز شناسه کلاس
404
00:15:59,120 –> 00:16:01,680
405
00:16:02,079 –> 00:16:05,040
و سپس یک جعبه
406
00:16:05,040 –> 00:16:06,240
جعبه
407
00:16:06,240 –> 00:16:07,199
در
408
00:16:07,199 –> 00:16:08,880
حال حاضر ما
409
00:16:08,880 –> 00:16:11,360
از طریق سه آرایه مختلف با هم حلقه می
410
00:16:11,360 –> 00:16:13,279
زنیم زیرا یک شناسه کلاس
411
00:16:13,279 –> 00:16:15,519
مرتبط با امتیاز یک جعبه داریم، بنابراین
412
00:16:15,519 –> 00:16:18,240
در همه عناصر یکسان داریم. از آنها، بنابراین
413
00:16:18,240 –> 00:16:20,639
همه آنها را با هم حلقه میزنیم، بنابراین
414
00:16:20,639 –> 00:16:22,160
415
00:16:22,160 –> 00:16:25,440
زیپ شناسههای
416
00:16:25,440 –> 00:16:26,880
کلاس نمرههای شناسه کلاس
417
00:16:26,880 –> 00:16:29,440
418
00:16:29,440 –> 00:16:32,079
419
00:16:32,399 –> 00:16:34,079
و سپس
420
00:16:34,079 –> 00:16:37,199
جعبههای محدودکننده،
421
00:16:37,199 –> 00:16:40,880
حالا بیایید این
422
00:16:40,880 –> 00:16:44,560
نقطه را ببندیم و اکنون به
423
00:16:44,560 –> 00:16:45,440
پایین برویم،
424
00:16:45,440 –> 00:16:47,759
نه، فضای برگه را اینجا نمیبینم، مثل اینکه
425
00:16:47,759 –> 00:16:50,240
معمولاً باید کد را تورفتگی کنیم. بنابراین
426
00:16:50,240 –> 00:16:53,199
ما میزنیم اما میتوانیم از چهار فاصله
427
00:16:53,199 –> 00:16:56,160
یکی دو سه چهار که میتوانیم روی
428
00:16:56,160 –> 00:16:58,639
تلفن استفاده کنیم، بیایید این خروجی را ببندیم، نیازی نیست
429
00:16:58,639 –> 00:17:00,079
430
00:17:00,079 –> 00:17:03,440
که اوه، کمی با این کار اشتباه
431
00:17:03,440 –> 00:17:04,720
432
00:17:04,720 –> 00:17:07,199
میکنم، خوب، اکنون میتوانیم از چهار فاصله یکی دو سه
433
00:17:07,199 –> 00:17:08,319
چهار استفاده کنیم.
434
00:17:08,319 –> 00:17:09,280
435
00:17:09,280 –> 00:17:10,959
میتوانیم
436
00:17:10,959 –> 00:17:13,119
بگوییم برای مثال بیایید
437
00:17:13,119 –> 00:17:14,880
این کادر
438
00:17:14,880 –> 00:17:16,959
را بگیریم که مهمترین چیز در حال حاضر است.
439
00:17:16,959 –> 00:17:18,400
440
00:17:18,400 –> 00:17:19,520
441
00:17:19,520 –> 00:17:20,480
442
00:17:20,480 –> 00:17:22,720
443
00:17:22,720 –> 00:17:26,000
444
00:17:26,000 –> 00:17:27,679
445
00:17:27,679 –> 00:17:29,679
446
00:17:29,679 –> 00:17:31,679
447
00:17:31,679 –> 00:17:36,400
جعبه برابر است با
448
00:17:36,400 –> 00:17:39,679
جعبه خوب
449
00:17:40,000 –> 00:17:42,720
و یک دو سه چهار بیایید مثلاً
450
00:17:42,720 –> 00:17:45,679
آنها را چاپ کنیم اگر چاپ کنیم
451
00:17:45,679 –> 00:17:48,160
452
00:17:48,160 –> 00:17:51,120
x و y را چاپ کنیم یا می توانیم
453
00:17:51,120 –> 00:17:53,440
جعبه را چاپ کنیم مه