در این مطلب، ویدئو با استفاده از Python | اپلیکیشن تشخیص لنز لنز گوگل خود را بسازید گرادیو | تنسورفلو هاب با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:20:56
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:04,210 –> 00:00:07,359
[موسیقی]
2
00:00:07,359 –> 00:00:08,880
سلام به
3
00:00:08,880 –> 00:00:11,840
همه امیدوارم حال همه شما خوب باشد،
4
00:00:11,840 –> 00:00:15,360
همه می دانیم که لنز گوگل چقدر شگفت انگیز است
5
00:00:15,360 –> 00:00:17,520
، موقعیتی را تصور کنید که از یک کشور جدید بازدید می کنید،
6
00:00:17,520 –> 00:00:19,600
یک شهر جدید
7
00:00:19,600 –> 00:00:21,279
و اتفاقاً نقطه عطف جدیدی را کشف
8
00:00:21,279 –> 00:00:22,320
9
00:00:22,320 –> 00:00:24,160
می کنید اما نام آن را کاملاً نمی دانید از نقطه
10
00:00:24,160 –> 00:00:25,760
11
00:00:25,760 –> 00:00:28,240
عطف اینجاست که تلفن همراه خود را باز
12
00:00:28,240 –> 00:00:30,000
میکنید و دوربین را به سمت نقطه عطف میگیرید
13
00:00:30,000 –> 00:00:31,279
14
00:00:31,279 –> 00:00:33,440
و در همین حد است، گوگل به شما میگوید
15
00:00:33,440 –> 00:00:36,399
چه نقطه عطفی است
16
00:00:36,399 –> 00:00:38,000
حالا اگر به شما بگویم که
17
00:00:38,000 –> 00:00:40,399
میتوانید دقیقاً همان راهحل را با استفاده از یک رابط وب ایجاد
18
00:00:40,399 –> 00:00:41,600
کنید.
19
00:00:41,600 –> 00:00:44,559
خطوط کوچکی از کد پایتون،
20
00:00:44,559 –> 00:00:46,960
بنابراین بدون اتلاف وقت بیشتر،
21
00:00:46,960 –> 00:00:50,160
بیایید ویدیو را شروع کنیم
22
00:00:51,199 –> 00:00:53,600
اکنون ممکن است تعجب کنید که برای ایجاد راه حل دقیقاً به چه چیزی نیاز دارید
23
00:00:53,600 –> 00:00:55,920
24
00:00:55,920 –> 00:00:58,160
، پاسخ بسیار ساده است، تنها چیزی که
25
00:00:58,160 –> 00:01:00,719
نیاز دارید یک اتصال اینترنتی کارآمد است
26
00:01:00,719 –> 00:01:02,719
که محاسبه انجام می شود. توسط google
27
00:01:02,719 –> 00:01:05,040
collab بنابراین من این نسخه ی نمایشی را
28
00:01:05,040 –> 00:01:07,360
کاملاً در google collab ایجاد می کنم و
29
00:01:07,360 –> 00:01:09,119
اساساً یک
30
00:01:09,119 –> 00:01:11,520
مدل از قبل آموزش دیده را دانلود می کنم و
31
00:01:11,520 –> 00:01:14,400
جادوی tensorflow hub را به شما نشان می دهم که
32
00:01:14,400 –> 00:01:16,960
من در حال حاضر در tensorflow hub هستم و اجازه می دهم
33
00:01:16,960 –> 00:01:20,640
من روی نشانهها کلیک میکنم،
34
00:01:23,040 –> 00:01:24,960
بنابراین گوگل در حال حاضر مدلهای از پیش آموزشدیدهای
35
00:01:24,960 –> 00:01:27,119
دارد که در آنها میتوانید بهطور
36
00:01:27,119 –> 00:01:29,520
مستقیم نشانهها را شناسایی کنید، نیازی به
37
00:01:29,520 –> 00:01:32,159
آموزش مدلی برای آن ندارید، همه اینها
38
00:01:32,159 –> 00:01:34,240
قبلاً توسط Google مراقبت شده است،
39
00:01:34,240 –> 00:01:36,000
بنابراین قارههای مختلف
40
00:01:36,000 –> 00:01:38,000
در این مورد در دسترس هستند. نقطه زمانی شما
41
00:01:38,000 –> 00:01:40,479
آفریقای آسیای اروپای آمریکای
42
00:01:40,479 –> 00:01:44,159
شمالی و غیره و غیره
43
00:01:44,399 –> 00:01:46,240
چیزی که من می خواهم امروز ایجاد کنم یک
44
00:01:46,240 –> 00:01:48,399
راه حل خاص برای آسیا است، بنابراین من
45
00:01:48,399 –> 00:01:51,200
آسیا را انتخاب می
46
00:01:51,840 –> 00:01:54,640
کنم اینجا است که می توانید آسیا را پیدا کنید،
47
00:01:54,640 –> 00:01:58,079
بنابراین روی این مورد خاص کلیک می کنم. پیوند
48
00:02:01,360 –> 00:02:03,280
نگران صفحه وب نباشید،
49
00:02:03,280 –> 00:02:04,479
من پیوند را به صفحه وب در
50
00:02:04,479 –> 00:02:06,399
بخش توضیحات ویدیو اضافه می کنم، بنابراین
51
00:02:06,399 –> 00:02:09,840
آن را نیز بررسی کنید،
52
00:02:11,440 –> 00:02:13,360
بنابراین اکنون به پایین رفتن ادامه می دهم
53
00:02:13,360 –> 00:02:16,480
، شما یک مدل از قبل آموزش دیده دارید
54
00:02:16,879 –> 00:02:18,879
اجازه دهید من کل فرآیند را در
55
00:02:18,879 –> 00:02:20,560
این رابط وب که در دسترس است امتحان می کنم، بنابراین
56
00:02:20,560 –> 00:02:23,840
اجازه دهید سریع یک تصویر
57
00:02:23,840 –> 00:02:25,680
را آپلود کنم تا این تصویر خاص را آپلود کنم
58
00:02:25,680 –> 00:02:29,080
که
59
00:02:29,920 –> 00:02:31,680
image1.jpg خروجی مدل تقریباً
60
00:02:31,680 –> 00:02:33,360
آنی بود
61
00:02:33,360 –> 00:02:35,200
و نقطه عطفی که در اینجا می بینید
62
00:02:35,200 –> 00:02:38,480
دروازه است. از هند که است اکنون در بمبئی
63
00:02:38,480 –> 00:02:40,239
اگر میخواهید کل فرآیند را تکرار
64
00:02:40,239 –> 00:02:41,920
کنید و رابط وب خود را ایجاد کنید،
65
00:02:41,920 –> 00:02:44,160
این همان چیزی است که ویدیو به
66
00:02:44,160 –> 00:02:45,519
67
00:02:45,519 –> 00:02:47,920
آن نیاز دارید، به این
68
00:02:47,920 –> 00:02:50,319
آدرس اینترنتی خاص نیاز دارید که پیوند مدل از قبل آموزشدیده
69
00:02:50,319 –> 00:02:54,560
است، بنابراین من آن را به عنوان کپی میکنم. خوب،
70
00:02:54,959 –> 00:02:56,720
هر زمان که می خواهید از مدلی
71
00:02:56,720 –> 00:02:58,560
از هاب تنسورفلو
72
00:02:58,560 –> 00:03:00,400
استفاده کنید، مطمئن شوید که مقادیر ورودی و خروجی مدل را بخوانید،
73
00:03:00,400 –> 00:03:03,280
74
00:03:03,280 –> 00:03:04,879
به وضوح بیان می کند که مدل
75
00:03:04,879 –> 00:03:08,159
به یک تصویر رنگی rgb سه کاناله
76
00:03:08,159 –> 00:03:10,000
با اندازه خاص نیاز دارد
77
00:03:10,000 –> 00:03:11,920
و مقادیر ورودی باید بین مقیاس بندی شوند.
78
00:03:11,920 –> 00:03:15,040
صفر به یک، بنابراین این را در نظر داشته باشید،
79
00:03:15,040 –> 00:03:16,560
من به شما نشان خواهم داد که چگونه می توانید این کار را انجام دهید،
80
00:03:16,560 –> 00:03:18,480
وقتی که رابط وب خود را ایجاد می کنید
81
00:03:18,480 –> 00:03:20,959
82
00:03:22,080 –> 00:03:24,799
، خروجی مدل برای پیش بینی logits،
83
00:03:24,799 –> 00:03:26,480
بنابراین این کلیدی است که ما
84
00:03:26,480 –> 00:03:29,360
باید برای استخراج از آن استفاده کنیم. خروجی
85
00:03:29,360 –> 00:03:30,879
و چیزی به نام نقشه برچسب وجود دارد،
86
00:03:30,879 –> 00:03:32,879
بنابراین اساساً یک نقشه برچسب
87
00:03:32,879 –> 00:03:36,480
حاوی نگاشت شناسه با
88
00:03:36,480 –> 00:03:39,519
نقطه عطف دقیقی است که در مدل وجود دارد، بنابراین
89
00:03:39,519 –> 00:03:41,840
ما از این نیز استفاده خواهیم کرد، این
90
00:03:41,840 –> 00:03:44,000
اساساً یک فایل CSV است، بنابراین من خواهم بود
91
00:03:44,000 –> 00:03:47,599
با استفاده از این فایل csv نیز هست، بنابراین
92
00:03:47,599 –> 00:03:49,840
با انجام کل کار پسزمینه،
93
00:03:49,840 –> 00:03:53,680
به سرعت به بخش کدنویسی میروم،
94
00:03:54,239 –> 00:03:55,920
بنابراین کد شروعی وجود دارد که از
95
00:03:55,920 –> 00:03:57,840
قبل در دسترس است، من از آن استفاده میکنم
96
00:03:57,840 –> 00:04:00,159
و همچنین بدون اتلاف بیشتر به جلو میرویم.
97
00:04:00,159 –> 00:04:02,560
بیایید
98
00:04:02,560 –> 00:04:04,720
شروع به فعالیت ایجاد
99
00:04:04,720 –> 00:04:06,879
لنز گوگل خودمان مانند برنامه برای
100
00:04:06,879 –> 00:04:09,760
شناسایی نشانهها با استفاده از پایتون
101
00:04:09,760 –> 00:04:11,680
به منظور ایجاد سریع یک برنامه وب
102
00:04:11,680 –> 00:04:14,159
103
00:04:14,159 –> 00:04:17,440
104
00:04:17,440 –> 00:04:21,440
105
00:04:24,320 –> 00:04:26,000
یک رابط کاملاً جدید در
106
00:04:26,000 –> 00:04:27,759
google collab است که من
107
00:04:27,759 –> 00:04:30,320
با هیچ تنظیماتی بازی نکرده ام، بنابراین اجازه دهید سریع بروم
108
00:04:30,320 –> 00:04:33,360
و روی اتصال کلیک
109
00:04:35,280 –> 00:04:39,120
کنم تا یک نمونه راه اندازی و
110
00:04:39,919 –> 00:04:41,600
اجرا کنیم اولین کاری که انجام می دهم این است که
111
00:04:41,600 –> 00:04:43,840
گرادینت را به همین ترتیب نصب کنم. من این کار را
112
00:04:43,840 –> 00:04:45,040
به صورت گرادینت
113
00:04:45,040 –> 00:04:47,840
نصب پیپ انجام
114
00:04:50,880 –> 00:04:56,280
میدهم، بنابراین اجازه دهید به سرعت سلول را اجرا کنم
115
00:04:57,199 –> 00:04:59,280
، نصب انجام شد اکنون به
116
00:04:59,280 –> 00:05:02,080
سرعت تعدادی ماژول لازم را وارد
117
00:05:02,080 –> 00:05:05,680
میکنم، بنابراین ابتدا به numpy نیاز
118
00:05:06,240 –> 00:05:09,039
دارم، به پانداها نیاز دارم، اکثر شما
119
00:05:09,039 –> 00:05:10,960
میدانید که شما برای چنین فعالیتهایی به تعداد و پاندا
120
00:05:10,960 –> 00:05:13,919
نیاز
121
00:05:14,880 –> 00:05:16,880
دارم، من همچنین به matplotlib نیاز دارم که فقط
122
00:05:16,880 –> 00:05:21,240
تصویر را به شما نشان دهد، بنابراین وارد کنید،
123
00:05:24,880 –> 00:05:28,240
من gradio را نیز وارد میکنم
124
00:05:31,120 –> 00:05:33,120
، میخواهم تصاویر را نیز به شما نشان دهم، بنابراین
125
00:05:33,120 –> 00:05:36,919
به قرص
126
00:05:42,720 –> 00:05:46,479
بعدی نیاز دارم، من به تنسورفلو نیاز
127
00:05:49,680 –> 00:05:53,840
دارم. همچنین به هاب tensorflow نیاز دارد،
128
00:05:59,199 –> 00:06:00,639
این تنها چیزی است که من نیاز دارم،
129
00:06:00,639 –> 00:06:01,919
130
00:06:01,919 –> 00:06:05,960
بنابراین به سرعت سلول را اجرا می کنم،
131
00:06:06,880 –> 00:06:08,319
اگر می خواهید
132
00:06:08,319 –> 00:06:10,160
کل این فرآیند را در سیستم محلی خود تکرار
133
00:06:10,160 –> 00:06:12,080
کنید، به تمام کتابخانه هایی که ذکر کردم نیاز خواهید داشت
134
00:06:12,080 –> 00:06:13,919
. در حال حاضر اگر
135
00:06:13,919 –> 00:06:15,919
از google collab استفاده می کنید، تنها چیزی
136
00:06:15,919 –> 00:06:18,080
که به آن نیاز دارید gradio است،
137
00:06:18,080 –> 00:06:20,160
بنابراین باید ابتدا آن را نصب کنید و سپس
138
00:06:20,160 –> 00:06:23,600
ماژول های لازم را وارد کنید،
139
00:06:24,880 –> 00:06:26,960
من قبلاً پیوند مدل را در کلیپ بورد کپی کرده ام
140
00:06:26,960 –> 00:06:28,960
، بنابراین پیست می کنم. آن را و من
141
00:06:28,960 –> 00:06:31,120
آن را به متغیری به نام tf
142
00:06:31,120 –> 00:06:33,840
underscore مدل underscore url اختصاص میدهم، بنابراین
143
00:06:33,840 –> 00:06:37,120
اجازه دهید ابتدا آن را ایجاد کنم،
144
00:06:42,960 –> 00:06:45,440
بنابراین این پیوند به مدل است و
145
00:06:45,440 –> 00:06:47,280
مورد بعدی که من نیز به آن نیاز دارم،
146
00:06:47,280 –> 00:06:49,919
نقشه برچسب است که شناسهها را به آن نگاشت
147
00:06:49,919 –> 00:06:53,039
میکند. بنای تاریخی یا نقطه عطفی دقیق،
148
00:06:53,039 –> 00:06:55,199
بنابراین من یک متغیر ایجاد خواهم کرد نشانی اینترنتی نقشه برچسب قادر است
149
00:06:55,199 –> 00:06:58,160
150
00:06:59,360 –> 00:07:00,960
و من پیوندی را که
151
00:07:00,960 –> 00:07:03,039
قبلاً دوباره کپی کردهام در کلیپ بورد
152
00:07:03,039 –> 00:07:05,280
جایگذاری میکنم، بنابراین آن را اینجا میگذارم، بنابراین
153
00:07:05,280 –> 00:07:07,440
154
00:07:07,440 –> 00:07:09,360
اگر به یاد داشته باشید که شکل ورودی
155
00:07:09,360 –> 00:07:13,440
مورد نیاز مدل 321 متقاطع بود، در اصل یک فایل CSV است. 321
156
00:07:13,440 –> 00:07:16,960
بنابراین اجازه دهید یک تاپل با
157
00:07:16,960 –> 00:07:18,880
شکل زیر خط تصویر نام تعریف
158
00:07:18,880 –> 00:07:23,120
کنم و من یک کاما 321 تاپلی 321 ایجاد می کنم، بنابراین
159
00:07:23,120 –> 00:07:27,479
اجازه دهید به جلو بروم و سلول را اجرا
160
00:07:30,000 –> 00:07:32,880
کنم اکنون می خواهم کل مدل
161
00:07:32,880 –> 00:07:35,280
را در متغیری به نام طبقه بندی کننده دانلود
162
00:07:35,280 –> 00:07:37,360
کنم. این کار را انجام می دهم این است که
163
00:07:37,360 –> 00:07:40,880
متغیری را به نام طبقه بندی کننده
164
00:07:40,960 –> 00:07:42,560
165
00:07:42,560 –> 00:07:46,080
166
00:07:48,879 –> 00:07:51,120
تعریف
167
00:07:51,120 –> 00:07:52,400
168
00:07:52,400 –> 00:07:55,840
می کنم.
169
00:07:55,840 –> 00:07:57,039
170
00:07:57,039 –> 00:08:00,960
171
00:08:02,479 –> 00:08:06,319
چیزی است که من برابر با شکل تصویر تعریف می کنم،
172
00:08:06,319 –> 00:08:10,680
173
00:08:12,960 –> 00:08:15,199
اما تصاویر سه کانال خواهند داشت،
174
00:08:15,199 –> 00:08:17,520
بنابراین من به نوعی
175
00:08:17,520 –> 00:08:20,560
سه کانال را در اینجا معرفی می کنم
176
00:08:21,759 –> 00:08:26,280
و اگر کلید خروجی را به خاطر دارید،
177
00:08:28,400 –> 00:08:30,319
بنابراین اگر به یاد داشته باشید کلید خروجی
178
00:08:30,319 –> 00:08:32,479
اساساً منطق های پیش بینی بود، بنابراین این
179
00:08:32,479 –> 00:08:35,760
چیزی است که من در اینجا می نویسم
180
00:08:39,200 –> 00:08:42,080
بنابراین همه چیز که در
181
00:08:42,080 –> 00:08:43,839
مستندات ef hub برای این مدل خاص ذکر شد
182
00:08:43,839 –> 00:08:46,240
، چیزی است که من در اینجا تکرار کردم،
183
00:08:46,240 –> 00:08:50,920
بنابراین اجازه دهید به جلو بروم و این سلول را
184
00:08:54,080 –> 00:08:56,399
کاملاً اجرا کنم، بنابراین من مدل را در
185
00:08:56,399 –> 00:08:58,720
طبقهبندی
186
00:08:58,720 –> 00:09:01,760
متغیرم دارم، اجازه دهید نقشه برچسب را نیز بخوانم
187
00:09:01,760 –> 00:09:04,000
تا یک داده ایجاد کنم. فریم df
188
00:09:04,000 –> 00:09:09,080
من CSV را مستقیماً از نشانی اینترنتی
189
00:09:10,080 –> 00:09:13,440
نقشه نشانی اینترنتی میخوانم، بسیار خوب،
190
00:09:13,519 –> 00:09:15,519
فقط برای اینکه به شما نشان دهم نقشه برچسب واقعاً شبیه چه چیزی است
191
00:09:15,519 –> 00:09:20,240
، میگویم df dot head
192
00:09:21,440 –> 00:09:24,640
بنابراین 0 1 2 چیزی است که شما دارید، بنابراین
193
00:09:24,640 –> 00:09:25,839
شناسه خود را
194
00:09:25,839 –> 00:09:27,839
دارید و آن را دارید نام بنای تاریخی یا
195
00:09:27,839 –> 00:09:30,560
نقطه عطف
196
00:09:30,560 –> 00:09:32,880
اکنون اگر بخواهم از این نقشه برچسب استفاده
197
00:09:32,880 –> 00:09:34,720
کنم، کاری که انجام می دهم این است که یک فرهنگ لغت
198
00:09:34,720 –> 00:09:38,000
به نام نقشه برچسب ایجاد می
199
00:09:38,000 –> 00:09:40,240
کنم و جفت های مقادیر کلیدی را در
200
00:09:40,240 –> 00:09:43,279
قالبی خواهم داشت که کلیدهای من به صورت شناسه
201
00:09:43,279 –> 00:09:44,800
و نام بنای تاریخی مقدار خواهد بود،
202
00:09:44,800 –> 00:09:47,920
بنابراین روشی که من این کار را انجام می دهم عبارت است
203
00:09:47,920 –> 00:09:50,959
از zip
204
00:09:50,959 –> 00:09:54,240
df از id
205
00:09:54,640 –> 00:09:58,000
و نام نقطه df،
206
00:09:58,240 –> 00:10:01,680
بنابراین اکنون اگر نقشه برچسب را به
207
00:10:01,680 –> 00:10:04,640
شما نشان دهم، یک جفت مقدار کلیدی
208
00:10:04,640 –> 00:10:06,560
چیزی شبیه به این را خواهم داشت.
209
00:10:06,560 –> 00:10:08,880
درست
210
00:10:12,480 –> 00:10:14,480
قبل از اینکه به جلو برویم و رابط وب خود را ایجاد کنیم
211
00:10:14,480 –> 00:10:16,720
که اساساً می تواند
212
00:10:16,720 –> 00:10:19,440
لنز گوگل را تکرار کند
213
00:10:19,440 –> 00:10:21,200
وب اولین کاری که من انجام می دهم این است
214
00:10:21,200 –> 00:10:23,600
که برخی از پیش بینی ها را انجام می دهم و بررسی می کنم که آیا
215
00:10:23,600 –> 00:10:26,000
کل منطق در جای خود قرار دارد یا نه،
216
00:10:26,000 –> 00:10:27,120
217
00:10:27,120 –> 00:10:28,560
بنابراین اولین کاری که در این فعالیت انجام می دهم این
218
00:10:28,560 –> 00:10:31,440
است که یک تصویر آپلود می کنم.
219
00:10:31,440 –> 00:10:34,079
روی فایلها کلیک
220
00:10:34,079 –> 00:10:36,160
میکنم، در حال حاضر تصویری وجود ندارد
221
00:10:36,160 –> 00:10:39,040
، من سیستم محلی خود را مرور میکنم، بنابراین میگوید
222
00:10:39,040 –> 00:10:41,680
آپلود، بنابراین به
223
00:1