در این مطلب، ویدئو TensorFlow گام به گام تشخیص اشیاء حل کننده CAPTCHA قسمت شماره 1 با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:11:22
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,350 –> 00:00:02,879
به آموزش حل کننده کپچا اعتیاد به اشیاء تنسورفلو خوش آمدید
2
00:00:02,879 –> 00:00:05,190
این
3
00:00:05,190 –> 00:00:07,290
اولین قسمت مقدماتی است که می خواهم
4
00:00:07,290 –> 00:00:10,740
بگویم اول متاسفم زیرا صدای من می
5
00:00:10,740 –> 00:00:13,230
تواند کمی متفاوت باشد زیرا
6
00:00:13,230 –> 00:00:15,900
در حال حاضر حالم خیلی خوب نیست من هم
7
00:00:15,900 –> 00:00:19,740
بیمار هستم بنابراین می خواهم متاسفم و من
8
00:00:19,740 –> 00:00:21,150
آموزش را
9
00:00:21,150 –> 00:00:24,269
با عکس هایی شروع می کنم که مردم در
10
00:00:24,269 –> 00:00:26,519
اینترنت کم و بیش
11
00:00:26,519 –> 00:00:29,340
با اصطلاح CAPTCHAs deus deus images annoying
12
00:00:29,340 –> 00:00:31,800
که حاوی متنی هستند که باید
13
00:00:31,800 –> 00:00:35,239
قبل از دسترسی به یک وب سایت تایپ کنید آشنا هستند، بنابراین
14
00:00:35,239 –> 00:00:38,700
CAPTCHA مخفف
15
00:00:38,700 –> 00:00:41,250
آزمون تورینگ عمومی کاملاً خودکار است. تشخیص کامپیوتر و
16
00:00:41,250 –> 00:00:44,730
انسان هدف اصلی
17
00:00:44,730 –> 00:00:47,190
CAPTCHA جلوگیری از خودکارسازی موارد در
18
00:00:47,190 –> 00:00:49,430
اینترنت با استفاده از رباتها است، به عبارت دیگر
19
00:00:49,430 –> 00:00:52,800
این آزمایشی است که در محاسبات برای
20
00:00:52,800 –> 00:00:54,870
تعیین اینکه آیا کاربر یک انسان است یا نه استفاده میشود،
21
00:00:54,870 –> 00:00:59,520
بنابراین CAPTCHA فقط یک متن با
22
00:00:59,520 –> 00:01:01,890
نویز با رنگهای مختلف است. با
23
00:01:01,890 –> 00:01:04,110
علامتهای چرخانده شده متفاوت است، ما آن را تغییر میدهیم
24
00:01:04,110 –> 00:01:05,909
تا تشخیص آن برای رایانه سختتر شود
25
00:01:05,909 –> 00:01:09,780
، گاهی اوقات حتی برای انسان
26
00:01:09,780 –> 00:01:12,030
تشخیص آنچه روی t نوشته شده دشوار است.
27
00:01:12,030 –> 00:01:14,400
او تصویر میکند، بنابراین
28
00:01:14,400 –> 00:01:17,220
ساخت رباتهایی که میتوانند این تصاویر را بشکنند کار بسیار دشواری است،
29
00:01:17,220 –> 00:01:21,420
بنابراین اگر در حال تماشا یا
30
00:01:21,420 –> 00:01:24,030
گوش دادن به این ویدیوی این آموزش هستید،
31
00:01:24,030 –> 00:01:26,939
احتمالاً میدانید که مهم نیست
32
00:01:26,939 –> 00:01:29,490
چقدر گرفتن عکس سخت است،
33
00:01:29,490 –> 00:01:32,460
حل آنها با افزایش یادگیری عمیق
34
00:01:32,460 –> 00:01:35,700
و بینایی رایانه ممکن است. اما احتمالاً شما
35
00:01:35,700 –> 00:01:39,090
نمی دانید چگونه این کار را انجام دهید، بنابراین به
36
00:01:39,090 –> 00:01:41,909
تماشای یا خواندن آموزش من ادامه دهید،
37
00:01:41,909 –> 00:01:44,340
مهم نیست که چقدر عکسبرداری تکامل می یابد،
38
00:01:44,340 –> 00:01:46,560
همیشه افرادی هستند که با
39
00:01:46,560 –> 00:01:49,320
افکاری برای شکستن آن می آیند، یکی از معروف ترین
40
00:01:49,320 –> 00:01:51,570
روش ها استفاده از روش یادگیری ماشینی
41
00:01:51,570 –> 00:01:54,960
است و تمرکز اصلی ما بر روی
42
00:01:54,960 –> 00:01:58,439
نوع خاصی از استفاده از شبکه عصبی خواهد بود
43
00:01:58,439 –> 00:02:00,570
که آن را شبکه های عصبی اولیه می نامیم.
44
00:02:00,570 –> 00:02:03,540
45
00:02:03,540 –> 00:02:06,630
46
00:02:06,630 –> 00:02:09,660
47
00:02:09,660 –> 00:02:11,580
48
00:02:11,580 –> 00:02:14,910
49
00:02:14,910 –> 00:02:18,270
و شما
50
00:02:18,270 –> 00:02:20,490
کمی می توانید بگویید که این دو حیوان
51
00:02:20,490 –> 00:02:22,980
یک گونه نیستند، اما می خواهید
52
00:02:22,980 –> 00:02:27,240
بپرسید که چگونه هستند و پاسخ شما
53
00:02:27,240 –> 00:02:27,630
54
00:02:27,630 –> 00:02:30,780
واضح است چرا میپرسید،
55
00:02:30,780 –> 00:02:33,330
این از این واقعیت ناشی میشود که ما
56
00:02:33,330 –> 00:02:36,390
احتمالاً یک میلیون عکس از سگها، گربهها
57
00:02:36,390 –> 00:02:39,090
و حیوانات دیگر دیدهایم و همچنین در زندگی واقعی آنها را دیدهایم،
58
00:02:39,090 –> 00:02:42,150
زمانی که بچه
59
00:02:42,150 –> 00:02:43,980
بودیم به ما گفته شد که آنها متفاوت هستند،
60
00:02:43,980 –> 00:02:46,730
سپس مغز ما به آرامی متوجه شد که
61
00:02:46,730 –> 00:02:48,930
تمایز بین این دو حیوان
62
00:02:48,930 –> 00:02:53,310
که خاطرات ما به ما این توانایی را می دهد که به
63
00:02:53,310 –> 00:02:56,010
درستی متوجه شویم که کدام یک سگ و
64
00:02:56,010 –> 00:02:58,380
کدام یک گربه است، با دیدن
65
00:02:58,380 –> 00:03:01,950
تفاوت های زیادی بین آنها با استفاده از مفهوم zip،
66
00:03:01,950 –> 00:03:04,440
ما می خواهیم همین کار را
67
00:03:04,440 –> 00:03:06,800
برای شبکه عصبی تشخیص ضبط خود انجام
68
00:03:06,800 –> 00:03:10,140
دهیم، نه دقیقاً به همین دلیل است که
69
00:03:10,140 –> 00:03:12,840
کامپیوتر ما تصویر
70
00:03:12,840 –> 00:03:15,600
را همان طور که ما درک می کنیم نمی بیند، اگر یک تصویر GB داشته باشیم، دسته هایی از
71
00:03:15,600 –> 00:03:18,780
نمادها را می بینیم که شدت
72
00:03:18,780 –> 00:03:22,470
رنگ را در آن پیکسل خاص نشان می دهند،
73
00:03:22,470 –> 00:03:25,110
یکی از راه های
74
00:03:25,110 –> 00:03:29,610
نمایش آنها آرایه ای در لایه های RGB
75
00:03:29,610 –> 00:03:32,070
در حالت معمولی است. شبکه های عصبی از
76
00:03:32,070 –> 00:03:35,130
آنجایی که در سه بعد سازماندهی شده اند خاص هستند
77
00:03:35,130 –> 00:03:38,760
و از نظر عمقی این
78
00:03:38,760 –> 00:03:41,519
امکان را به ما می دهد تا تصویری را برای شبکه تغذیه کنیم
79
00:03:41,519 –> 00:03:45,870
که لایه نهایی یک لایه کاملا
80
00:03:45,870 –> 00:03:49,380
متصل است. به ما بگویید که شبکه تبانی ما چه
81
00:03:49,380 –> 00:03:52,769
پروژهای را انجام میدهد تا همه چیز
82
00:03:52,769 –> 00:03:55,440
واضحتر شود، یک نمونه عکس وجود دارد
83
00:03:55,440 –> 00:03:59,550
که چه چیزی و تیزرهای او نمونهای
84
00:03:59,550 –> 00:04:02,880
از آنچه یا آنچه میبینیم و آنچه
85
00:04:02,880 –> 00:04:05,370
رایانه ما میبیند ما به عنوان یک انسان در این
86
00:04:05,370 –> 00:04:09,570
عکس، توله سگ خود را میبینیم وجود دارد. اگر میخواهیم
87
00:04:09,570 –> 00:04:12,209
تصویر را به روش کامپیوتری ببینیم، ممکن است
88
00:04:12,209 –> 00:04:16,549
از اسکریپت ساده روی این تصویر استفاده کنیم و
89
00:04:16,579 –> 00:04:19,140
این اولین اسکریپت است که
90
00:04:19,140 –> 00:04:22,680
در حال حاضر آن را نمینویسم، اما نسخه متنی آن را ارسال
91
00:04:22,680 –> 00:04:24,389
92
00:04:24,389 –> 00:04:27,360
میکنم تا همان عکسی را که بود بگیریم.
93
00:04:27,360 –> 00:04:33,479
به اندازه poppy GP JPEG و ما تمام
94
00:04:33,479 –> 00:04:36,779
داده های پیکسلی را از آن دریافت می کنیم و می توانیم به سادگی
95
00:04:36,779 –> 00:04:41,430
آن را روی پوسته پایتون خود چاپ کنیم و
96
00:04:41,430 –> 00:04:45,599
دسته ای از نمادها را دریافت خواهیم کرد.
97
00:04:45,599 –> 00:04:48,749
98
00:04:48,749 –> 00:04:54,090
99
00:04:54,090 –> 00:05:00,000
این عکس را قبلاً و من ارزش GB را می فروشم،
100
00:05:00,000 –> 00:05:04,169
پس حالا شما فهمیدید که ما چگونه می
101
00:05:04,169 –> 00:05:08,400
بینیم و چگونه رایانه ها همان
102
00:05:08,400 –> 00:05:10,770
تصویر هستند و چه تفاوتی دارند، بنابراین
103
00:05:10,770 –> 00:05:14,520
ما با این داده ها چه کاری می توانیم انجام دهیم تا
104
00:05:14,520 –> 00:05:17,430
کامپیوتری باشد که باید آن را به همان
105
00:05:17,430 –> 00:05:19,949
روش پردازش کنیم. همانطور که ما این کار را روی مغزمان انجام می دهیم، اما من انجام می دهیم
106
00:05:19,949 –> 00:05:24,419
به طور خودکار بیشتر، بنابراین اکنون که ما
107
00:05:24,419 –> 00:05:26,839
درک اولیه ای از اینکه چه
108
00:05:26,839 –> 00:05:29,550
شبکه عصبی کانولوشنالی انجام می دهیم،
109
00:05:29,550 –> 00:05:32,009
از این روش برای شکستن تصو