در این مطلب، ویدئو شروع به کار با Microsoft Azure Computer Vision API در پایتون (بخش 2: استخراج دست خط) با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:25:13
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:02,080 –> 00:00:03,760
برای نصب کتابخانه نسخه کامپیوتر لاجوردی
2
00:00:03,760 –> 00:00:04,799
3
00:00:04,799 –> 00:00:06,960
در ترمینال می خواهیم تایپ کنیم pub
4
00:00:06,960 –> 00:00:08,800
install
5
00:00:08,800 –> 00:00:10,400
و نام کتابخانه
6
00:00:10,400 –> 00:00:11,759
Azure
7
00:00:11,759 –> 00:00:13,200
dash
8
00:00:13,200 –> 00:00:17,039
cognitive services
9
00:00:17,039 –> 00:00:18,000
dash
10
00:00:18,000 –> 00:00:19,920
vision
11
00:00:19,920 –> 00:00:20,880
dash
12
00:00:20,880 –> 00:00:24,320
نسخه کامپیوتر خواهد بود
13
00:00:28,880 –> 00:00:32,159
و من sdk را نصب می کنم
14
00:00:32,159 –> 00:00:34,480
بنابراین برای مثال اول می خواهم
15
00:00:34,480 –> 00:00:36,320
نشان دهم شما چگونه میتوانیم از
16
00:00:36,320 –> 00:00:39,520
api نسخه رایانه لاجوردی برای تشخیص دستخطها استفاده کنیم،
17
00:00:39,520 –> 00:00:41,440
بنابراین اینجا در
18
00:00:41,440 –> 00:00:43,040
گروه دستخطهای reddit
19
00:00:43,040 –> 00:00:45,120
متوجه شدم که این عکس
20
00:00:45,120 –> 00:00:47,840
دو نوع دستخط مختلف دارد
21
00:00:47,840 –> 00:00:49,920
و میخواهم برنامهای ایجاد کنم تا
22
00:00:49,920 –> 00:00:53,840
دستخطها را به صورت متنی استخراج کنیم،
23
00:00:53,840 –> 00:00:56,480
بنابراین بیایید برویم. به
24
00:00:56,480 –> 00:00:58,719
اسکریپت پایتون من و اجازه دهید با
25
00:00:58,719 –> 00:01:02,000
وارد کردن کتابخانهها به
26
00:01:03,840 –> 00:01:05,680
درستی شروع کنم، بنابراین ماژول os را وارد میکنم،
27
00:01:05,680 –> 00:01:08,080
28
00:01:08,080 –> 00:01:10,799
ماژول i o را وارد میکنم
29
00:01:10,799 –> 00:01:14,080
و از ms rest
30
00:01:14,080 –> 00:01:15,920
احراز هویت
31
00:01:15,920 –> 00:01:19,520
میخواهم کلاس اعتبار خدمات شناختی را وارد کنم
32
00:01:19,520 –> 00:01:23,320
33
00:01:28,240 –> 00:01:29,200
34
00:01:29,200 –> 00:01:32,240
تلفن بعدی
35
00:01:32,240 –> 00:01:35,759
خدمات شناختی لاجوردی
36
00:01:37,040 –> 00:01:38,560
37
00:01:38,560 –> 00:01:42,240
دید کامپیوتر
38
00:01:42,240 –> 00:01:44,479
نسخه میخواهم کلاس کلاینت نسخه کامپیوتر را وارد کنم
39
00:01:44,479 –> 00:01:47,920
40
00:01:48,320 –> 00:01:51,040
و اجازه دهید این خط را همینجا کپی
41
00:01:51,040 –> 00:01:54,920
کنم، دو نسخه دیگر درست میکنم،
42
00:01:56,560 –> 00:01:58,079
بنابراین از
43
00:01:58,079 –> 00:01:59,759
کامپیوتر نسخه
44
00:01:59,759 –> 00:02:02,479
مدلها را
45
00:02:02,479 –> 00:02:05,600
میخواهم کلاس کد وضعیت عملیات را وارد کنم
46
00:02:05,600 –> 00:02:07,680
47
00:02:07,680 –> 00:02:09,840
48
00:02:10,318 –> 00:02:13,360
و این کلاس انواع ویژگیهای ویژن
49
00:02:13,360 –> 00:02:15,599
بود
50
00:02:16,239 –> 00:02:18,239
و چون
51
00:02:18,239 –> 00:02:20,400
میخواهم یک کد api
52
00:02:20,400 –> 00:02:23,680
برای دانلود این تصویر بسازم،
53
00:02:23,680 –> 00:02:27,120
بنابراین باید کتابخانه بحران
54
00:02:27,120 –> 00:02:29,040
را وارد کنم و مجاز خواهد بود.
55
00:02:29,040 –> 00:02:31,680
56
00:02:31,680 –> 00:02:34,400
و برای نمایش
57
00:02:34,400 –> 00:02:37,120
نتیجه، از کتابخانه
58
00:02:37,120 –> 00:02:40,800
59
00:02:40,800 –> 00:02:43,599
60
00:02:43,599 –> 00:02:45,920
61
00:02:45,920 –> 00:02:49,959
62
00:02:50,080 –> 00:02:52,239
63
00:02:52,239 –> 00:02:53,680
64
00:02:53,680 –> 00:02:56,400
65
00:02:58,560 –> 00:03:02,879
pillows استفاده میکنم، بنابراین از pil تایپ میکنم، میخواهم کلاس تصویر دراور و کلاس تلفن تصویر را وارد کنم، بنابراین اینجا کتابخانهها را وارد میکنم و مارجونا را دریافت میکنم. اینجا پیدا شد
66
00:03:02,879 –> 00:03:04,400
، حدس میزنم من هرگز کتابخانه pillows را نصب نکردهام،
67
00:03:04,400 –> 00:03:05,599
68
00:03:05,599 –> 00:03:08,400
بنابراین اجازه دهید همین الان این کار را انجام دهم
69
00:03:08,400 –> 00:03:10,239
تا کتابخانه pillows را نصب
70
00:03:10,239 –> 00:03:12,480
کنم، من نظر را تایپ میکنم pip
71
00:03:12,480 –> 00:03:13,760
install
72
00:03:13,760 –> 00:03:16,760
pillow
73
00:03:18,720 –> 00:03:22,000
حالا اجازه دهید دوباره کتابخانه را وارد کنم،
74
00:03:24,879 –> 00:03:28,400
صدایم را بشنوید، این جلسه کاملاً خاتمه یافت،
75
00:03:28,400 –> 00:03:32,519
بنابراین من این بلوک کد را اجرا کنید
76
00:03:34,480 –> 00:03:38,799
و یک اشتباه تایپی داشته باشید باید تصویر پیدا شود در
77
00:03:39,120 –> 00:03:42,480
مرحله بعد می خواهم یک فایل json ایجاد کنم
78
00:03:42,480 –> 00:03:44,480
و این فایل json
79
00:03:44,480 –> 00:03:47,920
کلید api من را در نقطه پایانی api نسخه کامپیوتر لاجوردی من
80
00:03:47,920 –> 00:03:49,440
81
00:03:49,440 –> 00:03:51,599
82
00:03:51,599 –> 00:03:52,480
ذخیره
83
00:03:52,480 –> 00:03:54,959
84
00:03:54,959 –> 00:03:57,519
85
00:03:59,519 –> 00:04:01,840
می کند. ساعت قبل از اینکه
86
00:04:01,840 –> 00:04:04,000
کلید api خود
87
00:04:04,000 –> 00:04:06,319
را بگیریم، به من اجازه دهید
88
00:04:06,319 –> 00:04:08,720
89
00:04:12,640 –> 00:04:15,840
دقیقاً به حساب خود وارد شوم، بنابراین در زیر گروه منبع،
90
00:04:15,840 –> 00:04:18,000
در واقع نه گروه منبع، باید
91
00:04:18,000 –> 00:04:21,880
نسخه رایانه ای باشد،
92
00:04:28,800 –> 00:04:31,199
بنابراین در اینجا اجازه دهید کلید api خود را بگیرم،
93
00:04:31,199 –> 00:04:32,560
94
00:04:32,560 –> 00:04:35,600
من می خواهم همه چیز را
95
00:04:35,600 –> 00:04:39,240
بعد از این ویدیو حذف کنم
96
00:04:43,360 –> 00:04:46,639
و این کار ادامه دارد. برای اینکه نقطه پایانی
97
00:04:53,759 –> 00:04:55,040
درست باشد،
98
00:04:55,040 –> 00:04:59,759
اجازه دهید ماژول json را وارد
99
00:05:02,080 –> 00:05:05,840
کنم و من میخواهم کلید api خود را بارگیری کنم،
100
00:05:07,840 –> 00:05:10,600
بنابراین
101
00:05:10,600 –> 00:05:14,240
ابتدا فایل credential.json را باز میکنم
102
00:05:14,240 –> 00:05:17,280
سپس از دانلود ماژول json
103
00:05:17,280 –> 00:05:20,800
میخواهم محتوا را بارگیری
104
00:05:22,840 –> 00:05:27,800
کنم و پوسته را روی آن قرار دهم. نقطه پایان
105
00:05:48,000 –> 00:05:50,320
درست است، بنابراین
106
00:05:50,320 –> 00:05:52,720
من
107
00:05:52,720 –> 00:05:56,560
کلید api و آدرس نقطه پایانی خود را وارد کردهام،
108
00:05:56,560 –> 00:05:58,800
اکنون میخواهم نمونه سرویس نسخه رایانه خود را ایجاد کنم
109
00:05:58,800 –> 00:06:00,400
110
00:06:00,400 –> 00:06:02,160
111
00:06:02,160 –> 00:06:04,800
و برای انجام این کار باید از کلاس کلاینت نسخه رایانه استفاده کنم
112
00:06:04,800 –> 00:06:07,520
113
00:06:07,520 –> 00:06:10,000
و اجازه دهید خروجی را همانطور که cv
114
00:06:10,000 –> 00:06:11,919
مخفف کلاینت نسخه کامپیوتری
115
00:06:11,919 –> 00:06:14,240
underscore
116
00:06:14,240 –> 00:06:16,880
در داخل است فراخوانی کنیم. کلاس کلاینت نسخه کامپیوتری
117
00:06:16,880 –> 00:06:19,520
که باید نقطه پایانی
118
00:06:19,520 –> 00:06:22,639
و کلید api را پاس کنیم،
119
00:06:23,520 –> 00:06:25,680
منظورم این است
120
00:06:25,680 –> 00:06:28,479
که پنجره ای را که متوجه شدم در
121
00:06:28,479 –> 00:06:31,120
مقابل کد من
122
00:06:31,120 –> 00:06:34,440
این ماژول ها را
123
00:06:40,720 –> 00:06:43,280
درست تشخیص نمی دهد، تازه می کنم، پس بیایید ادامه دهیم اجازه دهید
124
00:06:43,280 –> 00:06:46,080
فونت s را افزایش دهم. ize
125
00:06:47,039 –> 00:06:50,319
و در اینجا اشتباه تایپی باید وارد شود،
126
00:06:50,319 –> 00:06:51,759
بنابراین اجازه دهید من ادامه دهم و نمونه مشتری
127
00:06:51,759 –> 00:06:53,440
نسخه کامپیوتری را ایجاد کنم،
128
00:06:53,440 –> 00:06:56,240
129
00:06:56,400 –> 00:06:57,360
اوه،
130
00:06:57,360 –> 00:07:01,560
پس این یک نمونه جدید خواهد بود،
131
00:07:05,599 –> 00:07:07,280
اکنون باید
132
00:07:07,280 –> 00:07:10,240
ریل تصویر را بگیرم
133
00:07:12,160 –> 00:07:14,160
تا این
134
00:07:14,160 –> 00:07:16,960
منبع فایل رسانه ای من باشد.
135
00:07:16,960 –> 00:07:18,319
من یک متغیر به نام
136
00:07:18,319 –> 00:07:20,240
image url ایجاد
137
00:07:20,240 –> 00:07:22,639
می کنم، بنابراین به شما نشان می دهم که چگونه
138
00:07:22,639 –> 00:07:25,039
از یک تصویر آنلاین استفاده کنید، سپس
139
00:07:25,039 –> 00:07:28,080
نحوه استفاده از فایل محلی را به شما نشان می دهم
140
00:07:28,080 –> 00:07:30,479
اکنون می توانم درخواستی برای اضافه کردن
141
00:07:30,479 –> 00:07:32,720
سرور نسخه رایانه شما
142
00:07:32,720 –> 00:07:34,880
به آن ارائه کنم. این تصویر را
143
00:07:34,880 –> 00:07:37,599
برای تجزیه و تحلیل ارسال کنید
144
00:07:38,000 –> 00:07:39,360
و برای انجام آن
145
00:07:39,360 –> 00:07:42,560
در اینجا به من اجازه دهید دقیقاً وارد مستندات شوم،
146
00:07:42,560 –> 00:07:44,720
بنابراین از
147
00:07:44,720 –> 00:07:47,759
کلاس اختلاط عملیات کلاینت نسخه کامپیوتری،
148
00:07:47,759 –> 00:07:51,759
میخواهم از روش خواندن استفاده
149
00:07:53,520 –> 00:07:55,360
کنم و درست اینجاست، اجازه دهید
150
00:07:55,360 –> 00:07:57,520
کمی
151
00:07:57,520 –> 00:07:59,840
بیشتر بزرگنمایی کنم، بنابراین اوه دو روش مختلف
152
00:07:59,840 –> 00:08:00,720
خواندن
153
00:08:00,720 –> 00:08:02,080
154
00:08:02,080 –> 00:08:04,479
این یکی برای خواندن یک تصویر
155
00:08:04,479 –> 00:08:05,840
از وب
156
00:08:05,840 –> 00:08:08,160
و خواندن رشته زمانی استفاده می شود
157
00:08:08,160 –> 00:08:09,840
که می خواهید فایلی را از درایو محلی خود بارگیری کنید،
158
00:08:09,840 –> 00:08:13,120
159
00:08:13,120 –> 00:08:15,680
بنابراین من می خواهم cv را در دفتر خاطرات اسکرول کلاینت تایپ کنم
160
00:08:15,680 –> 00:08:18,000
161
00:08:18,000 –> 00:08:20,400
162
00:08:21,039 –> 00:08:23,360
و اولین پارامتر من به
163
00:08:23,360 –> 00:08:26,680
آدرس اینترنتی باشد
164
00:08:27,680 –> 00:08:30,560
و من همچنین دوست دارم
165
00:08:30,560 –> 00:08:33,919
زبان را مشخص کنم، بنابراین به طور پیش فرض
166
00:08:33,919 –> 00:08:36,399
روش خواندن به طور خودکار زبان را شناسایی می کند،
167
00:08:36,399 –> 00:08:37,679
168
00:08:37,679 –> 00:08:39,599
اما برای
169
00:08:39,599 –> 00:08:41,120
افزایش دقت
170
00:08:41,120 –> 00:08:45,680
،
171
00:08:45,760 –> 00:08:47,440
اگر نمی دانید چه زبان هایی
172
00:08:47,440 –> 00:08:48,880
173
00:08:48,880 –> 00:08:51,600
پشتیبانی می شود، دوست دارم ابزار زبان را مشخص کنم. صفحه پشتیبانی زبان برای
174
00:08:51,600 –> 00:08:53,440
نسخه کامپیوتر
175
00:08:53,440 –> 00:08:57,920
و در اینجا لیستی از زبان های پشتیبانی شده است
176
00:08:57,920 –> 00:08:59,920
و من تمام پیوندها را در
177
00:08:59,920 –> 00:09:01,760
توضیحات زیر
178
00:09:01,760 –> 00:09:05,519
قرار می دهم و همه آن چیزی است که باید
179
00:09:05,519 –> 00:09:09,640
مشخص کنیم، خروجی را به عنوان پاسخ نام می برم،
180
00:09:10,320 –> 00:09:12,240
بنابراین در اینجا اجازه
181
00:09:12,240 –> 00:09:16,839
دهید این را در یکی قرار دهم
182
00:09:22,080 –> 00:09:24,880
حالا به من اجازه دهید گزینه پاسخ را ایجاد کنم،
183
00:09:24,880 –> 00:09:29,360
اوه، فراموش کردم که URL تصویر را ایجاد
184
00:09:30,080 –> 00:09:32,399
کنم اگر با این عبارت در اینجا اجرا
185
00:09:32,399 –> 00:09:37,360
میکنم، میخواهم ویژگی را در اینجا
186
00:09:37,360 –> 00:09:39,360
کاملاً درست دریافت کنم، زیرا ما یک
187
00:09:39,360 –> 00:09:40,480
تصویر خام را
188
00:09:40,480 –> 00:09:42,160
189
00:09:42,160 –> 00:09:43,839
در اصل به فایل اصلی ارسال میکنیم.
190
00:09:43,839 –> 00:09:45,040
ما
191
00:09:45,040 –> 00:09:50,160
باید پارامتر ابرو را روی 2 تنظیم کنیم.
192
00:09:50,160 –> 00:09:54,000
و من هنوز هم ویژگی را دریافت می کنم،
193
00:09:57,360 –> 00:10:00,480
بنابراین در اینجا چیزی دارم،
194
00:10:00,480 –> 00:10:03,040
بنابراین وقتی کلید api را پاس می کنیم، باید
195
00:10:03,040 –> 00:10:05,839
کلید را با استفاده از
196
00:10:05,839 –> 00:10:09,680
کلاس اعتبار خدمات شناختی ارسال
197
00:10:09,680 –> 00:10:12,240
کنیم، بنابراین فقط باید wrap کنیم. api k ey با
198
00:10:12,240 –> 00:10:14,240
استفاده از این کلاس
199
00:10:14,240 –> 00:10:18,800
و اجازه دهید نمونه مشتری cv خود را درست بسازم،
200
00:10:18,800 –> 00:10:23,040
بنابراین اگر خط 17 را اجرا
201
00:10:23,519 –> 00:10:25,279
کنم، باید بتوانم متد حلقه
202
00:10:25,279 –> 00:10:27,760
203
00:10:29,279 –> 00:10:31,440
را اجرا کنم اگر گزینه پاسخ را چاپ کنم، اکنون
204
00:10:31,440 –> 00:10:33,839
به عنوان یک گزینه پاسخ خام مشتری برمی گردد.
205
00:10:33,839 –> 00:10:36,320
206
00:10:37,200 –> 00:10:38,720
برای
207
00:10:38,720 –> 00:10:41,440
ارسال پاسخ به
208
00:10:41,440 –> 00:10:43,920
نسخه کامپیوتری لاجوردی برای تجزیه و تحلیل
209
00:10:43,920 –> 00:10:46,640
تصویر و استخراج دست خط
210
00:10:46,640 –> 00:10:48,880
و برای انجام این کار،
211
00:10:48,880 –> 00:10:50,399
گزینه پاسخ را
212
00:10:50,399 –> 00:10:52,800
سرصفحههای نقطه درج
213
00:10:52,800 –> 00:10:55,360
214
00:10:55,360 –> 00:10:57,440
215
00:10:57,440 –> 00:10:58,399
216
00:10:58,399 –> 00:11:01,839
217
00:11:01,839 –> 00:11:06,720
میکنم، به کلید محل خط تیره عملیات ارجاع میدهم، عملیات خروجی را نام میبرم. مکان
218
00:11:07,040 –> 00:11:08,959
و
219
00:11:08,959 –> 00:11:11,760
220
00:11:12,240 –> 00:11:16,160
اگر به نقطه پایانی نگاه کنیم، یک شناسه منحصربهفرد برمیگردانیم
221
00:11:16,800 –> 00:11:20,079
، اساساً در حال ایجاد یک کلید منحصربهفرد
222
00:11:20,079 –> 00:11:23,200
مرتبط با این تصویر هستیم
223
00:11:23,200 –> 00:11:25,200
و من باید
224
00:11:25,200 –> 00:11:28,880
ابتدا این کلید را در اینجا اضافه
225
00:11:28,880 –> 00:11:33,040
کنم، بنابراین من کلید عملیات متغیر را
226
00:11:33,040 –> 00:11:35,040
227
00:11:35,040 –> 00:11:38,560
و از محل عملیات نام میبرم.
228
00:11:39,360 –> 00:11:41,760
من میخواهم url را
229
00:11:41,760 –> 00:11:45,279
با استفاده از مخرج چهار اسلش تقسیم
230
00:11:45,279 –> 00:11:48,959
کنم، میخواهم آخرین عنصر را
231
00:11:50,639 –> 00:11:53,519
بگیرم و این یکی کلید عملیات را به من میدهد
232
00:11:53,519 –> 00:11:54,560
تا
233
00:11:54,560 –> 00:11:56,880
نتیجه را بگیرم
234
00:11:56,880 –> 00:11:58,959
و نتیجه را
235
00:11:58,959 –> 00:12:01,519
از مشتری cv بازیابی کنم
236
00:12:01,519 –> 00:12:03,200
که میخواهیم
237
00:12:03,200 –> 00:1