در این مطلب، ویدئو مقدمه ای بر PyTesseract (OCR در آموزش پایتون 02.03) با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:06:18
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:03,570 –> 00:00:09,780
[موسیقی]
2
00:00:11,519 –> 00:00:13,519
سلام و خوش آمدید به سری
3
00:00:13,519 –> 00:00:15,360
اجرای ocr و python
4
00:00:15,360 –> 00:00:17,039
اکنون در آخرین ویدیوی بسیار
5
00:00:17,039 –> 00:00:18,880
طولانی بود، روش های مختلفی را به شما معرفی کردم
6
00:00:18,880 –> 00:00:19,920
که
7
00:00:19,920 –> 00:00:22,480
می توانید و واقعاً باید برای پیش پردازش تصویر اعمال کنید
8
00:00:22,480 –> 00:00:24,400
تا به نتایج بهتری برسید.
9
00:00:24,400 –> 00:00:25,920
Pi tesseract
10
00:00:25,920 –> 00:00:27,920
اکنون زمان آن فرا رسیده است
11
00:00:27,920 –> 00:00:29,439
که شما را با اصول اولیه pi
12
00:00:29,439 –> 00:00:30,560
tesseract آشنا
13
00:00:30,560 –> 00:00:33,040
14
00:00:33,040 –> 00:00:35,280
15
00:00:35,280 –> 00:00:36,320
16
00:00:36,320 –> 00:00:38,079
17
00:00:38,079 –> 00:00:39,520
18
00:00:39,520 –> 00:00:43,120
کنیم. از رسیدها گرفته
19
00:00:43,120 –> 00:00:45,840
تا متن تک ستونی که ما
20
00:00:45,840 –> 00:00:47,120
21
00:00:47,120 –> 00:00:51,039
در این ویدیو کمی از آن را انجام می دهیم، دو متن چند
22
00:00:51,039 –> 00:00:53,440
ستونی مانند شاخص ها و تا تمام
23
00:00:53,440 –> 00:00:54,160
24
00:00:54,160 –> 00:00:56,960
داده های جدولی، بنابراین اجازه دهید
25
00:00:56,960 –> 00:00:58,000
به اصول اولیه
26
00:00:58,000 –> 00:00:59,760
عمل آزمایش pi بپردازیم. نحوه تعامل با
27
00:00:59,760 –> 00:01:02,079
کتابخانه اولین کاری که
28
00:01:02,079 –> 00:01:04,000
می خواهید انجام دهید این است که اکنون pi
29
00:01:04,000 –> 00:01:05,840
tesseract
30
00:01:05,840 –> 00:01:07,600
را وارد کنید اگر قبلاً این کار را نکرده اید
31
00:01:07,600 –> 00:01:09,920
لطفاً ویدیوی من را در مورد نصب
32
00:01:09,920 –> 00:01:11,280
این کتابخانه ها تماشا کنید زیرا
33
00:01:11,280 –> 00:01:13,680
pi teste r act از شما می خواهد که نه تنها
34
00:01:13,680 –> 00:01:14,960
آن را نصب کنید، بلکه باید
35
00:01:14,960 –> 00:01:18,000
آن را به صورت یک تسراکت در مسیر داشته باشید
36
00:01:18,000 –> 00:01:20,159
، کار بعدی که باید انجام دهیم این است که
37
00:01:20,159 –> 00:01:21,680
باید بگوییم از pil
38
00:01:21,680 –> 00:01:24,960
all caps وجود دارد، تصویر را با بزرگ وارد کنید،
39
00:01:24,960 –> 00:01:26,799
40
00:01:26,799 –> 00:01:28,799
بیایید ادامه دهیم و سلول import خود را اجرا کنیم.
41
00:01:28,799 –> 00:01:30,799
اکنون باید
42
00:01:30,799 –> 00:01:32,560
یک نوع فایل ایجاد کنیم که بتوانیم به نوعی با
43
00:01:32,560 –> 00:01:33,840
آن تماس
44
00:01:33,840 –> 00:01:35,600
بگیریم و همانطور که به جلو می رویم،
45
00:01:35,600 –> 00:01:37,439
این را فایل تصویر اصلی خود می نامیم
46
00:01:37,439 –> 00:01:40,759
و این همان تصویر خام استاندارد پایگاه داده
47
00:01:40,759 –> 00:01:42,159
databackslastpage01.jpg است
48
00:01:42,159 –> 00:01:45,040
که
49
00:01:45,040 –> 00:01:46,399
در ابتدا کار کردیم. با
50
00:01:46,399 –> 00:01:47,840
و فقط برای اینکه بتوانید ببینید که چه شکلی است،
51
00:01:47,840 –> 00:01:49,439
بیایید آن را به سرعت اینجا
52
00:01:49,439 –> 00:01:50,240
بکشیم
53
00:01:50,240 –> 00:01:52,079
و همه اینها در github است، به نظر می رسید که اینگونه به نظر می
54
00:01:52,079 –> 00:01:54,320
رسد که
55
00:01:54,320 –> 00:01:57,040
ویرایش نشده است، هنوز هم مرز بدون
56
00:01:57,040 –> 00:01:59,280
هیچ تغییری در رنگ آمیزی وجود دارد.
57
00:01:59,280 –> 00:02:00,399
ما قرار است
58
00:02:00,399 –> 00:02:02,399
با آن کار کنیم تصویر بدون نویز
59
00:02:02,399 –> 00:02:03,840
در اینجا چیزی است که می خواهید
60
00:02:03,840 –> 00:02:05,439
ببینید تفاوت اساسی
61
00:02:05,439 –> 00:02:08,239
در خروجی ما از این دو تصویر است، بنابراین
62
00:02:08,239 –> 00:02:08,800
اجازه
63
00:02:08,800 –> 00:02:12,160
دهید به این نوت بوک jupyter برگردیم
64
00:02:12,160 –> 00:02:15,120
اکنون اجازه دهید بگوییم که می خواهیم
65
00:02:15,120 –> 00:02:15,680
no
66
00:02:15,680 –> 00:02:18,160
n را ایجاد کنید فایل تصویری oise نیز همینطور، بنابراین ما
67
00:02:18,160 –> 00:02:19,360
میخواهیم بگوییم که این دما است
68
00:02:19,360 –> 00:02:21,040
زیرا در پوشه temp ما قرار دارد و
69
00:02:21,040 –> 00:02:22,920
بدون نویز زیرخط است.
70
00:02:22,920 –> 00:02:25,040
jpg به یاد داشته باشید که همه اینها را در ویدیوی آخر ساختهایم،
71
00:02:25,040 –> 00:02:26,239
72
00:02:26,239 –> 00:02:27,760
اجازه دهید ادامه دهیم و فقط آن
73
00:02:27,760 –> 00:02:30,319
اشیاء را ایجاد کنیم. باید
74
00:02:30,319 –> 00:02:32,800
یک تصویر در حافظه ایجاد کنیم، ما
75
00:02:32,800 –> 00:02:34,879
از کتابخانه بالش برای این
76
00:02:34,879 –> 00:02:37,519
کار استفاده می کنیم، بنابراین می گوییم img برابر با تصویر
77
00:02:37,519 –> 00:02:38,640
با یک
78
00:02:38,640 –> 00:02:41,440
نقطه بزرگ و بزرگ است و اجازه دهید
79
00:02:41,440 –> 00:02:42,879
فایل تصویر اصلی خود را
80
00:02:42,879 –> 00:02:44,720
اکنون که بارگذاری شده است، آزمایش کنیم. در حافظه
81
00:02:44,720 –> 00:02:47,040
بیایید سعی کنیم یک نتیجه ocr ایجاد کنیم
82
00:02:47,040 –> 00:02:49,120
و در اینجا چیزی است که از
83
00:02:49,120 –> 00:02:51,120
کتابخانه pi
84
00:02:51,120 –> 00:02:53,440
85
00:02:53,440 –> 00:02:55,519
86
00:02:55,519 –> 00:02:58,959
87
00:02:58,959 –> 00:03:00,319
tesseract استفاده می کنیم. ما این کار را انجام می دهیم این است
88
00:03:00,319 –> 00:03:02,239
که تصویر را می گیریم و به قفسه تست pi می گوییم که
89
00:03:02,239 –> 00:03:04,319
آن را به یک رشته برای ما تبدیل کند،
90
00:03:04,319 –> 00:03:05,440
به عبارت دیگر،
91
00:03:05,440 –> 00:03:08,560
به آن می گوییم که تصویر واقعی را تصویر کند
92
00:03:08,560 –> 00:03:09,680
و می خواهیم بگوییم که می خواهیم برای
93
00:03:09,680 –> 00:03:12,319
ocr کردن فایل تصویری،
94
00:03:12,319 –> 00:03:14,959
بیایید این کار را انجام دهیم و ocr resu را
95
00:03:14,959 –> 00:03:15,360
چاپ کنیم
96
00:03:15,360 –> 00:03