در این مطلب، ویدئو ًں“„آ؟Cأ3چگونه متن را از PDF استخراج کنم؟ | فیتز | PyMuPDF | پایتون │آ، بسیار بد، بیمار! با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:13:38
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,000 –> 00:00:02,070
این بار چطوری؟
2
00:00:02,070 –> 00:00:04,859
نحوه استخراج متن از a را نشان خواهیم داد
3
00:00:04,859 –> 00:00:08,090
فایل pdf و در اینجا قصد داریم آن را با آن تست کنیم
4
00:00:08,090 –> 00:00:12,170
این مقاله که دارای چند جدول است
5
00:00:12,170 –> 00:00:15,540
چند تصویر و سپس بررسی می کنیم
6
00:00:15,540 –> 00:00:17,699
تا ببینیم چقدر می توان استخراج کرد
7
00:00:17,699 –> 00:00:19,410
متن این ممکن است مفید باشد
8
00:00:19,410 –> 00:00:23,410
وقتی می خواهند با ابزار کار کنند
9
00:00:23,410 –> 00:00:28,010
تجزیه و تحلیل کلمات و بیایید آن را انجام دهیم
10
00:00:28,010 –> 00:00:31,220
همچنین با این پی دی اف دیگر که همینطور است
11
00:00:31,220 –> 00:00:33,610
ساده
12
00:00:33,610 –> 00:00:36,620
خوب پس ما دو گزینه داریم و
13
00:00:36,620 –> 00:00:38,840
پس بیایید ابتدا با این شروع کنیم.
14
00:00:38,840 –> 00:00:41,660
ماژول به عنوان feaps وارد می شود
15
00:00:41,660 –> 00:00:43,970
ما شما را در جعبه توضیحات قرار می دهیم
16
00:00:43,970 –> 00:00:47,060
پیوند به صفحه رسمی که در آن
17
00:00:47,060 –> 00:00:48,830
خطی که باید کپی کنید و
18
00:00:48,830 –> 00:00:51,140
چسباندن بتوانید آن را نصب کنید بسیار می شود
19
00:00:51,140 –> 00:00:55,640
اگر از لینوکس استفاده می کنید ساده است
20
00:00:55,640 –> 00:00:58,489
آنها می توانند در ترمینال انجام دهند و هستند
21
00:00:58,489 –> 00:01:01,220
با استفاده از ویندوز به یاد داشته باشید که وجود دارد
22
00:01:01,220 –> 00:01:03,500
فراخوانی خط فرمان پس از آن است
23
00:01:03,500 –> 00:01:06,050
فقط یک خط بنویس و voila
24
00:01:06,050 –> 00:01:08,630
خیلی خوبه چون من اینجوری دارم
25
00:01:08,630 –> 00:01:11,600
بنابراین در حال حاضر من قصد دارم به خواندن سند که
26
00:01:11,600 –> 00:01:13,610
این پی دی اف است بنابراین من آن را به این صورت قرار می دهم
27
00:01:13,610 –> 00:01:16,060
pdf
28
00:01:17,680 –> 00:01:20,290
ما نمی توانیم آن را به زبان اسپانیایی و
29
00:01:20,290 –> 00:01:22,570
اینجا در نقل قول چون من شروع می کنم
30
00:01:22,570 –> 00:01:25,650
ابتدا با کسی که اوست کار کنید
31
00:01:25,650 –> 00:01:29,380
مقاله سپس و نوشتن مقاله نقطه
32
00:01:29,380 –> 00:01:31,940
pdf
33
00:01:31,940 –> 00:01:35,960
و سپس من قصد دارم یک شی دیگر را ایجاد کنم
34
00:01:35,960 –> 00:01:38,390
برمی خیزد بیایید نام آن را بگذاریم
35
00:01:38,390 –> 00:01:41,830
سند به زبان اسپانیایی نیز به همین صورت خواهد بود
36
00:01:41,830 –> 00:01:44,200
در قرار دادن چند فاصله در اینجا به طوری که
37
00:01:44,200 –> 00:01:46,570
آنقدر شلوغ به نظر نرسید که با آن تماس خواهند گرفت
38
00:01:46,570 –> 00:01:50,620
ماژول که فیتز نقطه باز است اجازه دهید
39
00:01:50,620 –> 00:01:52,290
تماشا کردن
40
00:01:52,290 –> 00:01:56,970
وجود دارد و ما نام را در آنجا قرار می دهیم
41
00:01:56,970 –> 00:02:00,430
داره فایل رو خوب میخونه
42
00:02:00,430 –> 00:02:03,040
پس از آن ما می توانیم ملاقات کنیم
43
00:02:03,040 –> 00:02:05,200
چند چیز خیلی ساده مثل
44
00:02:05,200 –> 00:02:07,360
تعداد صفحاتی که به بهترین شکل ارائه می کند
45
00:02:07,360 –> 00:02:09,520
سپس داده های نویسنده و غیره
46
00:02:09,520 –> 00:02:11,230
این چیزی است که ما در حال حاضر سعی خواهیم کرد
47
00:02:11,230 –> 00:02:15,680
اول اینجا چاپ می شود
48
00:02:15,680 –> 00:02:18,200
تعداد صفحات از راه وجود دارد
49
00:02:18,200 –> 00:02:20,720
یک لهجه از دست رفته بیا برویم
50
00:02:20,720 –> 00:02:22,620
آن را بنویس
51
00:02:22,620 –> 00:02:25,590
در اینجا یک فاصله و هیچ چیز دیگری وجود ندارد
52
00:02:25,590 –> 00:02:28,530
با کاما سند قرار می دهیم
53
00:02:28,530 –> 00:02:31,709
جایی که ما نگه می داریم کجاست
54
00:02:31,709 –> 00:02:33,750
جسمی که روی آن با باز می شود
55
00:02:33,750 –> 00:02:36,840
ماژول fitz و سپس یکی را فراخوانی می کنیم
56
00:02:36,840 –> 00:02:39,209
از روش هایی که برای شمارش است
57
00:02:39,209 –> 00:02:42,480
صفحاتی که تعداد صفحات و سپس
58
00:02:42,480 –> 00:02:45,450
از این پس ما می خواهیم همین کار را انجام دهیم اما
59
00:02:45,450 –> 00:02:47,760
هیچ چیز بیشتر با آن داده است
60
00:02:47,760 –> 00:02:50,329
دقیقاً به عنوان ابرداده ماه شناخته می شود
61
00:02:50,329 –> 00:02:55,190
در اینجا ما قصد داریم آن را مانند این ابرداده قرار دهیم
62
00:02:55,980 –> 00:03:00,310
نقاط فاصله برابر با کاما و
63
00:03:00,310 –> 00:03:03,129
ما سند بعدا می آید
64
00:03:03,129 –> 00:03:07,900
نقطه و متا داده پس خوب اجازه دهید
65
00:03:07,900 –> 00:03:10,310
سعی کنید ببینید بله
66
00:03:10,310 –> 00:03:12,620
اگر هیچ خطایی نداشته باشیم وجود دارد
67
00:03:12,620 –> 00:03:14,620
همچنین تعداد صفحات چون دارد
68
00:03:14,620 –> 00:03:17,300
28 و در اینجا اطلاعاتی وجود دارد که
69
00:03:17,300 –> 00:03:19,580
من هم اینجا نظر دادم می تونی بدونی
70
00:03:19,580 –> 00:03:22,310
به خوبی رمزگذاری شده است چه نوع
71
00:03:22,310 –> 00:03:24,830
رمزگذاری در صورت وجود دارد
72
00:03:24,830 –> 00:03:25,970
کلید واژه ها
73
00:03:25,970 –> 00:03:29,120
نویسنده و غیره سپس این و سپس به
74
00:03:29,120 –> 00:03:30,620
بهترین در موقعیتی که می توانند
75
00:03:30,620 –> 00:03:33,110
استفاده کنید و دیدید که بسیار ساده است
76
00:03:33,110 –> 00:03:36,290
در حال حاضر قادر به استخراج و در حال حاضر اگر
77
00:03:36,290 –> 00:03:38,510
اطلاعات مستقیم از
78
00:03:38,510 –> 00:03:40,430
صفحه خاصی در حال حاضر آنها در حال رفتن به
79
00:03:40,430 –> 00:03:42,650
برای همه صفحات باشد اما اینجا بله
80
00:03:42,650 –> 00:03:45,049
کمی کار با یک صفحه در می خواهم
81
00:03:45,049 –> 00:03:47,450
خاص زیرا ما فقط می خواهیم یک را ایجاد کنیم
82
00:03:47,450 –> 00:03:51,830
شی به نام صفحه و سپس
83
00:03:51,830 –> 00:03:53,450
ما از طریق آن ارجاع می دهیم
84
00:03:53,450 –> 00:03:57,320
شی بیایید سند را نقطه لو قرار دهیم
85
00:03:57,320 –> 00:03:59,850
باعث بارگیری می شود
86
00:03:59,850 –> 00:04:02,610
شما آن را می بینید و از قبل باید انتخاب کنید
87
00:04:02,610 –> 00:04:04,680
اگر می خواستند با صفحه کار کنند
88
00:04:04,680 –> 00:04:06,810
شماره 1 به یاد داشته باشید که در شروع خواهد شد
89
00:04:06,810 –> 00:04:08,170
0
90
00:04:08,170 –> 00:04:11,020
و بعد از این برای ایجاد شی
91
00:04:11,020 –> 00:04:13,209
برای ذخیره تمام متنی که دارید
92
00:04:13,209 –> 00:04:17,470
خوب، این صفحه dot get و from خواهد بود
93
00:04:17,470 –> 00:04:19,290
گرفتن
94
00:04:19,290 –> 00:04:23,340
یکی از متن با حروف بزرگ و سپس اینجا
95
00:04:23,340 –> 00:04:24,180
قرار است قرار دهیم
96
00:04:24,180 –> 00:04:26,270
[موسیقی]
97
00:04:26,270 –> 00:04:29,539
در نقل قول نوع دارای چندین است
98
00:04:29,539 –> 00:04:31,910
گزینه ها نیز در صفحات
99
00:04:31,910 –> 00:04:34,430
افسران از من می خواهند که صفحات را بپوشم
100
00:04:34,430 –> 00:04:37,220
طوری رفتم که انگار انگلیسی بود
101
00:04:37,220 –> 00:04:39,020
صفحه رسمی در اینجا خواهید دید که چه چیزی وجود دارد
102
00:04:39,020 –> 00:04:40,849
چندین گزینه می توانند کلمات را استخراج کنند
103
00:04:40,849 –> 00:04:43,879
این نیز می تواند توسط پاراگراف باشد اما
104
00:04:43,879 –> 00:04:46,729
در حال حاضر من فقط متن را می خواهم
105
00:04:46,729 –> 00:04:49,699
سپس همان را برای آنها به بررسی آن است
106
00:04:49,699 –> 00:04:52,069
اینجا در جعبه توضیحات باشید
107
00:04:52,069 –> 00:04:55,940
ویدیو ما اجرا می کنیم و خوب در حال حاضر من
108
00:04:55,940 –> 00:04:58,460
نیاز به چاپ دارد زیرا خوبی آن این است که نه
109
00:04:58,460 –> 00:05:00,620
من هیچ خطایی ارسال نمی کنم و فعلا
110
00:05:00,620 –> 00:05:03,500
به اینجا نگاه کنید که به صورت رشته ای است
111
00:05:03,500 –> 00:05:05,990
ما می توانیم ببینیم و اینجا استخراج است
112
00:05:05,990 –> 00:05:09,020
سپس متن صفحه اول
113
00:05:09,020 –> 00:05:11,360
اگر می خواهید آن را روی صفحه ببینید، در اینجا
114
00:05:11,360 –> 00:05:14,210
متن خواهد بود
115
00:05:14,210 –> 00:05:16,699
ما آن را اجرا می کنیم و همین الان بیرون می آید
116
00:05:16,699 –> 00:05:19,490
اینجا ذهن شما آماده است
117
00:05:19,490 –> 00:05:22,039
مورد استفاده قرار گیرد و خوب چگونه در مورد آن
118
00:05:22,039 –> 00:05:25,160
بهتر است آنچه شما نیاز دارید بدست آورید
119
00:05:25,160 –> 00:05:27,590
همه صفحات همه متن برای
120
00:05:27,590 –> 00:05:30,500
سپس آن را به یک فایل txt ارسال کنید و تمام
121
00:05:30,500 –> 00:05:32,090
بنابراین یک تحلیل دیگر انجام دهید
122
00:05:32,090 –> 00:05:34,669
سپس ما نیز قادر به انجام آن خواهیم بود
123
00:05:34,669 –> 00:05:36,220
انجام دادن
124
00:05:36,220 –> 00:05:40,480
اینجا قراره باهاش کار کنم
125
00:05:40,480 –> 00:05:42,730
دیگری در مورد گاز و isi به آنها آموزش دهد
126
00:05:42,730 –> 00:05:44,200
من الان برمیگردم تا آزمایش رو انجام بدم
127
00:05:44,200 –> 00:05:47,140
همچنین این یکی با این یکی پس نه
128
00:05:47,140 –> 00:05:48,820
نگران نباشید بیایید آن را با آنها امتحان کنیم
129
00:05:48,820 –> 00:05:53,110
دو سپس در اینجا نام فایل من می خواهم به
130
00:05:53,110 –> 00:05:54,880
موارد جدید ایجاد کنید
131
00:05:54,880 –> 00:05:57,870
قرار است تماس بگیرد
132
00:05:57,870 –> 00:06:00,060
ایده آل را گذاشتم سپس قرار است آن را بگذارم
133
00:06:00,060 –> 00:06:03,510
اینجا نقطه ایده آل پی دی اف
134
00:06:03,510 –> 00:06:07,620
پس از این، زیرا من قبلاً یکی از آنها را دارم
135
00:06:07,620 –> 00:06:09,090
اسپانیایی که بهش میگن سندی که میرم
136
00:06:09,090 –> 00:06:11,160
یک مورد جدید به نام do that going ایجاد کنید
137
00:06:11,160 –> 00:06:13,320
برابر feaps که مدول است
138
00:06:13,320 –> 00:06:18,270
نقطه باز برای باز کردن و اینجا پس از آن هیچ چیز
139
00:06:18,270 –> 00:06:21,500
بیشتر ما دوباره نام فایل را قرار می دهیم
140
00:06:21,500 –> 00:06:23,620
و به هر حال در اسناد رسمی
141
00:06:23,620 –> 00:06:26,690
برای پیدا کردن بخش های زیادی از
142
00:06:26,690 –> 00:06:29,060
کدهایی که آماده کپی هستند
143
00:06:29,060 –> 00:06:30,860
و حتی بسیاری از قسمت هایی که من
144
00:06:30,860 –> 00:06:32,870
من از اینجا استفاده می کنم شما در حال حاضر می توانید
145
00:06:32,870 –> 00:06:34,790
اگر می خواهید آنجا ملاقا