در این مطلب، ویدئو Newspaper3k – یک کتابخانه پایتون برای خراش دادن سریع وب با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:38:22
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:02,000 –> 00:00:03,439
سلام به همه
2
00:00:03,439 –> 00:00:04,960
در این ویدیو من
3
00:00:04,960 –> 00:00:07,200
یک کتابخانه پایتون با کاربری بسیار آسان به
4
00:00:07,200 –> 00:00:10,160
نام روزنامه
5
00:00:10,160 –> 00:00:13,040
3k را به شما معرفی می کنم.
6
00:00:13,040 –> 00:00:15,040
7
00:00:15,040 –> 00:00:17,359
8
00:00:17,359 –> 00:00:18,800
9
00:00:18,800 –> 00:00:20,800
چند خط کد می توانید
10
00:00:20,800 –> 00:00:23,680
برای مواردی مانند
11
00:00:23,680 –> 00:00:26,400
تاریخ انتشار نویسندگان جستجو کنید و می توانید خلاصه
12
00:00:26,400 –> 00:00:28,640
و متن کامل را دریافت
13
00:00:28,640 –> 00:00:30,480
کنید. همچنین می تواند به شما کمک کند
14
00:00:30,480 –> 00:00:32,399
کلمات کلیدی اصلی را با استفاده از پردازش زبان طبیعی پیدا کنید.
15
00:00:32,399 –> 00:00:33,680
16
00:00:33,680 –> 00:00:35,680
17
00:00:35,680 –> 00:00:39,360
و اوه،
18
00:00:39,360 –> 00:00:40,960
همچنین می تواند برای شما نیز سود بیشتری داشته باشد، اما من
19
00:00:40,960 –> 00:00:43,520
قصد ندارم به این موضوع بپردازم که در این ویدئو
20
00:00:43,520 –> 00:00:46,480
همچنین uh روزنامه 3k همچنین می تواند
21
00:00:46,480 –> 00:00:49,120
داده ها را به بیش از 30 زبان
22
00:00:49,120 –> 00:00:50,960
به طور کلی از شما استخراج کند، این ابزار عالی برای استفاده در
23
00:00:50,960 –> 00:00:52,719
صورت داشتن تعداد زیادی است. و تعداد زیادی مقاله برای
24
00:00:52,719 –> 00:00:54,399
خراش دادن، بنابراین بیایید
25
00:00:54,399 –> 00:00:56,559
برای یک پروژه تحقیقاتی
26
00:00:56,559 –> 00:00:58,800
یا برای یک کسب و کار در حال انجام تحقیق و
27
00:00:58,800 –> 00:01:00,160
آنچه مردم ممکن است
28
00:01:00,160 –> 00:01:01,600
29
00:01:01,600 –> 00:01:03,359
به طور کلی در مورد محصول خود می گویند، نیازی به جستجو
30
00:01:03,359 –> 00:01:06,479
در html هر بار
31
00:01:06,479 –> 00:01:08,479
که شما انجام می دهید را از بین می برد. باید متنی را از یک صفحه وب جدید پاک کنید
32
00:01:08,479 –> 00:01:10,080
و سپس باید کد خود را
33
00:01:10,080 –> 00:01:11,600
برای آن بنویسید،
34
00:01:11,600 –> 00:01:13,119
بنابراین
35
00:01:13,119 –> 00:01:14,479
آنچه امروز برای شما نشان می دهم
36
00:01:14,479 –> 00:01:17,840
یک برنامه سریع است که از
37
00:01:17,840 –> 00:01:20,560
روزنامه 3k برای خراش دادن یک سری
38
00:01:20,560 –> 00:01:22,880
مقالات از یک وب سایت استفاده می کند، در
39
00:01:22,880 –> 00:01:25,360
این مورد فناوری abc news خواهد بود
40
00:01:25,360 –> 00:01:26,640
و سپس
41
00:01:26,640 –> 00:01:29,200
یادگیری ماشینی را انجام می دهیم
42
00:01:29,200 –> 00:01:31,360
و آن را به تجزیه و تحلیل متن
43
00:01:31,360 –> 00:01:33,840
هر مقاله از طریق متن بلاه بلا
44
00:01:33,840 –> 00:01:35,759
از طریق ماژول متن حباب می پردازیم
45
00:01:35,759 –> 00:01:37,920
تا امتیازاتی را به ما ارائه دهد که به ما می گوید چقدر
46
00:01:37,920 –> 00:01:39,920
مقاله مثبت یا منفی است.
47
00:01:39,920 –> 00:01:42,159
امتیاز قطبیت و اینکه
48
00:01:42,159 –> 00:01:44,240
آیا مقاله کم و بیش
49
00:01:44,240 –> 00:01:47,920
ذهنی یا عینی است یا نه،
50
00:01:48,960 –> 00:01:51,360
اکنون قبل از شروع، من فقط به
51
00:01:51,360 –> 00:01:53,680
سرعت فیدهای rss را مرور
52
00:01:53,680 –> 00:01:57,040
53
00:01:57,040 –> 00:01:59,439
54
00:01:59,439 –> 00:02:01,520
می کنم. به
55
00:02:01,520 –> 00:02:02,960
راحتی محتوای خود را از طریق
56
00:02:02,960 –> 00:02:05,439
کانال هایی مانند
57
00:02:05,439 –> 00:02:06,640
58
00:02:06,640 –> 00:02:08,720
جمع آوری کننده محتوای ایمیل رسانه های اجتماعی توزیع می کنند و همچنین به آنها اجازه می دهد
59
00:02:08,720 –> 00:02:10,800
تا دسترسی خود را به روشی گسترش دهند
60
00:02:10,800 –> 00:02:12,640
که هرگز نمی توانستند اگر فقط می
61
00:02:12,640 –> 00:02:14,160
توانستند محتوای خود را در سایت خود پست کنند. n صفحه یا
62
00:02:14,160 –> 00:02:16,239
کانال، بنابراین
63
00:02:16,239 –> 00:02:18,400
اگر یک جمعآوری محتوا
64
00:02:18,400 –> 00:02:20,800
65
00:02:20,800 –> 00:02:22,560
66
00:02:22,560 –> 00:02:25,040
داشته باشد، به نفع خواننده نیز خواهد
67
00:02:25,040 –> 00:02:27,040
68
00:02:27,040 –> 00:02:28,560
69
00:02:28,560 –> 00:02:30,000
بود. در عوض تمام محتوا
70
00:02:30,000 –> 00:02:31,519
را
71
00:02:31,519 –> 00:02:33,360
از همه آن منابع مستقیماً به
72
00:02:33,360 –> 00:02:37,080
هر برنامه ای که او استفاده می کند تحویل داده شود
73
00:02:37,200 –> 00:02:39,040
زیرا تقریباً همه فیدها از
74
00:02:39,040 –> 00:02:41,120
فرمت استاندارد xml استفاده می کنند و در واقع
75
00:02:41,120 –> 00:02:43,840
فیدها را برای جمع آوری تعداد زیادی
76
00:02:43,840 –> 00:02:46,720
مقاله از منابع مختلف بسیار مفید
77
00:02:46,720 –> 00:02:47,920
78
00:02:47,920 –> 00:02:49,680
می کند. این است که شما
79
00:02:49,680 –> 00:02:52,000
همه مقالهها را در وبسایت دریافت نمیکنید
80
00:02:52,000 –> 00:02:54,560
زیرا این فیدها معمولاً محدودیتی دارند،
81
00:02:54,560 –> 00:02:56,640
اما اگر به مقالههایی از
82
00:02:56,640 –> 00:02:59,440
چند روز گذشته نیاز دارید، فیدهای rss در
83
00:02:59,440 –> 00:03:01,680
واقع برای جمعآوری پیوندها عالی هستند،
84
00:03:01,680 –> 00:03:02,400
بنابراین
85
00:03:02,400 –> 00:03:05,840
بیایید ادامه دهیم و شروع
86
00:03:07,200 –> 00:03:10,080
کنیم.
87
00:03:10,080 –> 00:03:12,720
اولین کاری که میخواهیم انجام دهیم این است
88
00:03:12,720 –> 00:03:15,280
که یک محیط مجازی را راهاندازی کنیم، به
89
00:03:15,280 –> 00:03:17,599
این ترتیب تمام
90
00:03:17,599 –> 00:03:19,680
وابستگیها فقط در پروژه ما حفظ میشوند و
91
00:03:19,680 –> 00:03:21,760
روی هیچکدام از موارد دیگر تأثیر نمیگذارند. pendencies در رایانههای ما
92
00:03:21,760 –> 00:03:22,959
93
00:03:22,959 –> 00:03:25,920
اکنون مال من قبلاً تنظیم شده است، اما به
94
00:03:25,920 –> 00:03:27,920
هر حال من مراحل را طی میکنم، بنابراین
95
00:03:27,920 –> 00:03:30,720
چه از لینوکس مک یا ویندوز استفاده کنید،
96
00:03:30,720 –> 00:03:34,640
کاری که میخواهید انجام دهید این است که ادامه دهید و
97
00:03:34,640 –> 00:03:36,959
pip install
98
00:03:36,959 –> 00:03:39,599
virtual env را انجام دهید
99
00:03:39,599 –> 00:03:42,879
و ما ادامه میدهیم و این را اجرا کنید
100
00:03:43,680 –> 00:03:46,560
و منتظر می مانیم تا تمام شود
101
00:03:46,560 –> 00:03:49,120
و سپس من می خواهم نشان
102
00:03:49,120 –> 00:03:52,560
دهم که چگونه این کار را ابتدا در لینوکس و
103
00:03:52,560 –> 00:03:54,640
مک او اس انجام دهیم،
104
00:03:54,640 –> 00:03:59,000
زمانی که این تصمیم گرفت خوب تمام شود.
105
00:04:07,120 –> 00:04:09,280
106
00:04:09,280 –> 00:04:11,439
107
00:04:11,439 –> 00:04:13,280
108
00:04:13,280 –> 00:04:16,478
اگر در لینوکس یا مک
109
00:04:16,478 –> 00:04:18,880
هستید باز هم می خواهید virtual env را تایپ کنید و
110
00:04:18,880 –> 00:04:20,160
سپس می توانید هر نامی را که می توانید
111
00:04:20,160 –> 00:04:21,519
به محیط مجازی هر نامی
112
00:04:21,519 –> 00:04:22,880
که می خواهید بدهید، در این مورد
113
00:04:22,880 –> 00:04:24,720
vnv
114
00:04:24,720 –> 00:04:26,400
um است.
115
00:04:26,400 –> 00:04:29,040
سپس اینتر را بزنید
116
00:04:29,040 –> 00:04:31,280
من به خاطر من نیستم من قصد ندارم اینتر را بزنم،
117
00:04:31,280 –> 00:04:32,400
118
00:04:32,400 –> 00:04:33,280
پس
119
00:04:33,280 –> 00:04:35,360
وقتی تنظیمات محیط مجازی را تمام
120
00:04:35,360 –> 00:04:37,199
کردید، می توانید
121
00:04:37,199 –> 00:04:38,880
محیط مجازی را
122
00:04:38,880 –> 00:04:40,560
با تایپ منبع
123
00:04:40,560 –> 00:04:43,360
و سپس env یا هر نام دیگری شروع کنید.
124
00:04:43,360 –> 00:04:46,720
محیط مجازی شما v env
125
00:04:46,720 –> 00:04:50,080
bin backslash activate است
126
00:04:50,080 –> 00:04:51,120
و
127
00:04:51,120 –> 00:04:52,720
این e virtual شما را فعال می کند
128
00:04:52,720 –> 00:04:56,800
محیط زیست همانطور که اکنون می توانید اینجا ببینید
129
00:04:56,800 –> 00:04:58,479
130
00:04:58,479 –> 00:05:00,880
اگر در ویندوز هستید من فکر می کنم این
131
00:05:00,880 –> 00:05:02,800
چیزی است که باید تایپ کنید بنابراین
132
00:05:02,800 –> 00:05:04,160
133
00:05:04,160 –> 00:05:06,080
اگر در ویندوز هستید پس از
134
00:05:06,080 –> 00:05:07,600
نصب
135
00:05:07,600 –> 00:05:09,759
136
00:05:09,759 –> 00:05:13,280
پیپ یک ثانیه به من
137
00:05:13,280 –> 00:05:15,919
فرصت
138
00:05:16,400 –> 00:05:19,039
دهید. و سپس هر نامی را که می خواهید
139
00:05:19,039 –> 00:05:20,639
دوباره virtual
140
00:05:20,639 –> 00:05:23,520
v و v v env
141
00:05:23,520 –> 00:05:25,280
و بعد از اینکه enter را زدید و
142
00:05:25,280 –> 00:05:27,600
تنظیم شد، فکر می کنم آن را
143
00:05:27,600 –> 00:05:29,199
با تایپ
144
00:05:29,199 –> 00:05:30,479
هر نامی که محیط مجازی خود را
145
00:05:30,479 –> 00:05:32,080
146
00:05:32,080 –> 00:05:35,039
با اسکریپت دنبال می کنید شروع می کنید
147
00:05:35,039 –> 00:05:38,759
و سپس فعال می کنید
148
00:05:38,960 –> 00:05:40,320
و سپس اینتر را می زنید. و همین
149
00:05:40,320 –> 00:05:41,759
اتفاق باید دوباره تکرار شود،
150
00:05:41,759 –> 00:05:43,440
بنابراین
151
00:05:43,440 –> 00:05:46,320
چه و چه در حال حاضر چه در لینوکس مک هستید یا نه، من روی
152
00:05:46,320 –> 00:05:47,600
لینوکس
153
00:05:47,600 –> 00:05:48,720
154
00:05:48,720 –> 00:05:51,600
155
00:05:51,600 –> 00:05:53,199
156
00:05:53,199 –> 00:05:54,800
هستم تا از محیط مجازی خارج شوم، تنها کاری که باید انجام دهید این است که
157
00:05:54,800 –> 00:05:56,639
Deactivate را تایپ کنید و به آنجا بروید. من خارج
158
00:05:56,639 –> 00:05:59,360
از آن هستم پس اوه من می خواهم به آن برگردم در
159
00:05:59,360 –> 00:06:01,120
واقع
160
00:06:01,120 –> 00:06:02,319
منبع
161
00:06:02,319 –> 00:06:05,800
dnv چیست
162
00:06:06,800 –> 00:06:08,240
ما به سرعت می رویم
163
00:06:08,240 –> 00:06:09,680
آه
164
00:06:09,680 –> 00:06:11,120
آه خیلی سریع
165
00:06:11,120 –> 00:06:14,080
آه چرا ما وارد نمی کنیم
166
00:06:14,080 –> 00:06:17,039
آه بیایید ببینیم
167
00:06:17,039 –> 00:06:19,440
بله پس چرا نمی کنیم آه از آنجایی که ما
168
00:06:19,440 –> 00:06:21,039
به سرعت درخواست ها را در سوپ زیبا وارد
169
00:06:21,039 –> 00:06:22,319
نمی کنیم برای شروع از آنها استفاده
170
00:06:22,319 –> 00:06:24,400
میکنم، پس بیایید فقط درخواستهای واردات ریپ را تایپ کنیم
171
00:06:24,400 –> 00:06:27,280
172
00:06:27,600 –> 00:06:30,560
و وارد کنیم و من را
173
00:06:30,560 –> 00:06:33,680
از واردات سوپ زیبای bs4 معاف کنیم،
174
00:06:33,680 –> 00:06:34,720
175
00:06:34,720 –> 00:06:36,880
176
00:06:36,880 –> 00:06:40,000
نمیدانم چرا این کار را انجام دادم
177
00:06:45,600 –> 00:06:47,360
خوب
178
00:06:47,360 –> 00:06:50,160
حالا بیایید جلو برویم و فید rss
179
00:06:50,160 –> 00:06:51,599
180
00:06:51,599 –> 00:06:54,240
را خیلی راحت دریافت کنیم. خیلی ساده میتوانیم
181
00:06:54,240 –> 00:06:57,280
182
00:06:57,280 –> 00:06:58,800
183
00:06:58,800 –> 00:07:01,360
184
00:07:01,360 –> 00:07:04,560
فید rss فناوری اخبار abc را تایپ
185
00:07:10,560 –> 00:07:11,520
186
00:07:11,520 –> 00:07:12,639
کنیم و ببینیم
187
00:07:12,639 –> 00:07:16,360
آیا میتوانیم آن را اینجا پیدا کنیم، به
188
00:07:17,120 –> 00:07:20,160
نظر میرسد اینطور نیست، بنابراین
189
00:07:20,160 –> 00:07:23,440
من روی این پیوند کلیک میکنم
190
00:07:23,680 –> 00:07:24,880
این
191
00:07:24,880 –> 00:07:26,319
192
00:07:26,319 –> 00:07:28,000
وبسایت feedspot معمولاً مکان خوبی برای یافتن
193
00:07:28,000 –> 00:07:29,520
فیدهای rss است
194
00:07:29,520 –> 00:07:32,000
و ما به پایین پیمایش
195
00:07:32,000 –> 00:07:34,080
میکنیم و همانطور که میبینیم اینجا فید فناوری است، بنابراین
196
00:07:34,080 –> 00:07:37,360
بیایید این را در یک پنجره
197
00:07:42,639 –> 00:07:45,840
جدید یا بالای صفحه جدید باز کنیم،
198
00:07:49,440 –> 00:07:51,520
خوب است، بنابراین اینجا فید rss است،
199
00:07:51,520 –> 00:07:53,120
200
00:07:53,120 –> 00:07:54,800
بنابراین گاهی اوقات فید باید شبیه به فید معمولی باشد.
201
00:07:54,800 –> 00:07:57,199
202
00:07:57,199 –> 00:07:59,919
چندان منظم سازماندهی نخواهد شد، اما میتوانیم ببینیم که
203
00:07:59,919 –> 00:08:04,639
هر تگ مورد در اینجا به عنوان مثال
204
00:08:04,720 –> 00:08:08,319
حاوی یک مقاله
205
00:08:08,560 –> 00:08:11,680
حاوی یک مقاله است و همه
206
00:08:11,680 –> 00:08:14,080
و هر دادهای که تصمیم دارد پست کند،
207
00:08:14,080 –> 00:08:16,720
بنابراین پیوند مقاله در اینجا
208
00:08:16,720 –> 00:08:18,879
زیر پیوند برچسب است
209
00:08:18,879 –> 00:08:20,720
210
00:08:20,720 –> 00:08:24,080
که نیازی به ارسال آن نیست. این کار را بکن، ازت ممنونم
211
00:08:25,599 –> 00:08:28,400
212
00:08:28,400 –> 00:08:30,400
برچسبهایی را که باید از آنها
213
00:08:30,400 –> 00:08:31,840
استخراج کنیم
214
00:08:31,840 –> 00:08:34,320
پیوندهای مقاله را بشناسید، این به پایان
215
00:08:34,320 –> 00:08:36,320
میرسد، اکنون به راحتی میتوان به
216
00:08:36,320 –> 00:08:39,599
ذهنتان خطور کرد
217
00:08:39,599 –> 00:08:41,679
تا مطمئن شویم کاری که انجام میدهید قانونی است،
218
00:08:41,679 –> 00:08:43,679
اگر میخواهید از یک فید متفاوت استفاده کنید،
219
00:08:43,679 –> 00:08:45,360
به عنوان مثال،
220
00:08:45,360 –> 00:08:47,279
مطمئن شوید که خط مشی rss
221
00:08:47,279 –> 00:08:49,920
مربوط به هزینه خبری هر فید rss
222
00:08:49,920 –> 00:08:51,760
که می خواهید استفاده کنید را بررسی کنید
223
00:08:51,760 –> 00:08:53,680
و فقط مطمئن شوید که به سایت احترام می گذارید
224
00:08:53,680 –> 00:08:55,200
و همچنین آن را با
225
00:08:55,200 –> 00:08:57,760
درخواست های زیاد و مواردی از این قبیل بمباران نکنید. خوب، پس اکنون
226
00:08:57,760 –> 00:08:59,440
که آماده ایم، اجازه دهید
227
00:08:59,440 –> 00:09:01,200
به کد بازگردیم،
228
00:09:01,200 –> 00:09:03,200
بنابراین اولین کاری که می
229
00:09:03,200 –> 00:09:06,839
خواهیم انجام دهیم این است که یک شی پاسخ ایجاد می کنیم،
230
00:09:06,839 –> 00:09:08,880
بنابراین ما فقط می خواهیم پاسخ را تایپ کنیم که
231
00:09:08,880 –> 00:09:13,600
برابر با درخواست ها dot get
232
00:09:13,600 –> 00:09:16,000
و سپس اوه
233
00:09:16,000 –> 00:09:17,839
من می خواهم در فید تایپ
234
00:09:17,839 –> 00:09:21,200
کنم
235
00:09:21,200 –> 00:09:23,600
که فید
236
00:09:23,600 –> 00:09:26,560
را برابر با
237
00:09:26,560 –> 00:09:28,880
238
00:09:28,880 –> 00:09:30,240
آدرس rss در اینجا تنظیم می کنم،
239
00:09:30,240 –> 00:09:33,200
بنابراین بیایید
240
00:09:33,600 –> 00:09:35,680
آن را در اینجا کپی کنیم
241
00:09:35,680 –> 00:09:37,120
و
242
00:09:37,120 –> 00:09:39,040
چرا این کار را انجام نمی
243
00:09:39,040 –> 00:09:41,920
دهیم تا مطمئن
244
00:09:42,240 –> 00:09:44,640
شویم که فقط مطمئن شویم که ما می توانیم خیلی سریع به
245
00:09:44,640 –> 00:09:46,160
وب سایت دسترسی پیدا کنیم،
246
00:09:46,160 –> 00:09:48,399
من فقط می خواهم
247
00:09:48,399 –> 00:09:50,560
پاسخ یا
248
00:09:50,560 –> 00:09:53,279
کد وضعیت را چاپ کنم در اینجا از پاسخ
249
00:09:53,279 –> 00:09:54,880
و
250
00:09:54,880 –> 00:09:57,040
تا زمانی که آن
251
00:09:57,040 –> 00:09:58,160
252
00:09:58,160 –> 00:10:01,600
200 می شود، ما باید آماده باشیم،
253
00:10:01,600 –> 00:10:03,440
پس بیایید ادامه دهیم و این را خیلی سریع اجرا کنیم،
254
00:10:03,440 –> 00:10:05,839
255
00:10:20,160 –> 00:10:23,600
من به شما تضمین می کنم که این کار اجرا می شود.
256
00:10:26,880 –> 00:10:29,279
257
00:10:29,279 –> 00:10:30,399
258
00:10:30,399 –> 00:10:32,480
میتوانیم ادامه
259
00:10:32,480 –> 00:10:34,000
260
00:10:34,000 –> 00:10:36,880
دهیم، بنابراین بیایید اکنون محتویات
261
00:10:36,880 –> 00:10:38,560
درخواست را جمعآوری
262
00:10:38,560 –> 00:10:41,760
کنیم تا در یک صفحه وب تایپ
263
00:10:41,760 –> 00:10:44,720
کنیم که برابر با
264
00:10:44,720 –> 00:10:48,399
محتوای نقطه پاسخ باشد
265
00:10:48,399 –> 00:10:50,399
و سپس
266
00:10:50,399 –> 00:10:52,560
یک شی سوپ زیبا ایجاد
267
00:10:52,560 –> 00:10:55,360
کنیم که به سادگی آن را سوپ مینامیم
268
00:10:55,360 –> 00:10:59,040
و تنظیم میکنیم. که برابر با سوپ زیبا
269
00:10:59,040 –> 00:11:02,240
و ارسال در صفحه وب است
270
00:11:02,240 –> 00:11:03,920
و از آنجایی که ما در حال تجزیه xml هستیم، میتوانیم
271
00:11:03,920 –> 00:11:05,920
ویژگیها را برابر
272
00:11:05,920 –> 00:11:08,399
273
00:11:08,959 –> 00:11:10,880
xml قرار دهیم به این ترتیب که دقیقاً
274
00:11:10,880 –> 00:11:14,079
275
00:11:14,079 –> 00:11:18,000
همانطور که در xml که میروم دیدیم، دقیقاً میداند در حال حاضر چه قطعاتی وجود
276
00:11:18,160 –> 00:11:20,079
دارد. برای بازگشت به اینجا
277
00:11:20,079 –> 00:11:22,079
به xml در فید rss،
278
00:11:22,079 –> 00:11:24,240
باید هر
279
00:11:24,240 –> 00:11:27,360
نمونه ای از آیتم ها را دریافت کنیم، بنابراین ما مورد را در اینجا می بینیم
280
00:11:27,360 –> 00:11:28,800
، می ترسم
281
00:11:28,800 –> 00:11:30,800
دکمه را رها کنم
282
00:11:30,800 –> 00:11:34,480
و شما همه این داده ها را زیر آن دارید
283
00:11:34,480 –> 00:11:38,160
و اینجا یک مورد
284
00:11:38,560 –> 00:11:40,839
دیگر و دیگری و دیگری وجود دارد. و
285
00:11:40,839 –> 00:11:43,760
غیره هر یک از اینها جداست این
286
00:11:43,760 –> 00:11:47,519
مقاله به خودی خود در آن وجود دارد،
287
00:11:49,200 –> 00:11:51,200
288
00:11:51,200 –> 00:11:53,920
بنابراین کاری که ما می
289
00:11:53,920 –> 00:11:55,120
290
00:11:55,120 –> 00:11:56,800
خواهیم انجام دهیم این است که تایپ
291
00:11:56,800 –> 00:11:58,959
کنیم همه چیزهایی را که قرار است به معنای واقعی کلمه
292
00:11:58,959 –> 00:12:00,399
همه اشیاء را
293
00:12:00,399 –> 00:12:03,519
در زیر پیدا کنیم یا دارای برچسب آیتمی هستند را
294
00:12:03,519 –> 00:12:05,360
پیدا کنیم. ما
295
00:12:05,360 –> 00:12:09,200
این را روی آیتمها تنظیم میکنیم
296
00:12:09,200 –> 00:12:12,320
و این همه موارد را ذخیره میکند
297
00:12:12,320 –> 00:12:15,440
آه همیشه همه نمونهها اوه
298
00:12:15,440 –> 00:12:18,000
همه چیزهایی را که
299
00:12:18,000 –> 00:12:20,720
در هر تگ آیتم وجود دارد در یک لیست ذخیره میکند
300
00:12:20,720 –> 00:12:22,560
تا آیتمهایی را که برابر با نقطه سوپ قرار میدهیم،
301
00:12:22,560 –> 00:12:24,480
302
00:12:24,480 –> 00:12:27,760
همه را پیدا کند
303
00:12:35,680 –> 00:12:39,120
و سپس میخواهیم آیتم را در آن قرار دهیم
304
00:12:39,120 –> 00:12:40,959
و این فهرستی از
305
00:12:40,959 –> 00:12:44,560
هر چیزی که در هر تگ آیتم است به ما میدهد،
306
00:12:44,560 –> 00:12:48,160
حالا بیایید آدرس هر مقاله را از
307
00:12:48,160 –> 00:12:50,000
این فهرست آیتمها استخراج
308
00:12:50,000 –> 00:12:51,360
کنیم، بنابراین میخواهیم کاری را
309
00:12:51,360 –> 00:12:53,920
که میخواهیم انجام دهیم ایجاد کنیم. یک حلقه برای سریع
310
00:12:53,920 –> 00:12:56,079
و پیوند را بیرون بکشید
311
00:12:56,079 –> 00:12:57,920
و سپس آن پیوند را در لیستی که قرار است
312
00:12:57,920 –> 00:12:59,760
آن را فراخوانی کنیم ذخیره کنید،
313
00:12:59,760 –> 00:13:02,639
بنابراین اجازه دهید ابتدا فهرست
314
00:13:02,639 –> 00:13:04,959
مقالاتی را ایجاد
315
00:13:04,959 –> 00:13:07,760
کنیم که تنظیم می کنیم تا آن را یک لیست کنیم.
316
00:13:07,760 –> 00:13:10,000
لیست را خالی کنید و سپس برای آیتم و آیتم ها این کار را انجام می
317
00:13:10,000 –> 00:13:12,959
318
00:13:14,560 –> 00:13:18,560
دهیم، بیایید یک متغیر به نام پیوند ایجاد کنیم
319
00:13:18,639 –> 00:13:21,839
و آن را برابر با آیتم
320
00:13:21,839 –> 00:13:23,200
نقطه
321
00:13:23,200 –> 00:13:25,680
fin قرار دهیم. پیوند d
322
00:13:27,200 –> 00:13:28,800
323
00:13:28,800 –> 00:13:30,240
و سپس
324
00:13:30,240 –> 00:13:32,240
میخواهیم مطمئن شویم که فقط
325
00:13:32,240 –> 00:13:34,079
متن را از این دریافت میکنیم، بنابراین متن را تایپ میکنیم
326
00:13:34,079 –> 00:13:35,519
327
00:13:35,519 –> 00:13:36,480
و سپس
328
00:13:36,480 –> 00:13:38,160
میخواهیم
329
00:13:38,160 –> 00:13:40,720
آن پیوند را در
330
00:13:40,720 –> 00:13:43,040
فهرست مقالات وارد کنیم و این کار را به سادگی
331
00:13:43,040 –> 00:13:46,680
با تایپ کردن در articles.append
332
00:13:46,959 –> 00:13:49,839
لینک
333
00:13:57,839 –> 00:13:59,440
بسیار خوب است، بنابراین
334
00:13:59,440 –> 00:14:02,800
ما میتوانیم پس اوه، حالا که
335
00:14:02,800 –> 00:14:05,120
در واقع اجازه دهید ابتدا بررسی کنیم،
336
00:14:05,120 –> 00:14:06,480
اجازه دهید ابتدا بررسی کنیم تا مطمئن شویم
337
00:14:06,480 –> 00:14:08,720
همه چیز به درستی اجرا میشود، بنابراین
338
00:14:08,720 –> 00:14:10,480
کاری که من میخواهم انجام دهم این است
339
00:14:10,480 –> 00:14:12,240
که فهرست مقالات را در اینجا چاپ کنم
340
00:14:12,240 –> 00:14:16,440
و من می خواهم این را اجرا کنم
341
00:14:17,920 –> 00:14:20,480
و اجازه دهید یک ثانیه به آن زمان بدهیم تا اجرا شود
342
00:14:20,480 –> 00:14:23,519
و در عرض چند ثانیه باید
343
00:14:23,519 –> 00:14:25,040
لیستی را مانند آنچه انجام
344
00:14:25,040 –> 00:14:27,839
می دهیم ببینیم و همانطور که می بینیم پیوندی در
345
00:14:27,839 –> 00:14:30,560
اینجا داریم پیوند اینجا
346
00:14:30,560 –> 00:14:32,880
ما همه
347
00:14:32,880 –> 00:14:36,240
مقالات را از فید rss داریم و اکنون که
348
00:14:36,240 –> 00:14:38,720
مقالات را داریم آماده رفتن هستیم،
349
00:14:38,720 –> 00:14:41,680
بنابراین اجازه دهید روی صفحه اینجا کلیک کنم
350
00:14:41,680 –> 00:14:45,839
و اکنون می خواهم این را حذف کنم،
351
00:14:46,639 –> 00:14:48,639
بنابراین اولین کاری که باید انجام دهیم این
352
00:14:48,639 –> 00:14:52,000
است که باید آن را نصب کنیم. کتابخانه بنابراین
353
00:14:52,000 –> 00:14:53,360
یا اینکه ما باید
354
00:14:53,360 –> 00:14:55,680
کتابخانه روزنامه 3k را نصب کنیم
355
00:14:55,680 –> 00:14:58,240
پس برو به ترمینال خود برگردید و
356
00:14:58,240 –> 00:15:01,360
pip 3 را تایپ کنید، مطمئن شوید که pip 3
357
00:15:01,360 –> 00:15:05,360
install paper 3k را وارد کنید
358
00:15:05,360 –> 00:15:07,199
و ما آن را اجرا می کنیم
359
00:15:07,199 –> 00:15:09,760
که اکنون این را نصب کرده
360
00:15:09,760 –> 00:15:13,720
ام اما به هر حال آن را اجرا می کنم
361
00:15:15,519 –> 00:15:16,800
و سپس یک بار و سپس یک بار که
362
00:15:16,800 –> 00:15:19,279
نصب می شود ما میتوانیم ادامه
363
00:15:19,279 –> 00:15:20,079
364
00:15:20,079 –> 00:15:22,800
دهیم، بنابراین بیایید به بالای کد خود در اینجا
365
00:15:22,800 –> 00:15:24,320
366
00:15:24,320 –> 00:15:25,920
برویم و در زیر چیزهایی که وارد میکنیم،
367
00:15:25,920 –> 00:15:29,680
از مقاله واردات روزنامه تایپ
368
00:15:29,680 –> 00:15:30,959
369
00:15:30,959 –> 00:15:33,440
370
00:15:38,079 –> 00:15:40,880
میکنیم، بنابراین حالا که
371
00:15:40,880 –> 00:15:44,720
همه پیوندهای مقاله را
372
00:15:45,759 –> 00:15:47,040
داریم، چه خواهیم کرد
373
00:15:47,040 –> 00:15:49,440
ما این کار را انجام می دهیم این است که هر مقاله را حلقه بزنیم
374
00:15:49,440 –> 00:15:50,720
375
00:15:50,720 –> 00:15:53,600
و سپس در داخل حلقه روزنامه
376
00:15:53,600 –> 00:15:56,560
3k داده ها
377
00:15:56,560 –> 00:15:57,680
378
00:15:57,680 –> 00:15:59,120
را استخراج کنیم و سپس
379
00:15:59,120 –> 00:16:01,519
تجزیه و تحلیل احساسات را طی می کنیم
380
00:16:01,519 –> 00:16:03,360
و بعد از تجزیه و تحلیل احساسات
381
00:16:03,360 –> 00:16:05,040
می توانیم تمام داده ها را چاپ کنیم
382
00:16:05,040 –> 00:16:07,440
و در این قسمت در مورد آنچه که ما می
383
00:16:07,440 –> 00:16:09,600
خواهیم استخراج کنیم،
384
00:16:09,600 –> 00:16:10,800
385
00:16:10,800 –> 00:16:12,639
امتیازهای احساس عنوان پیوند از جمله امتیازات قطبیت
386
00:16:12,639 –> 00:16:14,880
و ذهنیت و در نهایت یک
387
00:16:14,880 –> 00:16:16,480
خلاصه خواهد بود،
388
00:16:16,480 –> 00:16:19,600
بنابراین بیایید ادامه دهیم و این کد را تایپ کنیم،
389
00:16:19,600 –> 00:16:21,120
بنابراین کاری که می خواهیم انجام دهیم این است که
390
00:16:21,120 –> 00:16:23,040
برای تایپ کردن آن اقدام کنیم. آدرس
391
00:16:23,040 –> 00:16:24,480
و مقالات
392
00:16:24,480 –> 00:16:26,079
از زمانی
393
00:16:26,079 –> 00:16:29,759
که ما h ave در لیست
394
00:16:30,160 –> 00:16:32,480
آدرسهایی هستند که ابتدا یک شی مقاله ایجاد
395
00:16:32,480 –> 00:16:33,920
396
00:16:33,920 –> 00:16:35,839
میکنیم و این کار را با ایجاد یک
397
00:16:35,839 –> 00:16:38,639
متغیر یا ایجاد مجموعه مقاله متغیری
398
00:16:38,639 –> 00:16:40,720
که برابر با
399
00:16:40,720 –> 00:16:42,880
ذره است انجام
400
00:16:42,880 –> 00:16:44,160
401
00:16:44,160 –> 00:16:48,320
میدهیم و آن آدرس را به مقاله
402
00:16:48,320 –> 00:16:52,639
وارد میکنیم و سپس بیایید اینجا را ببینیم
403
00:16:53,519 –> 00:16:55,279
و سپس
404
00:16:55,279 –> 00:16:56,639
مراحل زیر را طی می کنیم، ابتدا
405
00:16:56,639 –> 00:16:58,959
دانلود می کنیم پس از ایجاد
406
00:16:58,959 –> 00:17:00,720
شی مقاله، داده ها را دانلود می
407
00:17:00,720 –> 00:17:04,000
کنیم، بنابراین به سادگی مقاله را
408
00:17:04,000 –> 00:17:06,240
تایپ می
409
00:17:06,240 –> 00:17:08,480
کنیم. در اینجا لازم نیست مقاله
410
00:17:08,480 –> 00:17:10,319
باشد، می تواند هر چیزی باشد که شما نامش را می گذارید، فقط مطمئن شوید
411
00:17:10,319 –> 00:17:11,760
412
00:17:11,760 –> 00:17:14,079
که این مقاله
413
00:17:14,079 –> 00:17:16,959
مانند این است،
414
00:17:16,959 –> 00:17:18,720
بنابراین ابتدا آن را دانلود
415
00:17:18,720 –> 00:17:20,559
می کنیم و سپس
416
00:17:20,559 –> 00:17:23,959
مقاله را تایپ می کنیم.
417
00:17:25,679 –> 00:17:28,400
اوه نه این چیزی نیست که ما می خواهم
418
00:17:28,400 –> 00:17:30,799
از شما تشکر کنم
419
00:17:31,360 –> 00:17:33,600
و در نهایت برای اینکه ما
420
00:17:33,600 –> 00:17:36,480
کلمات کلیدی اصلی را استخراج کنیم یا
421
00:17:36,480 –> 00:17:38,880
خلاصه تلفظ کنیم، در واقع باید
422
00:17:38,880 –> 00:17:42,240
آن پردازش زبان طبیعی را روی آن
423
00:17:42,240 –> 00:17:44,320
انجام دهیم، بنابراین می خواهیم در مقاله dot
424
00:17:44,320 –> 00:17:47,320
425
00:17:48,480 –> 00:17:50,960
nlp تایپ کنیم و اکنون می توانیم
426
00:17:50,960 –> 00:17:53,120
ببینیم که آیا من می توانم این را کمی پایین بیاورم
427
00:17:53,120 –> 00:17:55,200
428
00:17:55,200 –> 00:17:56,160
خوب
429
00:17:56,160 –> 00:18:00,840
پس اوه
430
00:18:01,760 –> 00:18:04,640
اکنون ما می خواهیم اکنون ایجاد
431
00:18:05,679 –> 00:18:06,880
کنیم، بیایید اینجا را ببینیم اکنون
432
00:18:06,880 –> 00:18:08,720
داده هایی را که نیاز داریم جمع آوری می کنیم،
433
00:18:08,720 –> 00:18:10,640
بنابراین اجازه دهید
434
00:18:10,640 –> 00:18:14,080
اول عنوان را بدست
435
00:18:14,080 –> 00:18:15,840
آوریم و هر آنچه که نیاز داریم انجام دهید تا عنوان را به دست آورید
436
00:18:15,840 –> 00:18:18,480
فقط کافی است فقط عنوان نقطه مقاله را تایپ کنید
437
00:18:18,480 –> 00:18:20,880
438
00:18:21,039 –> 00:18:23,520
که همه
439
00:18:23,600 –> 00:18:25,760
عنوان ها نیستند
440
00:18:25,760 –> 00:18:28,799
بیایید خلاصه را دریافت کنیم خلاصه با نقطه
441
00:18:28,799 –> 00:18:30,799
مقاله
442
00:18:30,