در این مطلب، ویدئو یادگیری پایتون در 3 ساعت: خزنده های خود را با Scrapy بسازید | packtpub.com با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:07,059 –> 00:00:09,530
سلام و خوش آمدید تا
2
00:00:09,530 –> 00:00:12,080
سه ساعت دیگر به یادگیری پایتون بازگردید، امروز
3
00:00:12,080 –> 00:00:15,019
بخش جدیدی را در مورد برنامه
4
00:00:15,019 –> 00:00:16,849
های کاربردی پایتون شروع می کنیم که در آن
5
00:00:16,849 –> 00:00:19,630
راه های متداول حل مشکلات رایج
6
00:00:19,630 –> 00:00:23,480
با استفاده از کتابخانه های پایتون را به شما نشان می دهم. اولین تمرکز
7
00:00:23,480 –> 00:00:25,759
ما بر روی وب و داده کاوی است.
8
00:00:25,759 –> 00:00:27,829
با موضوع بسیار محبوب پایتون
9
00:00:27,829 –> 00:00:30,649
به خصوص اکنون که همه چیز آنلاین است
10
00:00:30,649 –> 00:00:33,440
و موارد استفاده زیادی وجود دارد که می
11
00:00:33,440 –> 00:00:35,510
خواهید به طور سیستماتیک اطلاعات را
12
00:00:35,510 –> 00:00:37,850
از منابع آنلاین و ساختار یافته
13
00:00:37,850 –> 00:00:42,019
بگیرید و آن را به اطلاعات تبدیل کنید در این
14
00:00:42,019 –> 00:00:43,789
بخش ما به سه
15
00:00:43,789 –> 00:00:46,629
روش مختلف مربوط به خراش دادن نگاه خواهیم کرد. و
16
00:00:46,629 –> 00:00:49,699
داده کاوی ما در مورد
17
00:00:49,699 –> 00:00:54,350
ایجاد خزنده های وب با scrapey
18
00:00:54,350 –> 00:00:56,510
صحبت خواهیم کرد. در مورد خراش دادن
19
00:00:56,510 –> 00:00:58,789
مقالات خبری در رسانه ها به طور خاص
20
00:00:58,789 –> 00:01:03,220
با روزنامه 30k صحبت خواهیم
21
00:01:03,220 –> 00:01:06,440
22
00:01:06,440 –> 00:01:11,140
کرد.
23
00:01:11,140 –> 00:01:13,370
در این ویدیو ما بر
24
00:01:13,370 –> 00:01:15,560
روی ایجاد خزنده های خود با خراش دادن تمرکز می کنیم
25
00:01:15,560 –> 00:01:19,390
در این ویدیو به این خواهیم پرداخت
26
00:01:19,390 –> 00:01:23,620
که خراش چیست و چگونه انجام شود متوقف کردن آن
27
00:01:23,620 –> 00:01:26,150
ایجاد یک پروژه خراش دادن جدید و
28
00:01:26,150 –> 00:01:29,390
نوشتن اولین عنکبوت ما که
29
00:01:29,390 –> 00:01:32,720
داده های خراش را با استفاده از خط فرمان صادر
30
00:01:32,720 –> 00:01:36,440
می کند.
31
00:01:36,440 –> 00:01:39,410
32
00:01:39,410 –> 00:01:42,350
33
00:01:42,350 –> 00:01:46,670
نصب
34
00:01:46,670 –> 00:01:49,250
این به سادگی pip install scrapey به طوری
35
00:01:49,250 –> 00:01:51,260
که شما این کار را انجام نداده اید قبلاً
36
00:01:51,260 –> 00:01:54,230
در PowerShell prompt وارد
37
00:01:54,230 –> 00:01:59,540
لوله تنفسی خود شده و برای شروع هر پروژه اسکراپی pip install scrapey را تایپ کنید.
38
00:01:59,540 –> 00:02:03,320
39
00:02:03,320 –> 00:02:06,380
40
00:02:06,380 –> 00:02:08,330
41
00:02:08,330 –> 00:02:11,060
روشی که شما از این استفاده می کنید به صورت
42
00:02:11,060 –> 00:02:11,510
زیر است،
43
00:02:11,510 –> 00:02:16,069
بنابراین می توانید پروژه های شروع scrapy را تایپ کنید
44
00:02:16,069 –> 00:02:23,349
و اجازه دهید آن را در عرض سه ساعت پایتون بنامیم
45
00:02:24,470 –> 00:02:27,920
و ما به اتفاقی که برای
46
00:02:27,920 –> 00:02:30,230
رای دهندگان کدمان افتاده است می بینیم که یک
47
00:02:30,230 –> 00:02:33,740
پوشه Python 3 در 3 ساعت ایجاد شده است اما با
48
00:02:33,740 –> 00:02:36,140
دستور فقط در حال حاضر یک پوشه برای
49
00:02:36,140 –> 00:02:41,000
عنکبوت های ما وجود دارد، یک آیتم نقطه py برای
50
00:02:41,000 –> 00:02:43,700
تعریف آیتم های پروژه وجود دارد، یک
51
00:02:43,700 –> 00:02:46,580
میان افزار py برای تعریف میان افزارها
52
00:02:46,580 –> 00:02:49,850
و غیره و غیره در علاقه وجود دارد.
53
00:02:49,850 –> 00:02:53,120
من همچنین یک
54
00:02:53,120 –> 00:02:56,420
مجموعه کامل از عنکبوتها را در پایتون 3 ساعت از
55
00:02:56,420 –> 00:02:58,610
پوشه بسیار مشابه ایجاد
56
00:02:58,610 –> 00:03:01,580
کردهام و با استفاده از این پوشه میخواهیم یک سری
57
00:03:01,580 –> 00:03:04,250
عنکبوت بنویسیم، بنابراین برای نوشتن اولین عنکبوت، کاری که باید انجام دهیم این است
58
00:03:04,250 –> 00:03:07,520
که یک پوشه جدید در پوشه spiders ایجاد کنیم.
59
00:03:07,520 –> 00:03:10,610
در اینجا من
60
00:03:10,610 –> 00:03:15,350
نمونه عنکبوتی خود را در خط 1 spider da py صدا میکنم. من
61
00:03:15,350 –> 00:03:18,080
scrapy را وارد میکنم و سپس
62
00:03:18,080 –> 00:03:20,630
در کلاس python ایجاد میکنم که قبلاً
63
00:03:20,630 –> 00:03:24,070
در دوره به نام نمونه spider توضیح دادیم و
64
00:03:24,070 –> 00:03:28,130
این کلاس والد scraping
65
00:03:28,130 –> 00:03:30,950
spider را به ارث میبرد. در حال ایجاد یک نمونه جدید
66
00:03:30,950 –> 00:03:33,110
از عنکبوت هستیم، اما ما برخی از
67
00:03:33,110 –> 00:03:35,450
قسمت های آن را سفارشی می کنیم، اولین چیزی که
68
00:03:35,450 –> 00:03:37,430
نام را سفارشی می کند، بنابراین ما
69
00:03:37,430 –> 00:03:40,580
این نمونه نام را صدا می زنیم، نام باید
70
00:03:40,580 –> 00:03:44,480
در پروژه ما منحصر به فرد باشد، دومین چیزی که
71
00:03:44,480 –> 00:03:47,480
ما تعریف می کنیم این است. URL ها را شروع کنید، بنابراین
72
00:03:47,480 –> 00:03:49,190
این متغیری است که باید به
73
00:03:49,190 –> 00:03:52,040
شکل یک لیست در بیاید و ما باید
74
00:03:52,040 –> 00:03:55,340
URL هایی را که می خواهیم برای بازدید از آنها به صورت عنکبوتی
75
00:03:55,340 –> 00:03:58,970
در اینجا قرار دهیم، قرار دهیم که
76
00:03:58,970 –> 00:04:00,560
منبع خوبی برای آشنایی شماست
77
00:04:00,560 –> 00:04:02,840
خراش دادن و وارد کردن آن به
78
00:04:02,840 –> 00:04:06,230
لیست URL های شروع اما ما باید
79
00:04:06,230 –> 00:04:11,870
خودمان را تعریف کنیم این است که چگونه صفحات وب را تجزیه می
80
00:04:11,870 –> 00:04:15,320
کنیم، بنابراین باید تابعی به نام تجزیه تعریف کنیم که
81
00:04:15,320 –> 00:04:18,380
مجدداً پارامتر self را به آن تغذیه می
82
00:04:18,380 –> 00:04:20,480
کند زیرا می خواهیم
83
00:04:20,480 –> 00:04:24,770
نمونه این کلاس ارجاع باشد و همچنین
84
00:04:24,770 –> 00:04:27,020
باید یک پارامتر پاسخ ایجاد کنیم.
85
00:04:27,020 –> 00:04:29,960
که به ما اجازه می دهد تا
86
00:04:29,960 –> 00:04:35,539
پاسخ درخواست به هر یک از این URL ها را نگه داریم،