در این مطلب، ویدئو آموزش Python Scrapy – 21 – ورود با Scrapy FormRequest با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:12:49
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,030 –> 00:00:02,879
خوب بچه ها خوش آمدید در این ویدیو
2
00:00:02,879 –> 00:00:04,740
ما می خواهیم یاد بگیریم که چگونه
3
00:00:04,740 –> 00:00:07,020
با استفاده از scrappy وارد وب سایت ها شویم و
4
00:00:07,020 –> 00:00:09,030
از این نمونه وب سایت هایی که
5
00:00:09,030 –> 00:00:10,950
قبلاً از آنها استفاده کرده بودیم به نام course door to
6
00:00:10,950 –> 00:00:13,920
scrape comm استفاده می کنیم تا یاد بگیریم که اکنون همانطور که می
7
00:00:13,920 –> 00:00:15,780
بینید وجود دارد یک دکمه ورود به سیستم در
8
00:00:15,780 –> 00:00:17,520
سمت راست و کلیک کردن بر روی آن
9
00:00:17,520 –> 00:00:20,070
ما را به فرمی می برد که حاوی فیلد نام کاربری
10
00:00:20,070 –> 00:00:22,380
و فیلد رمز عبور است، حالا چرا
11
00:00:22,380 –> 00:00:24,660
دقیقاً باید یاد بگیریم که چگونه
12
00:00:24,660 –> 00:00:27,090
با استفاده از scrappy وارد شوید و این به این دلیل است که بسیاری
13
00:00:27,090 –> 00:00:29,340
از وب سایت ها را محدود می کنند. محتوایی را
14
00:00:29,340 –> 00:00:31,619
که ممکن است بخواهید در پشت
15
00:00:31,619 –> 00:00:34,500
صفحه ورود حذف کنید، بنابراین برای حذف
16
00:00:34,500 –> 00:00:36,660
آن دادههای محدود، همیشه ایده خوبی است که یاد بگیرید
17
00:00:36,660 –> 00:00:38,910
چگونه با استفاده از این اسکراپ پایتون وارد وبسایتها شوید،
18
00:00:38,910 –> 00:00:41,070
قبل از شروع
19
00:00:41,070 –> 00:00:43,079
کدنویسی، فقط میخواهم به
20
00:00:43,079 –> 00:00:45,180
چند نکته بسیار مهم توجه کنید.
21
00:00:45,180 –> 00:00:47,219
اولین مورد این است که در حال حاضر URL ما
22
00:00:47,219 –> 00:00:49,620
ذخیره کد برای scrape comm است و بعد از اینکه
23
00:00:49,620 –> 00:00:51,690
روی این دکمه ورود کلیک کردیم به
24
00:00:51,690 –> 00:00:54,899
کد start به scrape comm log تغییر می کند.
25
00:00:54,899 –> 00:00:56,489
دومین مورد این است که در حال حاضر می توانید
26
00:00:56,489 –> 00:00:58,800
وارد شوید هر نام کاربری و رمز عبور و
27
00:00:58,800 –> 00:01:00,629
فقط روی این دکمه ورود کلیک کنید و
28
00:01:00,629 –> 00:01:02,100
شما را وارد این وب سایت می کند
29
00:01:02,100 –> 00:01:04,500
زیرا این یک وب سایت آزمایشی
30
00:01:04,500 –> 00:01:06,299
است بدیهی است که وقتی در حال حذف یک
31
00:01:06,299 –> 00:01:07,979
پروژه خاص هستید از قبل
32
00:01:07,979 –> 00:01:09,990
نام کاربری و رمز عبور
33
00:01:09,990 –> 00:01:12,330
را می دانید بنابراین مهم نیست. بدیهی است که برای از بین بردن یک
34
00:01:12,330 –> 00:01:14,610
وب سایت، شما و مطمئن شوید
35
00:01:14,610 –> 00:01:16,140
که وارد آن وب سایت
36
00:01:16,140 –> 00:01:17,369
می شوید، باید نام کاربری و رمز عبور را بدانید
37
00:01:17,369 –> 00:01:20,369
و مجدداً می خواهم متوجه شوید که چگونه
38
00:01:20,369 –> 00:01:23,250
URL از این URL ورود پس از
39
00:01:23,250 –> 00:01:25,229
کلیک روی دکمه sloughing تغییر می کند.
40
00:01:25,229 –> 00:01:26,700
ما روی این دکمه ورود کلیک می کنیم
41
00:01:26,700 –> 00:01:28,560
و می بینید که دوباره به صفحه اصلی می رود
42
00:01:28,560 –> 00:01:31,439
و اکنون به جای ورود به ما نشان می دهد که ما از سیستم
43
00:01:31,439 –> 00:01:33,420
خارج شده ایم که به این معنی است که ما در نهایت
44
00:01:33,420 –> 00:01:35,220
وارد وب سایت شده ایم پس بیایید در
45
00:01:35,220 –> 00:01:37,650
واقع روی ورود کلیک کرده و سپس دوباره
46
00:01:37,650 –> 00:01:39,900
به اینجا بروید و اکنون از شما می خواهم به
47
00:01:39,900 –> 00:01:42,060
یک چیز بسیار مهم توجه کنید و
48
00:01:42,060 –> 00:01:43,740
شما فقط می توانید متوجه شوید که با
49
00:01:43,740 –> 00:01:45,689
استفاده از ابزار توسعه دهنده google chrome، بنابراین
50
00:01:45,689 –> 00:01:46,920
ما فقط کلیک راست کرده و روی inspect کلیک می
51
00:01:46,920 –> 00:01:49,170
کنیم و سپس ما g باید
52
00:01:49,170 –> 00:01:51,450
به این برگه شبکه برویم و سپس
53
00:01:51,450 –> 00:01:53,159
کمی آن را کوچک کنیم و اکنون
54
00:01:53,159 –> 00:01:55,110
سعی می کنیم دوباره وارد سیستم شویم، بنابراین
55
00:01:55,110 –> 00:01:57,930
من فقط نام کاربری خود را به عنوان
56
00:01:57,930 –> 00:02:00,030
ایمیل و فقط در رمز عبور قرار می دهم.
57
00:02:00,030 –> 00:02:01,890
میخواهم hello world را بگذارم و سپس
58
00:02:01,890 –> 00:02:03,960
دکمه ورود را فشار میدهم تا بیت عشق من
59
00:02:03,960 –> 00:02:06,119
کمی در اینجا پنهان شود، اما
60
00:02:06,119 –> 00:02:08,128
وارد N میشود و اکنون میتوانید ببینید
61
00:02:08,128 –> 00:02:10,639
که در بخش شبکه
62
00:02:10,639 –> 00:02:12,620
در نقل قولهایی وجود دارد که فکر میکنند آرامش را از بین ببرند و
63
00:02:12,620 –> 00:02:15,020
سپس سه چیز بی اهمیت دیگر،
64
00:02:15,020 –> 00:02:17,209
اما مهم این است که vlogging و این
65
00:02:17,209 –> 00:02:19,730
نقطه دوره برای فرار از آرامش است، همانطور که می
66
00:02:19,730 –> 00:02:21,680
بینید، وضعیت سه صفر دو دارد، به این
67
00:02:21,680 –> 00:02:23,750
معنی که از
68
00:02:23,750 –> 00:02:25,730
صفحه ورود به صفحه اصلی هدایت می شود که
69
00:02:25,730 –> 00:02:28,280
اکنون هر زمان که شما آرام باشید سفر کنید.
70
00:02:28,280 –> 00:02:30,560
روی یکی از این برگه های شبکه
71
00:02:30,560 –> 00:02:32,600
کلیک کنید، برای مثال، اگر روی ورود کلیک کنم که در حال حاضر مهم ترین آن است،
72
00:02:32,600 –> 00:02:34,400
اگر
73
00:02:34,400 –> 00:02:36,709
روی ورود کلیک کنید و به این تب هدر برویم،
74
00:02:36,709 –> 00:02:38,390
می توانید ببینید که موارد زیادی
75
00:02:38,390 –> 00:02:40,370
در اینجا وجود دارد و چیزهایی که ما داریم. در
76
00:02:40,370 –> 00:02:42,380
واقع به اگر شما علاقه مند هستند با اسکرول
77
00:02:42,380 –> 00:02:44,209
کردن به پایین میبینید که دادههای این فرم وجود دارد
78
00:02:44,209 –> 00:02:46,489
که شامل سه مقدار است،
79
00:02:46,489 –> 00:02:49,220
اولین توکن CSRF، سپس نام کاربری و
80
00:02:49,220 –> 00:02:50,900
سپس رمز عبوری که در هنگام
81
00:02:50,900 –> 00:02:53,269
ورود وارد کردم، بنابراین همیشه وقتی
82
00:02:53,269 –> 00:02:54,890
میخواهید وارد وبسایتها شوید، مطمئن شوید
83
00:02:54,890 –> 00:02:56,780
که راست کلیک کنید. روی inspect go to network کلیک کنید
84
00:02:56,780 –> 00:02:59,120
و در واقع یکبار
85
00:02:59,120 –> 00:03:01,610
بعد از ورود به سیستم سعی کنید این ورود
86
00:03:01,610 –> 00:03:04,190
یا چیزی شبیه به آن را پیدا کنید و سپس روی این کلیک کنید
87
00:03:04,190 –> 00:03:06,019
و سپس به سربرگ بروید و
88
00:03:06,019 –> 00:03:08,360
بعد از رفتن به داده های فرم سعی کنید داده های فرم را پیدا کنید.
89
00:03:08,360 –> 00:03:10,130
اینها سه مقداری هستند
90
00:03:10,130 –> 00:03:12,440
که ما هنگام کدنویسی در
91
00:03:12,440 –> 00:03:15,769
پروژه اسکرپ پایتون خود از آنها استفاده خواهیم کرد این نشانه CSRF چیست،
92
00:03:15,769 –> 00:03:16,190
93
00:03:16,190 –> 00:03:18,739
بنابراین رمز CSRF در اکثر
94
00:03:18,739 –> 00:03:20,660
وب سایت ها برای اهداف امنیتی استفاده می شود و
95
00:03:20,660 –> 00:03:23,180
عمدتاً پس از
96
00:03:23,180 –> 00:03:25,010
فشار دادن دکمه ورود به سیستم همیشه تغییر می کند. در حال حاضر
97
00:03:25,010 –> 00:03:28,070
این CI Sir of Token این است اما وقتی
98
00:03:28,070 –> 00:03:29,720
دوباره روی دکمه ورود کلیک می
99
00:03:29,720 –> 00:03:31,850
کنیم دوباره تغییر می کند بنابراین باید با استفاده
100
00:03:31,850 –> 00:03:33,950
از انتخابگرهای CSS و سپس استفاده از درخواست ها، مقدار توکن CSRF را از
101
00:03:33,950 –> 00:03:36,260
صفحه ورود به سیستم دریافت کنیم.
102
00:03:36,260 –> 00:03:39,410
103
00:03:39,410 –> 00:03:41,150
فقط میتوانیم رمز عبور نام کاربری و
104
00:03:41,150 –> 00:03:45,140
رمز CSRF را برای ورود به وبسایت ارسال کنیم،
105
00:03:45,140 –> 00:03:46,850
کمی بعد وارد درخواست فرم میشویم،
106
00:03:46,850 –> 00:03:48,650
اما اجازه دهید فقط به شما نشان دهم
107
00:03:48,650 –> 00:03:51,530
که این نشانه CSRF کجاست، در واقع اجازه دهید من از
108
00:03:51,530 –> 00:03:53,060
سیستم خارج شوم و به شما نشان دهم. کل فرآیند
109
00:03:53,060 –> 00:03:55,730
یک بار دیگر چون من فقط می خواهم این
110
00:03:55,730 –> 00:03:57,560
مرحله کاملاً واضح باشد زیرا این
111
00:03:57,560 –> 00:03:59,690
مهمترین مرحله است بنابراین ما فقط
112
00:03:59,690 –> 00:04:01,370
تعدادی داده تصادفی از نام کاربری و
113
00:04:01,370 –> 00:04:02,870
رمز عبور را وارد می کنیم و سپس
114
00:04:02,870 –> 00:04:05,150
روی Inspect کلیک راست می کنیم و به تب شبکه خود را فشار
115
00:04:05,150 –> 00:04:07,579
می دهیم و سپس
116
00:04:07,579 –> 00:04:09,380
این دکمه ورود را فشار می دهیم که
117
00:04:09,380 –> 00:04:12,260
اینجاست، بیایید این را فشار دهیم و اکنون می توانید
118
00:04:12,260 –> 00:04:15,350
دوباره ببینید که ما این درخواست ها
119
00:04:15,350 –> 00:04:17,660
را داریم و اگر روی گزینه ورود کلیک کنیم و به
120
00:04:17,660 –> 00:04:20,149
پایین اسکرول کنیم، می بینید که CSRF
121
00:04:20,149 –> 00:04:21,738
توکن همراه با رمز عبور نام کاربری تغییر کرده است،
122
00:04:21,738 –> 00:04:22,770
123
00:04:22,770 –> 00:04:25,199
حالا چگونه میتوانیم توکن CSRF را دریافت کنیم،
124
00:04:25,199 –> 00:04:28,379
بنابراین اگر فقط این
125
00:04:28,379 –> 00:04:30,509
را ببندیم و خروج را فشار دهیم و به
126
00:04:30,509 –> 00:04:32,370
صفحه ورود برویم و سپس میتوانیم فقط کلیک راست کرده
127
00:04:32,370 –> 00:04:34,680
و روی View page source کلیک کنیم تا
128
00:04:34,680 –> 00:04:36,449
همه را ببینیم. از کدی که وارد شد
129
00:04:36,449 –> 00:04:38,819
این وب سایت را بنویسید و
130
00:04:38,819 –> 00:04:41,460
این عنصر CSRF را جستجو
131
00:04:41,460 –> 00:04:43,680
می کنیم و همانطور که می بینیم این فرم در داخل
132
00:04:43,680 –> 00:04:45,990
این فرم وجود دارد این عنصر ورودی برچسب ورودی
133
00:04:45,990 –> 00:04:48,240
و در داخل آن
134
00:04:48,240 –> 00:04:51,150
نام توکن CSRF وجود دارد و این مقداری است که
135
00:04:51,150 –> 00:04:53,849
ما داریم میخواهیم حذف کنیم و اکنون با
136
00:04:53,849 –> 00:04:55,740
تمام این دانش مسلح شدهایم، بیایید در واقع
137
00:04:55,740 –> 00:04:58,110
به کد پایتون خود برگردیم و کدنویسی را شروع
138
00:04:58,110 –> 00:05:00,810
کنیم، بنابراین یک عنکبوت بسیار ابتدایی در اینجا داریم،
139
00:05:00,810 –> 00:05:02,880
فقط در حال حذف URL اصلی
140
00:05:02,880 –> 00:05:04,710
صفحه اول هستیم که نگران
141
00:05:04,710 –> 00:05:07,080
دنبال کردن پیوندها و غیره نیستیم. این یک
142
00:05:07,080 –> 00:05:09,960
عنکبوت بسیار ابتدایی است، بنابراین کاری که من میخواهم انجام دهید این است که
143
00:05:09,960 –> 00:05:11,849
در واقع یک نسخه پشتیبان از آن ایجاد کنید، بنابراین من
144
00:05:11,849 –> 00:05:13,199
فقط میخواهم یک فایل جدید در
145
00:05:13,199 –> 00:05:15,599
اینجا ایجاد کنم و یک نسخه پشتیبان برای خودم ایجاد کنم.
146
00:05:15,599 –> 00:05:17,610
147
00:05:17,610 –> 00:05:20,159
ENTER را وارد کنید و آن را در اینجا جایگذاری کنید و
148
00:05:20,159 –> 00:05:21,810
اکنون همه چیز را
149
00:05:21,810 –> 00:05:23,580
از اینجا حذف میکنیم، میدانم که این
150
00:05:23,580 –> 00:05:25,440
کمی ترسناک به نظر میرسد که چرا
151
00:05:25,440 –> 00:05:27,569
همه چیز را حذف میکنیم اما باور کنید مشکلی
152
00:05:27,569 –> 00:05:29,099
نیست زیرا ما قبلاً به جای URL شروع، نسخه پشتیبان را ایجاد کردهایم.
153
00:05:29,099 –> 00:05:31,680
154
00:05:31,680 –> 00:05:33,539
چون میخواهیم ابتدا وارد
155
00:05:33,539 –> 00:05:35,490
وبسایت شویم، فقط میخواهیم URL این ورود را به آن بدهیم،
156
00:05:35,490 –> 00:05:38,219
بنابراین بیایید فقط
157
00:05:38,219 –> 00:05:40,500
این را از اینجا کپی کرده و به
158
00:05:40,500 –> 00:05:43,349
جای URL شروع فعلی، آن را بچسبانیم و
159
00:05:43,349 –> 00:05:46,110
این را میگذاریم و اکنون مرحله بعدی این است که برای
160
00:05:46,110 –> 00:05:48,210
دریافت مقدار توکن در اینجا
161
00:05:48,210 –> 00:05:50,130
زیرا هر بار که
162
00:05:50,130 –> 00:05:52,469
روی این صفحه ورود کلیک می کنیم این تغییر می کند، بنابراین بیایید
163
00:05:52,469 –> 00:05:54,330
به کد خود برگردیم و یک متغیر ایجاد
164
00:05:54,330 –> 00:05:56,009
کنیم و آن را توکن بنامیم و سپس
165
00:05:56,009 –> 00:05:58,139
فقط از انتخابگرهای CSS که در اختیار داریم استفاده می کنیم.
166
00:05:58,139 –> 00:05:59,580
یاد گرفتیم و قرار است
167
00:05:59,580 –> 00:06:02,580
Response Dot CSS را بنویسیم و در داخل آن اگر
168
00:06:02,580 –> 00:06:04,620
به کد خود برگردیم می بینید که
169
00:06:04,620 –> 00:06:07,139
یک فرم دارد و سپس در داخل آن
170
00:06:07,139 –> 00:06:09,389
فرم این عنصر ورودی وجود دارد و اگر
171
00:06:09,389 –> 00:06:11,520
مقدار آن را دریافت کنیم ویژگی یا مقدار ما
172
00:06:11,520 –> 00:06:13,830
میتوانیم مقداری را که در داخل این
173
00:06:13,830 –> 00:06:16,919
ویژگی است دریافت کنیم، بنابراین این انتخابگر CSS ممکن است
174
00:06:16,919 –> 00:06:18,900
در وبسایتهای مختلف متفاوت باشد و در
175
00:06:18,900 –> 00:06:21,060
این یکی بسیار آسان است، بنابراین
176
00:06:21,060