در این مطلب، ویدئو Introduction to Web Scraping (Python) – درس 04 (دانلود تصاویر) با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:07,730 –> 00:00:10,620
سلام به همه، نام من King IV است و
2
00:00:10,620 –> 00:00:13,200
این مقدمه ای بر اسکراپینگ وب پایتون است
3
00:00:13,200 –> 00:00:15,719
و در ویدیوی امروز آنچه من
4
00:00:15,719 –> 00:00:18,359
نشان خواهم داد این است که چگونه تصاویر
5
00:00:18,359 –> 00:00:20,939
را از یک وب سایت دانلود کنیم، بنابراین این یک تکنیک واقعا آسان
6
00:00:20,939 –> 00:00:23,250
و موثر برای جمع آوری تعداد زیادی
7
00:00:23,250 –> 00:00:25,619
از تصاویر در وب سایت است. وب سایت و شما ممکن است
8
00:00:25,619 –> 00:00:27,539
نیاز به استفاده از آن برای گزارشی داشته باشید که ممکن است لازم باشد
9
00:00:27,539 –> 00:00:30,330
برای برنامه خود جمع آوری کنید، به
10
00:00:30,330 –> 00:00:32,009
هر دلیلی که نیاز به دانلود
11
00:00:32,009 –> 00:00:35,579
بسیاری از تصاویر دارید، انجام این کار بسیار آسان است، اما در
12
00:00:35,579 –> 00:00:37,590
13
00:00:37,590 –> 00:00:40,110
هنگام استفاده از پایتون برای توسعه
14
00:00:40,110 –> 00:00:43,559
یک برنامه، درس های اساسی مهم زیادی را آموزش می دهد. خزنده وب، بنابراین در اینجا من یک وب سایت دارم
15
00:00:43,559 –> 00:00:45,780
به نام که وب
16
00:00:45,780 –> 00:00:48,300
سایت دانشگاه واترلو است که در آن کار می کنم، جایی که
17
00:00:48,300 –> 00:00:52,379
به دانشگاه رفتم کالج اسلش
18
00:00:52,379 –> 00:00:54,930
مکان بسیار مهمی برای من است و به طور دوره ای می
19
00:00:54,930 –> 00:00:56,280
خواهم بدانم وب سایت را بررسی کنید
20
00:00:56,280 –> 00:00:58,260
، تصاویر جالب زیادی در اینجا وجود دارد، شاید من
21
00:00:58,260 –> 00:01:01,649
میخواهم چند تا دانلود کنم ببینم چه چیزی را
22
00:01:01,649 –> 00:01:03,539
میتوانم ذخیره کنم، اما به جای اینکه بروم و
23
00:01:03,539 –> 00:01:05,099
روی هر تصویر کلیک راست کنم و ذخیره
24
00:01:05,099 –> 00:01:07,080
کنم، کاری که در اینجا انجام میدهم این است که از
25
00:01:07,080 –> 00:01:09,659
پایتون برای پاک کردن آن در وب استفاده میکنم، بنابراین اولین چیزی که میخواهم انجام
26
00:01:09,659 –> 00:01:10,950
دهم. اگر درسهای قبلی پایتون را بررسی نکردهاید، این کار را انجام دهید،
27
00:01:10,950 –> 00:01:13,200
توصیه میکنم
28
00:01:13,200 –> 00:01:15,150
آنها را بررسی کنید، زیرا آنها
29
00:01:15,150 –> 00:01:17,220
از درسهای زیادی استفاده میکنند که
30
00:01:17,220 –> 00:01:18,180
قبلاً یاد گرفتهایم
31
00:01:18,180 –> 00:01:20,280
این است که من از inspect استفاده خواهم کرد،
32
00:01:20,280 –> 00:01:24,299
میبینم که یک تگ IMG از اینجا
33
00:01:24,299 –> 00:01:25,770
اطلاعات بسیار مهم در اینجا
34
00:01:25,770 –> 00:01:28,200
منبعی است که به من در
35
00:01:28,200 –> 00:01:29,909
مورد فایلی که به من می گوید کجا فایل
36
00:01:29,909 –> 00:01:33,299
ها در وب سایت ذخیره شده است و در بیشتر
37
00:01:33,299 –> 00:01:36,210
موارد همه تصاویر مانگ نیستند، اما بیشتر
38
00:01:36,210 –> 00:01:39,060
تصاویر در این تگ IMG قرار خواهند گرفت. بنابراین
39
00:01:39,060 –> 00:01:40,380
می توانید اینجا ببینید که در جای دیگری ذخیره شده
40
00:01:40,380 –> 00:01:42,570
است، اما همچنین ممکن است برای مثال
41
00:01:42,570 –> 00:01:44,970
URL کامل
42
00:01:44,970 –> 00:01:47,280
را به شما ندهد ممکن است یک لینک نسبی به شما بدهد که
43
00:01:47,280 –> 00:01:49,200
به این معنی است که شما
44
00:01:49,200 –> 00:01:50,939
باید پایه وب سایت را ارائه دهید که در این
45
00:01:50,939 –> 00:01:53,640
مورد شما هستید Lussier و سپس به آنها بدهید
46
00:01:53,640 –> 00:01:56,610
و سپس بقیه هایپرلینک مربوطه را اضافه کنید
47
00:01:56,610 –> 00:01:59,090
تا در واقع به وب سایت بروید،
48
00:01:59,090 –> 00:02:01,530
بنابراین اگر این را بررسی
49
00:02:01,530 –> 00:02:03,930
کنیم، ما می خواهیم سوپ درست کنیم،
50
00:02:03,930 –> 00:02:08,220
من
51
00:02:08,220 –> 00:02:11,740
لینک دانشگاه واترلو را در اینجا می آورم.
52
00:02:11,740 –> 00:02:15,620
و من از شر این خلاص می شوم بخش و کاری که
53
00:02:15,620 –> 00:02:17,720
ما در اینجا انجام می دهیم این است که ما فقط
54
00:02:17,720 –> 00:02:20,150
یک حلقه برای ساده انجام می دهیم، بنابراین ما می رویم
55
00:02:20,150 –> 00:02:25,010
تصویر سوپ نقطه همه چیز را پیدا می کنیم و من
56
00:02:25,010 –> 00:02:27,740
همه تگ های IMG را پیدا می کنم، بنابراین من فقط می خواهم
57
00:02:27,740 –> 00:02:29,660
این را چاپ کنم بنابراین ما میتوانیم بررسی
58
00:02:29,660 –> 00:02:35,050
کنیم ببینیم چه شکلی است
59
00:02:35,050 –> 00:02:38,660
نقطه ویرگول خوب این یک یادآوری خوب است، بنابراین
60
00:02:38,660 –> 00:02:39,920
به بالا میرویم، فقط
61
00:02:39,920 –> 00:02:41,780
اولین موردی را که در
62
00:02:41,780 –> 00:02:45,920
اینجا میبینید نگاه میکنیم.
63
00:02:45,920 –> 00:02:47,870
64
00:02:47,870 –> 00:02:49,280
توضیحات خوبی برای من وجود دارد که ممکن است بخواهم
65
00:02:49,280 –> 00:02:52,370
از آنها استفاده کنم، بنابراین اگر بخواهم
66
00:02:52,370 –> 00:02:55,010
اطلاعات منبع را به دست بیاورم، کاری که در اینجا انجام می دهم استفاده از تابع دریافت من
67
00:02:55,010 –> 00:02:56,690
است که به من امکان می دهد
68
00:02:56,690 –> 00:03:00,590
اطلاعات را در داخل یک برچسب دریافت کنم، بنابراین من
69
00:03:00,590 –> 00:03:02,300
ادامه می دهم و شما را اجرا می کنم. دوباره
70
00:03:02,300 –> 00:03:03,770
اینجا را می بینم که پیوندهایی را به من می دهد
71
00:03:03,770 –> 00:03:06,230
که واقعاً مفید است، بنابراین کاری که در مرحله بعد انجام می دهیم این
72
00:03:06,230 –> 00:03:10,250
است که من می خواهم مطمئن شوم که
73
00:03:10,250 –> 00:03:12,380
همیشه پیوند صحیح را داشته باشم
74
00:03:12,380 –> 00:03:14,150
زیرا گاهی اوقات اینجا لینک نسبی را به من می دهد
75
00:03:14,150 –> 00:03:16,280
تا من چه هستم
76
00:03:16,280 –> 00:03:21,230
در اینجا انجام می دهم این است که این را به عنوان دمای تعیین می کنم
77
00:03:21,230 –> 00:03:25,060
و سپس چیزی که در اینجا می گویم این است اگر
78
00:03:25,060 –> 00:03:29,090
temp اولین کاراکتر دما است
79
00:03:29,090 –> 00:03:31,850
که همان کروشههای مربع 1 است، بنابراین
80
00:03:31,850 –> 00:03:33,590
اگر آشنا نیست، توصیه
81
00:03:33,590 –> 00:03:35,870
میکنیم ویدیوهای دیگر را ببینید و ما آن
82
00:03:35,870 –> 00:03:40,010
را با سال گذشته برابر میکنیم و اگر
83
00:03:40,010 –> 00:03:42,830
اینطور است، کاری که من میخواستم انجام دهم این است.
84
00:03:42,830 –> 00:03:45,110
من می خواهم این متغیر جدید
85
00:03:45,110 –> 00:03:49,940
به نام تصویر را ایجاد کنم، می دانم به اضافه 10، بنابراین
86
00:03:49,940 –> 00:03:51,710
اساساً پایه وب سایت را اضافه می کنم،
87
00:03:51,710 –> 00:03:54,260
در غیر این صورت فقط تصویر را برابر با M قرار دهید،
88
00:03:54,260 –> 00:03:58,160
آنجا خیلی پیچیده نیست، بنابراین اگر
89
00:03:58,160 –> 00:04:04,610
بخواهم تصویر را اینجا چاپ کنم، باید لینک کامل را به من بدهد.
90
00:04:04,610 –> 00:04:07,390
کاری که او در اینجا انجام می دهد
91
00:04:07,390 –> 00:04:09,860
که واقعاً مفید است دقیقاً همان چیزی که
92
00:04:09,860 –> 00:04:14,150
می خواهیم انجام دهیم این است که ما
93
00:04:14,150 –> 00:04:16,910
باید واقعاً بتوانیم این فایل
94
00:04:16,910 –> 00:04:21,108
را بنویسیم تا این URL را در یک فایل
95