در این مطلب، ویدئو پایگاه داده UIUC Airfoil: همه فایل ها را با استفاده از پایتون دانلود کنید با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:08:08
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:02,550 –> 00:00:04,680
سلام به همه در این ویدیو،
2
00:00:04,680 –> 00:00:06,479
من یک اسکریپت پایتون را مرور می کنم که
3
00:00:06,479 –> 00:00:09,059
همه ایرفویل ها را از
4
00:00:09,059 –> 00:00:09,690
پایگاه داده
5
00:00:09,690 –> 00:00:12,150
6
00:00:12,150 –> 00:00:14,129
7
00:00:14,129 –> 00:00:16,230
8
00:00:16,230 –> 00:00:17,970
UIUC aerofoil دانلود می کند.
9
00:00:17,970 –> 00:00:19,440
من این اسکریپت را با استفاده از Spyder به شما نشان خواهم داد
10
00:00:19,440 –> 00:00:20,910
که اگر ناوبر Anaconda را دانلود کنید
11
00:00:20,910 –> 00:00:22,830
که می توانید آن را روی
12
00:00:22,830 –> 00:00:24,180
صفحه نمایش ببینید، می توانید پیدا کنید و سپس
13
00:00:24,180 –> 00:00:26,100
Spyder را از آنجا در اینجا
14
00:00:26,100 –> 00:00:28,230
راه اندازی کنید، روی راه اندازی کلیک کنید و این
15
00:00:28,230 –> 00:00:30,390
پنجره را باز می کند و خوب است. چون میتوانم
16
00:00:30,390 –> 00:00:31,860
به سرعت متغیر را به شما نشان دهم، بنابراین اگر
17
00:00:31,860 –> 00:00:33,719
به اینجا بروید، روی برگه یک
18
00:00:33,719 –> 00:00:35,430
کاوشگر متغیر کلیک کنید،
19
00:00:35,430 –> 00:00:37,200
وقتی آنها را ذخیره میکنم، اینجا ظاهر میشوند و وقتی
20
00:00:37,200 –> 00:00:38,910
صحبت در مورد اسکریپت تمام شد،
21
00:00:38,910 –> 00:00:40,500
آن را از پنجره فرمان اجرا میکنم. برای اینکه به شما نشان دهم
22
00:00:40,500 –> 00:00:42,899
چقدر آسان است که ابتدا
23
00:00:42,899 –> 00:00:43,950
برخی از مواردی را وارد کنم که استفاده
24
00:00:43,950 –> 00:00:46,140
خواهیم کرد، بنابراین ما زیبا سوپ را برای تجزیه
25
00:00:46,140 –> 00:00:49,290
صفحه وب وارد می کنیم، همچنین اهمیت دارد
26
00:00:49,290 –> 00:00:50,460
تا بتوانیم فقط پیوندهایی را بگیریم
27
00:00:50,460 –> 00:00:52,140
که با نوع فایل مطابقت دارند. بخواهید و
28
00:00:52,140 –> 00:00:54,390
سپس ما همچنین باید بسته آزمایشگاه URL را وارد کنیم
29
00:00:54,390 –> 00:00:56,340
که کار با URL ها را کنترل می کند
30
00:00:56,340 –> 00:00:58,380
و این فقط مطمئن می
31
00:00:58,380 –> 00:01:00,180
شود که با هر نسخه از
32
00:01:00,180 –> 00:01:01,980
پایتون که در حال اجرا هستید کار می کند اکنون که
33
00:01:01,980 –> 00:01:03,450
همه چیزهایی را که نیاز داریم وارد کرده ایم.
34
00:01:03,450 –> 00:01:05,459
میتوانم به کد واقعی
35
00:01:05,459 –> 00:01:06,270
بروم، بنابراین اولین کاری که میخواهم انجام دهم این است
36
00:01:06,270 –> 00:01:08,939
که مسیر اصلی وبسایت را تجویز کنم
37
00:01:08,939 –> 00:01:10,770
و این مسیری است که همه
38
00:01:10,770 –> 00:01:12,539
پیوندهای دیگر در این سایت به آن ارجاع داده میشوند،
39
00:01:12,539 –> 00:01:14,130
بنابراین برای دیدن این، اجازه دهید به مسیر واقعی برویم.
40
00:01:14,130 –> 00:01:16,079
سایت بسیار خوب است، بنابراین اینجا وب سایت پایگاه داده ایرفویل است،
41
00:01:16,079 –> 00:01:17,579
اجازه دهید من شما را
42
00:01:17,579 –> 00:01:20,249
به سرعت در اینجا راهنمایی کنم، ما منابع
43
00:01:20,249 –> 00:01:22,529
یا آینه های مفیدی داریم، سپس بایگانی داریم، سپس
44
00:01:22,529 –> 00:01:24,179
یک فهرست به روز رسانی داریم که شامل
45
00:01:24,179 –> 00:01:25,799
این فایل های داده است، این فایل های ایرفویل واقعی هستند،
46
00:01:25,799 –> 00:01:27,630
اما هنوز گنجانده نشده اند.
47
00:01:27,630 –> 00:01:29,579
در بایگانی های بالا یا لیست A تا Z در
48
00:01:29,579 –> 00:01:31,380
زیر و سپس ما دایرکتوری A تا Z را داریم
49
00:01:31,380 –> 00:01:34,079
، بنابراین هدفی که می خواهیم
50
00:01:34,079 –> 00:01:36,029
انجام دهیم دانلود تک تک
51
00:01:36,029 –> 00:01:39,270
فایل های dat airfoil از این وب سایت است،
52
00:01:39,270 –> 00:01:40,889
اکنون ممکن است به این URL ri نگاه کنید. ght
53
00:01:40,889 –> 00:01:42,090
در اینجا و گفتن اینکه این
54
00:01:42,090 –> 00:01:43,859
شبیه به مسیر فایل پایه ای نیست که
55
00:01:43,859 –> 00:01:46,859
در کد مشخص کردم و بنابراین برای اینکه نشان دهم چرا
56
00:01:46,859 –> 00:01:48,990
فقط این را به عنوان مسیر فایل پایه انتخاب می کنم توجه داشته باشید
57
00:01:48,990 –> 00:01:51,329
که این می گوید core database dot HTML
58
00:01:51,329 –> 00:01:54,479
و اجازه دهید به آنچه می خواهیم برویم. برای دریافت
59
00:01:54,479 –> 00:01:56,669
از وبسایت، بنابراین اگر
60
00:01:56,669 –> 00:01:58,200
این فایلها را مانند یکی از این فایلها همینجا باز
61
00:01:58,200 –> 00:01:59,929
کنم، متوجه خواهید شد که به
62
00:01:59,929 –> 00:02:02,969
مختصات تغییر میکند و سپس نام فایل خوب است،
63
00:02:02,969 –> 00:02:04,739
بنابراین اینجا متفاوت است و سپس
64
00:02:04,739 –> 00:02:06,840
اگر به فایل دیگری بروم در دایرکتوری A
65
00:02:06,840 –> 00:02:09,179
تا Z و سپس فقط می گوید cord
66
00:02:09,179 –> 00:02:11,280
بدون به روز رسانی و سپس نام فایل
67
00:02:11,280 –> 00:02:13,620
و بنابراین مسیر فایل اصلی که
68
00:02:13,620 –> 00:02:15,319
هرگز تغییر نمی کند این
69
00:02:15,319 –> 00:02:17,120
مشکلی ندارد، اکنون ما دوباره به اسکریپت بازگشته ایم
70
00:02:17,120 –> 00:02:18,049
و اولین کاری که می خواهیم انجام دهیم.
71
00:02:18,049 –> 00:02:20,239
صفحه وب را با استفاده از URL باز شده
72
00:02:20,239 –> 00:02:23,870
با URL وب سایت به عنوان آرگومان باز می کنیم و
73
00:02:23,870 –> 00:02:26,359
سپس صفحه وب را با استفاده از beautifulsoup تجزیه می کنیم
74
00:02:26,359 –> 00:02:28,459
و ذخیره می کنیم که در
75
00:02:28,459 –> 00:02:30,530
متغیری به نام soup این بخش بعدی
76
00:02:30,530 –> 00:02:32,269
جایی است که از طریق HTML حلقه می زنیم تا
77
00:02:32,269 –> 00:02:34,189
فایل های DAT را پیدا کنیم. به دنبال آنها هستند
78
00:02:34,189 –> 00:02:35,810
و آنها را در یک برنامه ذخیره می کنند فایلی که به طور طبیعی نامگذاری
79
00:02:35,810 –> 00:02:39,469
شده است، متغیر IND فقط به عنوان
80
00:02:39,469 –> 00:02:40,909
شمارنده برای نشان دادن پیشرفت در پنجره فرمان
81
00:02:40,909 –> 00:02:44,719
استفاده می شود و همچنین لیستی
82
00:02:44,719 –> 00:02:47,299
به نام پیوندها را راه اندازی می کنیم که به آن اضافه می کنیم و
83
00:02:47,299 –> 00:02:48,919
توجه می کنیم که از نظر فنی به این نیاز
84
00:02:48,919 –> 00:02:50,870
نیست، اما می توانیم لیست پیوندهایی را که خواهیم دید.
85
00:02:50,870 –> 00:02:52,310
قبل از مرور
86
00:02:52,310 –> 00:02:55,370
همه تقریباً 1580 مورد از آنها، خروجی بگیرید و
87
00:02:55,370 –> 00:02:56,480
در اینجا ظاهر می شود، بنابراین ما می توانیم به آن نگاهی بیندازیم
88
00:02:56,480 –> 00:02:58,189
و قبل از اینکه وارد حلقه for
89
00:02:58,189 –> 00:03:00,079
شویم، به صفحه وب برمی گردیم
90
00:03:00,079 –> 00:03:02,000
و به آن نگاه می کنیم. منبع حداقل در
91
00:03:02,000 –> 00:03:03,889
Google Chrome شما کنترل U را فشار می دهید و
92
00:03:03,889 –> 00:03:06,230
این منبع صفحه یا
93
00:03:06,230 –> 00:03:08,510
HTML را نشان می دهد و بنابراین اگر به پایین اسکرول کنیم می
94
00:03:08,510 –> 00:03:11,060
توانیم اتفاقات زیادی را ببینیم، اما بیایید
95
00:03:11,060 –> 00:03:13,400
به جایی برسیم که ایرفویل ها شروع می شوند تا بتوانید
96
00:03:13,400 –> 00:03:15,290
ببینید که آنها از اینجا شروع می شوند. با
97
00:03:15,290 –> 00:03:17,000
فایل های DAT و بنابراین کاری که می
98
00:03:17,000 –> 00:03:18,949
خواهیم در حلقه خود انجام دهیم این است که در
99
00:03:18,949 –> 00:03:22,400
هر پیوند a که دارای
100
00:03:22,400 –> 00:03:26,870
ویژگی href از جمله نقطه dat است جستجو کنیم و
101
00:03:26,870 –> 00:03:30,590
سپس کاری که می خواهیم انجام دهیم این است که وارد آن
102
00:03:30,590 –> 00:03:31,729
شویم، زیرا ما می خواهم روی
103
00:03:31,729 –> 00:03:34,729
آن فایل DAT کلیک کرده و سپس sa دادهها را در
104
00:03:34,729 –> 00:03:38,269
اینجا به همان نام فایل وارد کنید، بنابراین
105
00:03:38,269 –> 00:03:39,949
کاری که ما در این خط انجام میدهیم این است
106
00:03:39,949 –> 00:03:41,720
که میگوییم okay کل
107
00:03:41,720 –> 00:03:44,989
HTML سوپ را مرور کنید و به من بدهید و همه
108
00:03:44,989 –> 00:03:47,180
پیوندها را پیدا کنم و این همان چیزی است که a برای
109
00:03:47,180 –> 00:03:49,909
آن است. پیوندها ویژگی
110
00:03:49,909 –> 00:03:52,549
href را پیدا میکنند و فقط آنهایی را به من میدهند
111
00:03:52,549 –> 00:03:58,280
که در آن href ما اکنون dot dat را پیدا میکنیم،
112
00:03:58,280 –> 00:03:59,449
ممکن است بپرسید چرا همه چیز
113
00:03:59,449 –> 00:04:02,449
مورد نیاز است و بنابراین اجازه دهید من فقط این را نظر
114
00:04:02,449 –> 00:04:04,129
بدهم و من فقط همان چیزی را کپی میکنم
115
00:04:04,129 –> 00:04:05,870
و بیاورم. آن را در اینجا پایین آورده ام اما اکنون
116
00:04:05,870 –> 00:04:07,639
من