در این مطلب، ویدئو یک مثال ساده ETL با استفاده از پایتون با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:06:23
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:01,520 –> 00:00:03,520
در این ویدیو من یک مثال ساده
2
00:00:03,520 –> 00:00:04,080
3
00:00:04,080 –> 00:00:08,240
از نحوه استفاده از پایتون برای کار etl نشان خواهم داد، بهطور
4
00:00:08,240 –> 00:00:10,240
خاص کاری که من انجام میدهم این است
5
00:00:10,240 –> 00:00:12,559
که به فهرستی از آدرسهای ایمیل نگاه میکنم
6
00:00:12,559 –> 00:00:15,759
و سعی میکنم آنچه را
7
00:00:15,759 –> 00:00:17,680
که یک آدرس ایمیل معتبر در نظر میگیرم
8
00:00:17,680 –> 00:00:20,640
از ایمیل نامعتبر جدا کنم. آدرس هایی برای انجام این کار
9
00:00:20,640 –> 00:00:23,920
من یک اسکریپت پایتون نوشته ام
10
00:00:23,920 –> 00:00:27,039
اسکریپت پایتون از
11
00:00:27,039 –> 00:00:28,880
ماژول بیان منظم داخلی استفاده می کند
12
00:00:28,880 –> 00:00:31,439
من این کار را انجام می دهم که با استفاده از دستور ورودی آن را به اسکریپت خود متصل می کنم
13
00:00:31,439 –> 00:00:33,040
14
00:00:33,040 –> 00:00:34,960
و کد را از
15
00:00:34,960 –> 00:00:36,160
ماژول ماژول بیان
16
00:00:36,160 –> 00:00:40,000
معمولی یک فایل وارد می کند. که حاوی تعدادی
17
00:00:40,000 –> 00:00:43,600
کد پایتون از قبل ایجاد شده است،
18
00:00:43,600 –> 00:00:47,520
من در اینترنت جستجو می کنم و یک
19
00:00:47,520 –> 00:00:50,399
رشته عبارت منظم از کاراکترها را پیدا می
20
00:00:50,399 –> 00:00:52,960
کنم که نشان دهنده چیزی است که من به دنبال آن هستم.
21
00:00:52,960 –> 00:00:56,239
22
00:00:56,239 –> 00:00:57,120
23
00:00:57,120 –> 00:00:58,480
24
00:00:58,480 –> 00:01:00,640
یکی از
25
00:01:00,640 –> 00:01:02,239
26
00:01:02,239 –> 00:01:05,840
سادهترین کاراکترها است و فقط به دنبال کاراکترهای یونیکد
27
00:01:05,840 –> 00:01:08,240
یا رشته گسترده با
28
00:01:08,240 –> 00:01:08,960
نماد at میگردیم،
29
00:01:08,960 –> 00:01:11,840
چند کاراکتر دیگر با یک نقطه و
30
00:01:11,840 –> 00:01:13,600
چند کاراکتر دیگر بعد از آن دو یا
31
00:01:13,600 –> 00:01:15,759
سه کاراکتر بعد از آن.
32
00:01:15,759 –> 00:01:18,720
بنابراین ما میتوانیم این یک تطابق باشد
33
00:01:18,720 –> 00:01:20,479
زیرا دارای نماد تبلیغاتی است.
34
00:01:20,479 –> 00:01:23,759
35
00:01:23,759 –> 00:01:24,720
36
00:01:24,720 –> 00:01:29,119
37
00:01:29,119 –> 00:01:32,960
38
00:01:32,960 –> 00:01:35,600
39
00:01:35,600 –> 00:01:36,479
40
00:01:36,479 –> 00:01:38,400
روش های مختلف برای نوشتن
41
00:01:38,400 –> 00:01:40,000
این الگوها و آنچه من توصیه می کنم
42
00:01:40,000 –> 00:01:43,200
این است که اگر می خواهید از چیزی شبیه به
43
00:01:43,200 –> 00:01:44,799
این استفاده کنید، فقط به اینترنت بروید
44
00:01:44,799 –> 00:01:47,200
و آن را جستجو کنید تا زمانی که
45
00:01:47,200 –> 00:01:48,720
آنقدر به آن عادت کنید که بتوانید فقط خودتان بنویسید
46
00:01:48,720 –> 00:01:49,680
47
00:01:49,680 –> 00:01:51,600
.
48
00:01:51,600 –> 00:01:53,840
زمانی که کد رایگان را برای آزمایش کد رایگان پیدا میکنید مهم
49
00:01:53,840 –> 00:01:54,560
است،
50
00:01:54,560 –> 00:01:56,719
زیرا رایگان است، اما
51
00:01:56,719 –> 00:01:58,159
لزوماً تضمین نمیکند که
52
00:01:58,159 –> 00:01:59,439
53
00:01:59,439 –> 00:02:01,600
در مورد ما بینقص است، ما آن را با
54
00:02:01,600 –> 00:02:03,119
ایجاد
55
00:02:03,119 –> 00:02:06,399
دو فایل مختلف آزمایش
56
00:02:06,399 –> 00:02:08,560
میکنیم، یک فایل که ما آن را نگه میداریم. دادههای ایمیل معتبر و یکی
57
00:02:08,560 –> 00:02:10,878
دادههای ایمیل نامعتبر را نگه
58
00:02:10,878 –> 00:02:13,280
59
00:02:13,280 –> 00:02:16,400
میدارد و ما فایل دادههای ایمیل را میخوانیم که همان چیزی است که من اینجا نوشتهام
60
00:02:17,280 –> 00:02:19,520
و سپس آن دو فایل دیگر را ایجاد میکنیم
61
00:02:19,520 –> 00:02:22,000
و دادهها را
62
00:02:22,000 –> 00:02:23,360
به روشی که میخواهم انجام دهم در آنجا قرار میدهیم. این است که من
63
00:02:23,360 –> 00:02:25,520
شما را باز می کنم p
64
00:02:25,520 –> 00:02:29,040
این فایلهای نامعتبر و معتبر در حالت نوشتن،
65
00:02:29,040 –> 00:02:29,760
66
00:02:29,760 –> 00:02:32,080
اکنون این فایلها وجود ندارند،
67
00:02:32,080 –> 00:02:33,519
هنوز در پوشهای
68
00:02:33,519 –> 00:02:37,440
به نام data برای پردازش قرار میگیرند، اجازه
69
00:02:37,440 –> 00:02:41,280
دهید به
70
00:02:42,720 –> 00:02:45,120
درایو محلی خود در اینجا بروم، من قبلاً یک
71
00:02:45,120 –> 00:02:47,120
پوشه به نام data ساختهام. برای پردازش، اگر آن
72
00:02:47,120 –> 00:02:48,800
73
00:02:48,800 –> 00:02:53,680
پوشه را درست نکرده بودم، باید آن را بسازم،
74
00:02:53,680 –> 00:02:57,840
فایل متنی را در آن پوشه کپی می کنم
75
00:02:57,840 –> 00:03:01,519
و اکنون فایل های متنی موجود در داده ها برای
76
00:03:01,519 –> 00:03:02,000
پردازش
77
00:03:02,000 –> 00:03:05,920
پوشه، اکنون در مک،
78
00:03:05,920 –> 00:03:08,879
کمی متفاوت به نظر می رسد زیرا مک
79
00:03:08,879 –> 00:03:11,599
اینطور نیست. از حرف