در این مطلب، ویدئو تجزیه و تحلیل داده های پایتون برای هتل هایی که از پانداس استفاده می کنند (قسمت 1) [پیشرفته] با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,920 –> 00:00:04,560
خوب سلام به همگی من
2
00:00:04,560 –> 00:00:07,470
امشب برای شما یک هدیه دارم، ما سریال پیشرفته را شروع می کنیم
3
00:00:07,470 –> 00:00:11,340
و من آن را
4
00:00:11,340 –> 00:00:14,450
پیشرفته می نامم زیرا ما شروع به استفاده از
5
00:00:14,450 –> 00:00:20,039
پایتون و پاندا خواهیم کرد و من سعی خواهم کرد
6
00:00:20,039 –> 00:00:21,720
در نهایت این مجموعه زیبا را بسازم. من
7
00:00:21,720 –> 00:00:23,359
همچنان در حال یادگیری هستم،
8
00:00:23,359 –> 00:00:25,529
بنابراین واضح است که
9
00:00:25,529 –> 00:00:27,720
در بخش کدنویسی واقعاً دقیق این موضوع کمی متزلزل خواهم بود،
10
00:00:27,720 –> 00:00:30,240
اما من شروع به
11
00:00:30,240 –> 00:00:31,349
یادگیری می کنم که شما می دانید چگونه کارهای بسیار
12
00:00:31,349 –> 00:00:35,040
جالبی را با داده های خام انجام دهید. به همین دلیل است
13
00:00:35,040 –> 00:00:36,840
که من این سری خاص
14
00:00:36,840 –> 00:00:40,710
را پیشرفته مینامم، بنابراین قبل از اینکه وارد آن شویم،
15
00:00:40,710 –> 00:00:43,440
پیوندهایی را در
16
00:00:43,440 –> 00:00:44,940
توضیحات ویدیوی آنچه که شما برای
17
00:00:44,940 –> 00:00:47,190
شروع این کار
18
00:00:47,190 –> 00:00:50,730
نیاز دارید اضافه میکنم، حداقل به Python I’m نیاز دارید. از پایتون 3 استفاده کنید تا
19
00:00:50,730 –> 00:00:52,140
بتوانید ادامه دهید و میدانید نصب کنید
20
00:00:52,140 –> 00:00:54,600
که اگر میخواهید شروع کنید همچنین
21
00:00:54,600 –> 00:00:56,969
اگر میخواهید محیط آناکوندا را دانلود
22
00:00:56,969 –> 00:00:59,969
کنید واقعاً عالی است
23
00:00:59,969 –> 00:01:02,340
پس از نصب پایتون، میتوانید
24
00:01:02,340 –> 00:01:04,260
در یک Conda دانلود کنید و در
25
00:01:04,260 –> 00:01:06,930
واقع این کار انجام میشود. جلو و نصب یک دسته از
26
00:01:06,930 –> 00:01:08,430
مختلف
27
00:01:08,430 –> 00:01:10,229
اگر
28
00:01:10,229 –> 00:01:11,760
میخواهید وارد علم داده شوید، به کتابخانههای پایتون روی رایانهتان نیاز دارید
29
00:01:11,760 –> 00:01:16,140
و سپس من این را از
30
00:01:16,140 –> 00:01:21,450
یک مشتری و یک نوتبوک مشتری اجرا میکنم، خوب است، اما
31
00:01:21,450 –> 00:01:23,790
باز هم پیوندهایی در
32
00:01:23,790 –> 00:01:25,140
زیر دارید. بچهها میتوانند آن را بررسی کنند
33
00:01:25,140 –> 00:01:27,810
و میتوانید ویدیوها را پیدا کنید و من مطمئن هستم که
34
00:01:27,810 –> 00:01:29,970
در توضیح نحوه نصب
35
00:01:29,970 –> 00:01:34,920
آن بسیار بهتر از همیشه میتوانم خوب باشم، بنابراین بیایید از
36
00:01:34,920 –> 00:01:38,009
اینجا شروع کنیم، اجازه دهید
37
00:01:38,009 –> 00:01:39,090
توضیح کوچکی درباره کاری که
38
00:01:39,090 –> 00:01:41,729
امشب انجام میدهیم انجام دهیم. آیا این
39
00:01:41,729 –> 00:01:47,939
فایل مقادیر جدا شده از برگه واقعاً زشت را دارید و من
40
00:01:47,939 –> 00:01:49,380
این را مستقیماً از یکی از
41
00:01:49,380 –> 00:01:52,829
ویژگی های خود سیستم PMS آنها برداشتم، بنابراین این
42
00:01:52,829 –> 00:01:55,259
ویژگی از Opera PMS استفاده می کند که
43
00:01:55,259 –> 00:01:58,350
واقعاً بسیار رایج است و من یک
44
00:01:58,350 –> 00:02:01,350
گزارش سابقه تهیه کردم و می خواستم ببینم شما
45
00:02:01,350 –> 00:02:03,540
از ابتدا می دانید. عملکرد این هتل در سال 2016 چگونه است
46
00:02:03,540 –> 00:02:06,540
، بنابراین من یک
47
00:02:06,540 –> 00:02:08,459
اندازه نمونه بسیار خوب را پس گرفتم، بنابراین
48
00:02:08,459 –> 00:02:11,400
از اول سال 2016
49
00:02:11,400 –> 00:02:14,030
تا پایان شب گذشته که
50
00:02:14,030 –> 00:02:17,660
17 مارس 2018 بود، عقب نشینی کردم، بنابراین ما بیش از دو
51
00:02:17,660 –> 00:02:21,230
سال داده در اینجا داریم و باید باشیم
52
00:02:21,230 –> 00:02:24,680
قادر به شما kn برخی از روندهای
53
00:02:24,680 –> 00:02:26,690
در حال توسعه را ببینید، ما باید به نوعی احساس کنیم
54
00:02:26,690 –> 00:02:28,760
که چگونه این چگونه این
55
00:02:28,760 –> 00:02:30,709
هتل چگونه عمل می کند، قبل از اینکه این هتل به طور متوسط چگونه عمل می
56
00:02:30,709 –> 00:02:33,500
57
00:02:33,500 –> 00:02:35,420
58
00:02:35,420 –> 00:02:37,459
ند. من
59
00:02:37,459 –> 00:02:39,110
کسی بودم که قبلاً این ملک را
60
00:02:39,110 –> 00:02:41,060
ندیده بودم و می خواهم چیزهایی در مورد
61
00:02:41,060 –> 00:02:44,150
آن بیاموزم و واقعاً تنها چیزی که در ابتدا به شما می گویم
62
00:02:44,150 –> 00:02:46,280
این است که این یک ملک 80 اتاقه
63
00:02:46,280 –> 00:02:49,130
است که از Opera PMS استفاده می کند و
64
00:02:49,130 –> 00:02:50,989
این واقعاً تمام چیزی است که شما بچه ها می دانید.
65
00:02:50,989 –> 00:02:52,489
تا پایان این ویدیو حداقل
66
00:02:52,489 –> 00:02:55,880
چند چیز دیگر را می دانیم تا
67
00:02:55,880 –> 00:02:57,769
به طور متوسط بدانیم اشغال این هتل چق
68
00:02:57,769 –> 00:03:02,269
ر است و به طور میانگین می دانیم که
69
00:03:02,269 –> 00:03:07,040
نها در روز هفته چند اتاق فروخته اند و فقط چن
70
00:03:07,040 –> 00:03:08,959
مورد دیگر مانند اساساً اینطور است،
71
00:03:08,959 –> 00:03:11,269
اما ما این کار را به
72
00:03:11,269 –> 00:03:13,819
روشی بسیار جالب انجام خواهیم داد، تنها زمانی که
73
00:03:13,819 –> 00:03:15,709
از اکسل برای این ویدیو استفاده می
74
00:03:15,709 –> 00:03:18,019
کنیم، تقریباً همین الان است و پس از آن
75
00:03:18,019 –> 00:03:19,250
می خواهیم به آن بازگردیم. یک
76
00:03:19,250 –> 00:03:21,530
دقیقه زمانی که باید به ستون های خود ارجاع دهیم
77
00:03:21,530 –> 00:03:23,450
اما بعد از آن ما
78
00:03:23,450 –> 00:03:25,910
اکسل را کنار میگذاریم و همه پانداس پایتون خواهند بود،
79
00:03:25,910 –> 00:03:30,730
همه آن نوع علم دادهها
80
00:03:30,730 –> 00:03:32,630
مشکلی ندارد، بنابراین بیایید از نوت بوک مشتری خود شروع کنیم،
81
00:03:32,630 –> 00:03:34,100
بنابراین ابتدا باید چند کار را انجام دهیم،
82
00:03:34,100 –> 00:03:35,540
83
00:03:35,540 –> 00:03:38,989
بنابراین بیایید پانداس را وارد کنیم.
84
00:03:38,989 –> 00:03:41,840
وارد کردن پانداس بهعنوان PD این
85
00:03:41,840 –> 00:03:43,220
تقریباً شبیه یک نام مستعار است که شما
86
00:03:43,220 –> 00:03:45,380
به پانداس میدهید، بنابراین بعداً در کد
87
00:03:45,380 –> 00:03:48,049
وقتی به پانداس اشاره میکنم، فقط
88
00:03:48,049 –> 00:03:50,780
در PD ظاهر میکنم و سپس میدانید که میتوانم فقط
89
00:03:50,780 –> 00:03:53,480
شی را بعد از آن دستکاری کنم.
90
00:03:53,480 –> 00:03:56,390
راه کوتاهتری برای ارجاع به
91
00:03:56,390 –> 00:04:01,010
کتابخانه پانداس را نیز وارد
92
00:04:01,010 –> 00:04:04,010
میکنیم، نمیدانم از آن برای این
93
00:04:04,010 –> 00:04:06,109
ویدیوی خاص استفاده میکنیم یا نه، اما همچنان که میرویم، به
94
00:04:06,109 –> 00:04:08,359
ساختن روی این نوتبوک ادامه میدهیم تا
95
00:04:08,359 –> 00:04:11,090
ممکن است وارد کنیم و بیایید
96
00:04:11,090 –> 00:04:14,019
matplotlib
97
00:04:15,600 –> 00:04:17,889
را وارد کنیم و دوباره فقط میخواهیم به ما
98
00:04:17,889 –> 00:04:20,139
یک نام مستعار در اینجا بدهیم و
99
00:04:20,139 –> 00:04:24,550
نمودار matplotlib dot pie را به عنوان PLT وارد
100
00:04:24,550 –> 00:04:29,470
کنیم.
101
00:04:29,470 –> 00:04:31,690
102
00:04:31,690 –> 00:04:34,870
نمودارهای درون این نوت بوک
103
00:04:34,870 –> 00:04:39,699
در اینجا بسیار خوب است، پس بیایید این تکه از را اجرا کنیم
104
00:04:39,699 –> 00:04:40,990
کد در اینجا همه چیز به
105
00:04:40,990 –> 00:04:43,060
خوبی انجام شد همه این کتابخانهها را وارد کرد،
106
00:04:43,060 –> 00:04:45,250
بنابراین آنها در پسزمینه آماده
107
00:04:45,250 –> 00:04:48,340
هستند و ما به آنها نیاز داریم، بنابراین اجازه دهید
108
00:04:48,340 –> 00:04:53,470
شروع کنیم که فایل روی دسکتاپ من است، بنابراین
109
00:04:53,470 –> 00:04:56,949
دقیقاً اینجا این پرونده تاریخ است، بنابراین میخواهیم
110
00:04:56,949 –> 00:04:59,740
آن را به داخل بکشیم. و شروع به تجزیه و تحلیل کنیم،
111
00:04:59,740 –> 00:05:04,419
بنابراین برای انجام آن، بیایید شروع کنیم، بنابراین
112
00:05:04,419 –> 00:05:06,910
باید اعلام کنیم که این
113
00:05:06,910 –> 00:05:09,610
مجموعه داده را داده می نامیم، بسیاری از افرادی که از
114
00:05:09,610 –> 00:05:13,060
پانداس استفاده می کنند برای قاب داده می گویند DF که
115
00:05:13,060 –> 00:05:15,550
خوب است، شما می توانید از هر کدام که می خواهید استفاده کنید و
116
00:05:15,550 –> 00:05:22,270
ما از این نقطه PD استفاده خواهم کرد خواندن CSV
117
00:05:22,270 –> 00:05:26,710
نقطه OPD می خواند متأسفم PD بخوانید CSV خوب است و اکنون
118
00:05:26,710 –> 00:05:31,330
باید مسیر فایل را برای این فایل بدست آوریم،
119
00:05:31,330 –> 00:05:32,740
بنابراین من فقط می خواهم آن
120
00:05:32,740 –> 00:05:35,800
را از روی صفحه نمایش خیلی سریع به یک روشی که می
121
00:05:35,800 –> 00:05:38,500
توانید این کار را انجام دهید، استفاده کنم. و احتمالاً این احتمالاً
122
00:05:38,500 –> 00:05:40,780
راه ناکارآمد احمقانه است که می توانید
123
00:05:40,780 –> 00:05:43,690
روی ویژگی های آن کلیک راست کنید و فقط می
124
00:05:43,690 –> 00:05:48,669
توانید این مسیر فایل را اینجا کپی کنید
125
00:05:48,669 –> 00:05:51,099
که این روشی است که من این کار را انجام می دهم گاهی اوقات دوباره
126
00:05:51,099 –> 00:05:53,650
مطمئن هستم که دانشمند داده در جایی
127
00:05:53,650 –> 00:05:56,229
به من می خندد ، خوب پس از آن
128
00:05:56,229 –> 00:05:58,440
اجازه دهید چند آرگومان دیگر را در h ارائه کنیم اگر
129
00:05:58,440 –> 00:06:02,590
این PD دوباره csv را بخواند، به صورت
130
00:06:02,590 –> 00:06:05,770
پیشفرض است و فرض میکنیم که فایلی که
131
00:06:05,770 –> 00:06:07,360
شما آن را تغذیه میکنید یک مقدار جدا شده با کاما است.
132
00:06:07,360 –> 00:06:10,150
133
00:06:10,150 –> 00:06:12,639
134
00:06:12,639 –> 00:06:13,120
135
00:06:13,120 –> 00:06:18,639
136
00:06:18,639 –> 00:06:22,419
در صورتی که پیامهای خطای زیادی در این مورد دریافت کنیم،
137
00:06:22,419 –> 00:06:25,250
من دوست دارم از این خطا استفاده کنم
138
00:06:25,250 –> 00:06:27,980
خطوط بد برابر با نادرست است که فقط
139
00:06:27,980 –> 00:06:30,140
استثناهای کمتر و خطاهای کمتری را
140
00:06:30,140 –> 00:06:32,030
ایجاد میکند، به خصوص اگر مجموعه دادههای ما
141
00:06:32,030 –> 00:06:34,130
بهخصوص تمیز نباشند، زیرا همیشه میتوانیم
142
00:06:34,130 –> 00:06:36,220
بعداً آن را پاک کنیم،
143
00:06:36,220 –> 00:06:38,720
بنابراین اول من
144
00:06:38,720 –> 00:06:41,720
قبل از شروع به توصیف آن، این را وارد میکنم، اما ما
145
00:06:41,720 –> 00:06:43,730
اساساً فقط از ستونهای خاصی
146
00:06:43,730 –> 00:06:45,980
در این مجموعه داده استفاده میکنیم، بنابراین میخواهیم بگوییم
147
00:06:45,980 –> 00:06:49,850
از ستونها استفاده کنید حالا بیایید شناسایی کنیم که کدام
148
00:06:49,850 –> 00:06:52,340
ستونها را در این مجموعه داده استفاده میکنیم.
149
00:06:52,340 –> 00:06:54,200
باز هم این آخرین باری است که میخواهم
150
00:06:54,200 –> 00:06:56,720
آن را در اکسل بکشم، اما آن را
151
00:06:56,720 –> 00:06:59,860
فقط برای تجسم به تصویر کشیدم، بنابراین پانداس را در نظر داشته باشید
152
00:06:59,860 –> 00:07:03,830
و میدانید که پایتون اشیاء
153
00:07:03,830 –> 00:07:05,870
و تقریباً همه چیز را در
154
00:07:05,870 –> 00:07:09,470
برنامهنویسی ستونهایی که با
155
00:07:09,470 –> 00:07:12,500
شاخص صفر شروع کردهاند فهرست میکند. بنابراین برای مثال این ستون
156
00:07:12,500 –> 00:07:15,340
یک که در واقع نمایه ستون صفر و
157
00:07:15,340 –> 00:07:19,760
دو است، بنابراین ما فقط می خواهیم چهار
158
00:07:19,760 –> 00:07:22,040
ستون را از این فایل مقادیر جدا شده از برگه بیرون بکشیم،
159
00:07:22,040 –> 00:07:25,990
آنها با تاریخی مطابقت دارند
160
00:07:25,990 –> 00:07:28,900
که بقیه با اتاق فروخته شده،
161
00:07:28,900 –> 00:07:33,860
سپس اشغال و سپس ADR مطابقت
162
00:07:33,860 –> 00:07:35,360
دارند. نگاهی به اینکه کدام ستون را
163
00:07:35,360 –> 00:07:36,980
در اینجا میخواهیم، بنابراین ما این ستون تاریخ را میخواهیم، می
164
00:07:36,980 –> 00:07:39,710
یم که این ستون را حتم
165
00:07:39,710 –> 00:07:44,570
ً میخواهیم، بنابراین ستون 0 1 2 خواهد بود، بنابراین ما ستون 2 را
166
00:07:44,570 –> 00:07:47,419
ارد میکنیم و فقط برای سهولت شما
167
00:07:47,419 –> 00:07:49,370
میدانید که من فرض کنید که شما
168
00:07:49,370 –> 00:07:51,530
مفهوم را دریافت کرده اید، بنابراین ما از
169
00:07:51,530 –> 00:07:55,940
ستون 2 3 11 استفاده می کنیم که اشغال است و
170
00:07:55,940 –> 00:07:59,660
سپس ستون 13 که ADR است، بیایید
171
00:07:59,660 –> 00:08:03,320
یک استدلال دیگر به این یادداشت منتقل کنیم
172
00:08:03,320 –> 00:08:06,230
که هیچ سرصفحه ای وجود ندارد، بنابراین
173
00:08:06,230 –> 00:08:11,600
باید بگوییم هدر هیچ. خیلی خوب
174
00:08:11,600 –> 00:08:15,110
استفاده کنید، متأسفم، کمی کمتر از
175
00:08:15,110 –> 00:08:17,900
176
00:08:17,900 –> 00:08:22,430
177
00:08:22,430 –> 00:08:23,810
178
00:08:23,810 –> 00:08:26,300
179
00:08:26,300 –> 00:08:28,970
آن پرمخاطب است.
180
00:08:28,970 –> 00:08:30,950
بدون سربرگ هستند، بنابراین جلوتر رفته است
181
00:08:30,950 –> 00:08:34,190
فقط اعداد ستونها را در اینها قرار دهید
182
00:08:34,190 –> 00:08:35,929
یا آنها را شماره فهرست صدا کنید، بنابراین ستون دو،
183
00:08:35,929 –> 00:08:37,710
سه
184
00:08:37,710 –> 00:08:40,049
شاخص 13 و سپس در اینجا این
185
00:08:40,049 –> 00:08:42,919
فهرستهای ردیف را دارید که بسیار جالب
186
00:08:42,919 –> 00:08:45,420
است، بسیار جالب است که پانداس به
187
00:08:45,420 –> 00:08:49,770
تنهایی این کار را برای شما انجام می دهند، اما اینطور نیست.
188
00:08:49,770 –> 00:08:52,320
کاری که میخواهیم اینجا انجام دهیم این است که
189
00:08:52,320 –> 00:08:54,300
میخواهیم به جلو برویم و تعدادی
190
00:08:54,300 –> 00:08:56,340
ستون را اعلام کنیم تا بتوانیم با استفاده از این تابع ستونها این کار را انجام دهیم
191
00:08:56,340 –> 00:08:59,850
تا ستونهای داده و
192
00:08:59,850 –> 00:09:01,890
سپس میخواهیم آنها را طوری نامگذاری کنیم که
193
00:09:01,890 –> 00:09:04,500
ستون اول داده باشد یا I’m با
194
00:09:04,500 –> 00:09:08,730
عرض پوزش تاریخ تاریخ خواهد بود ستون بعدی
195
00:09:08,730 –> 00:09:11,450
اتاق خواهد بود، یعنی اتاق های فروخته شده
196
00:09:11,450 –> 00:09:13,920
در ستون بعدی
197
00:09:13,920 –> 00:09:16,650
198
00:09:16,650 –> 00:09:20,370
199
00:09:20,370 –> 00:09:22,860
200
00:09:22,860 –> 00:09:24,420
.
201
00:09:24,420 –> 00:09:26,090
کمی تمیزتر به نظر میرسد، ما این ADR را داریم که اتاقهای تاریخ را
202
00:09:26,090 –> 00:09:29,400
اشغال میکنند و سپس همه
203
00:09:29,400 –> 00:09:34,740
آن فهرستهای ردیف خوب است، بنابراین تنها
204
00:09:34,740 –> 00:09:36,210
چیزی که متوجه میشوم این است که به هر
205
00:09:36,210 –> 00:09:36,960
دلیلی
206
00:09:36,960 –> 00:09:39,540
حداقل 29 ردیف اول
207
00:09:39,540 –> 00:09:42,090
به نظر نمیرسد. هر چیزی که
208
00:09:42,090 –> 00:09:44,220
خوب نیست، پس بیایید کمی بیشتر مجموعه داده را بررسی کنیم،
209
00:09:44,220 –> 00:09:47,100
بیایید ببینیم بیایید
210
00:09:47,100 –> 00:09:48,630
آن را برش دهیم و ببینیم که داده ها از کجا
211
00:09:48,630 –> 00:09:53,940
شروع به خوب شدن می کنند، پس توجه کنید که من
212
00:09:53,940 –> 00:09:56,250
برش هستم، متاسفم که 20 مورد اول است، بنابراین
213
00:09:56,250 –> 00:09:59,850
می خواهیم از ردیف 20 به بعد نگاه کنیم. بیایید ببینیم
214
00:09:59,850 –> 00:10:02,810
که آیا دادهها از آنجا پاکتر میشوند یا خیر، به
215
00:10:02,810 –> 00:10:06,230
نظر میرسد فهرست ردیف شماره
216
00:10:06,230 –> 00:10:08,940
33 جایی است که دادهها خوب میشوند و ممکن
217
00:10:08,940 –> 00:10:11,160
است به این دلیل باشد که سیستم PMS
218
00:10:11,160 –> 00:10:14,460
دادههای خود را پس از 2 سال یا چیزی یا چیزی یا 2
219
00:10:14,460 –> 00:10:17,070
سال در یک ماه پاک میکند. میدانیم، اما ما
220
00:10:17,070 –> 00:10:18,750
میخواهیم از شر این دادهها خلاص شویم
221
00:10:18,750 –> 00:10:22,530
که خوب و تمیز نیستند، پس بیایید این کار را انجام
222
00:10:22,530 –> 00:10:27,660
دهیم، بیایید آن را پاک کنیم، بنابراین اجازه دهید
223
00:10:27,660 –> 00:10:29,430
این یک تابع نیست، اما اجازه دهید
224
00:10:29,430 –> 00:10:31,470
کمی آن را پاک کنیم و کاری که
225
00:10:31,470 –> 00:10:33,840
قرار است انجام دهد این است تمام
226
00:10:33,840 –> 00:10:36,810
دادههای ما را میگیرد و به دنبال ردیفهایی
227
00:10:36,810 –> 00:10:41,070
میگردد که چیزی ندارند و
228
00:10:41,070 –> 00:10:43,620
آنها را جایگزین میکند یا در واقع به نوعی
229
00:10:43,620 –> 00:10:48,070
آنها را حذف میکند، بنابراین بیایید ببینیم که آیا دوباره کار میکند،
230
00:10:48,070 –> 00:10:50,660
اجازه دهید به دادهها نگاه کنیم و به آنجا
231
00:10:50,660 –> 00:10:53,480
بروید، بنابراین از فهرست شروع میکنیم. 33
232
00:10:53,480 –> 00:10:55,880
آنجا بود که داده ها در تمام طول مسیر
233
00:10:55,880 –> 00:10:58,640
او خوب شدند این آخرین ردیف شاخص 806 است،
234
00:10:58,640 –> 00:11:04,450
بنابراین مجموعه دادههای تمیز و خوبی است فعلاً
235
00:11:04,960 –> 00:11:07,490
، پس بیایید این را
236
00:11:07,490 –> 00:11:11,260
کمی علامتگذاری کنیم، سعی کنیم به درستی کدنویسی کنیم و
237
00:11:11,260 –> 00:11:18,920
آنهایی را که حاوی هیچ چیز خوبی نیستند حذف کنیم،
238
00:11:18,920 –> 00:11:19,700
239
00:11:19,700 –> 00:11:22,430
پس بیایید یک قدم به عقب برگردیم.
240
00:11:22,430 –> 00:11:25,580
مجموعه دادهها تمیز به نظر میرسند، اما
241
00:11:25,580 –> 00:11:28,400
آیا بیایید بفهمیم زیرا اگر ما یک
242
00:11:28,400 –> 00:11:30,110
سری رشتهها و چیزهای مشابه در
243
00:11:30,110 –> 00:11:31,820
آنجا داشته باشیم، واقعاً نمیتوانیم هیچ ریاضیاتی روی
244
00:11:31,820 –> 00:11:34,850
رشتهها انجام دهیم، مثلاً اگر آن
245
00:11:34,850 –> 00:11:36,440
خط اشغال رشتهای است که ما هستیم.
246
00:11:36,440 –> 00:11:37,670
نمیتوانیم کار زیادی با آن
247
00:11:37,670 –> 00:11:40,880
انجام دهیم، بنابراین بیایید این تابع نوع D را
248
00:11:40,880 –> 00:11:45,350
دادههای نقطه D نوع R ببخشید و
249
00:11:45,350 –> 00:11:49,880
تاریخ شما در حال حاضر شیئی است
250
00:11:49,880 –> 00:11:50,810
که احتمالاً خوب نیست
251
00:11:50,810 –> 00:11:54,380
اتاقهای ما یک عدد صحیح است که
252
00:11:54,380 –> 00:11:57,440
پانداس آن را تشخیص میدهند. اتاق فروخته شده ما
253
00:11:57,440 –> 00:11:59,840
یک عدد صحیح بود و البته این یک عدد صحیح است
254
00:11:59,840 –> 00:12:01,490
زیرا یک عدد کامل است که شما نمی
255
00:12:01,490 –> 00:12:04,640
توانید پنج و نیم اتاق در یک هتل
256
00:12:04,640 –> 00:12:07,490
بفروشید، باید پنج یا شش اتاق بفروشید، بنابراین پانداس
257
00:12:07,490 –> 00:12:10,130
تشخیص می دهند که اشغال به درستی
258
00:12:10,130 –> 00:12:12,710
یک شی است و سپس ADR است. یک شناور تا
259
00:12:12,710 –> 00:12:15,500
اتاق ها و ADR است تاریخ صحیح و
260
00:12:15,500 –> 00:12:18,410
اشغال آن اشیا هستند، بنابراین من
261
00:12:18,410 –> 00:12:21,500
کمی شک دارم، فکر
262
00:12:21,500 –> 00:12:22,850
نمیکنم بتوانیم کار زیادی با آن انجام
263
00:12:22,850 –> 00:12:28,460
دهیم، بنابراین بیایید ببینیم که این فقط نوع دادههای ما را شناسایی میکند،
264
00:12:28,460 –> 00:12:34,010
پس بیایید این کار را انجام دهیم، بیایید
265
00:12:34,010 –> 00:12:38,560
بفهمیم بیایید بفهمیم مشخص کنید
266
00:12:38,740 –> 00:12:44,560
که آن تاریخ ها در چه نوع داده ای
267
00:12:44,560 –> 00:12:47,950
هستند، من متوجه شدم که من آن
268
00:12:47,950 –> 00:12:50,020
شاخص 33 را قرار می دهم زیرا این همان چیزی است که
269
00:12:50,020 –> 00:12:59,649
مجموعه داده های جدید شروع می شود تایپ کنید Oh dad, اگر تاریخ
270
00:12:59,649 –> 00:13:00,279
اینجا نیست،
271
00:13:00,279 –> 00:13:03,190
خوب است، بنابراین ستون تاریخ ما همه
272
00:13:03,190 –> 00:13:05,830
رشته هایی هستند که این
273
00:13:05,830 –> 00:13:08,649
عالی نیست، ما میخواهیم آنها اشیاء تاریخ/زمان باشند،
274
00:13:08,649 –> 00:13:10,899
و سپس یکی دیگر
275
00:13:10,899 –> 00:13:12,250
که عالی به نظر نمیرسد
276
00:13:12,250 –> 00:13:15,490
، همان اشغال بود، اگر یک
277
00:13:15,490 –> 00:13:18,700
نوع چاپ انجام دهم و سپس آن ستون اشغال را بکشم،
278
00:13:18,700 –> 00:13:21,520
آن رشتهها نیز هستند.
279
00:13:21,520 –> 00:13:24,550
ما نمیتوانیم انجام دهیم، من نمیتوانم در حال حاضر یک تن با آنها کار کنم،
280
00:13:24,550 –> 00:13:27,610
بنابراین باید آنها را به
281
00:13:27,610 –> 00:13:29,470
واقعی تبدیل کنیم، ما به شناور بودن گوش نمیدهیم،
282
00:13:29,470 –> 00:13:31,660
زیرا شما آن اعشار را
283
00:13:31,660 –> 00:13:33,520
در آنجا خواهید داشت، بنابراین آنها باید شناور باشند نه
284
00:13:33,520 –> 00:13:39,279
اعداد صحیح بنابراین
285
00:13:39,279 –> 00:13:41,290
هر زمان که دوباره دادهها را تایپ میکنم، متوجه آن
286
00:13:41,290 –> 00:13:43,779
شدم ستون اشغال او
287
00:13:43,779 –> 00:13:46,209
اکنون میدانیم که رشتهای است که نمیتوانیم کار
288
00:13:46,209 –> 00:13:48,190
زیادی با آن انجام دهیم و همچنین این
289
00:13:48,190 –> 00:13:50,200
علامت درصد را در اینجا دارد که میدانم اگر
290
00:13:50,200 –> 00:13:53,350
بخواهم تبدیل کنم به
291
00:13:53,350 –> 00:13:56,470
مشکل برمیخوریم چون شما نمیدانید که
292
00:13:56,470 –> 00:14:00,579
این یک کاراکتر عجیب و غریب یک درصد است، بنابراین یک
293
00:14:00,579 –> 00:14:01,839
کاری که میتوانیم اینجا انجام دهیم این است که میتوانیم یک تابع
294
00:14:01,839 –> 00:14:05,110
نوار رشته پایتون بسیار ساده انجام دهیم
295
00:14:05,110 –> 00:14:08,560
تا از شر آن علامت درصد خلاص شویم،
296
00:14:08,560 –> 00:14:09,700
بنابراین بیایید این کار را انجام
297
00:14:09,700 –> 00:14:14,310
دهیم، فرض کنید اشغال دادهها برابر است با
298
00:14:14,310 –> 00:14:17,350
رشته نقطه اشغال و بیایید آن را حذف کنیم
299
00:14:17,350 –> 00:14:20,290
و بیایید strip کنیم. این از آن نشانههای درصد است،
300
00:14:20,290 –> 00:14:22,209
بنابراین کاری که ما انجام میدهیم این است که
301
00:14:22,209 –> 00:14:24,579
میگوییم هی ستون اشغال را بگیرید،
302
00:14:24,579 –> 00:14:27,430
ستون اشغال اکنون برابر است با
303
00:14:27,430 –> 00:14:31,600
ستون اشغال خالی است، بیایید ببینیم آیا
304
00:14:31,600 –> 00:14:33,820
کار میکرد، بنابراین حالا اجازه دهید
305
00:14:33,820 –> 00:14:37,060
دوباره به دادهها نگاه کنیم. بنابراین
306
00:14:37,060 –> 00:14:41,079
آن علامت درصد در آنجا برداشته شد، بنابراین اکنون ما
307
00:14:41,079 –> 00:14:43,270
احتمالاً میتوانیم آن را کمی راحتتر تبدیل کنیم،
308
00:14:43,270 –> 00:14:45,899
من تصور میکنم
309
00:14:45,899 –> 00:14:49,149
خیلی خوب است، بنابراین پانداس این
310
00:14:49,149 –> 00:14:53,110
تابع واقعاً جالب به نام دو عددی را دارند، بنابراین آنچه که
311
00:14:53,110 –> 00:14:56,019
میتوانیم اینجا انجام دهیم این است که میتوانیم بگوییم دادهها
312
00:14:56,019 –> 00:14:57,790
اکنون اشغال نیستند. کلاه خالی است، ما آن ستون را صدا می زنیم
313
00:14:57,790 –> 00:15:00,610
و
314
00:15:00,610 –> 00:15:10,269
بیایید پانداس را دو عددی صدا کنیم، بسیار خوب
315
00:15:10,269 –> 00:15:12,490
و سپس بیایید دوباره به داده ها نگاه
316
00:15:12,490 –> 00:15:15,910
کنیم، به نظر می رسد مانند قبل است، اما
317
00:15:15,910 –> 00:15:21,660
اگر تماس می گیریم، اگر نوع چاپ
318
00:15:21,660 –> 00:15:26,709
داده را بگوییم سی – ردیف شاخص سوم
319
00:15:26,709 –> 00:15:29,319
اکنون یک شناور است، بنابراین اکنون یک عدد است که
320
00:15:29,319 –> 00:15:30,790
میتوانیم با آن کاری انجام دهیم
321
00:15:30,790 –> 00:15:32,980
که عالی است، عالی است، دقیقاً همان
322
00:15:32,980 –> 00:15:35,290
چیزی است که ما میخواهیم و راه دیگری برای بررسی
323
00:15:35,290 –> 00:15:36,550
این موضوع نیز میتوانستیم دادههای
324
00:15:36,550 –> 00:15:42,670
نوع نقطه D را انجام دهیم، بنابراین اتاقهای شی تاریخ اکنون هستند
325
00:15:42,670 –> 00:15:44,470
و در aru همیشه یک
326
00:15:44,470 –> 00:15:47,290
عدد صحیح بوده است و آگهی هر دو
327
00:15:47,290 –> 00:15:49,269
در حال حاضر شناور هستند، بنابراین فوقالعاده است، بنابراین اکنون تنها چیزی که
328
00:15:49,269 –> 00:15:51,550
باید واقعا نگران آن باشیم این است که
329
00:15:51,550 –> 00:15:55,060
تاریخ دریافت آنها از رشته