در این مطلب، ویدئو پروژه علم داده از ابتدا! دنبال کنید. با زیرنویس فارسی را برای دانلود قرار داده ام. شما میتوانید با پرداخت 15 هزار تومان ، این ویدیو به علاوه تمامی فیلم های سایت را دانلود کنید.اکثر فیلم های سایت به زبان انگلیسی می باشند. این ویدئو دارای زیرنویس فارسی ترجمه شده توسط هوش مصنوعی می باشد که میتوانید نمونه ای از آن را در قسمت پایانی این مطلب مشاهده کنید.
مدت زمان فیلم: 00:24:08
تصاویر این ویدئو:
قسمتی از زیرنویس این فیلم:
00:00:00,080 –> 00:00:01,520
این مقدمه ای است برای
2
00:00:01,520 –> 00:00:03,600
استفاده از پانداها برای تجزیه و تحلیل داده ها
3
00:00:03,600 –> 00:00:05,839
در پایتون، اوه شما
4
00:00:05,839 –> 00:00:07,520
باید پایتون را روی سیستم خود داشته باشید، اگر پایتون
5
00:00:07,520 –> 00:00:08,639
را به خوبی
6
00:00:08,639 –> 00:00:10,639
نمی شناسید، در این آموزش به آن نمی پردازیم
7
00:00:10,639 –> 00:00:11,920
8
00:00:11,920 –> 00:00:13,759
. توصیه می کنم به
9
00:00:13,759 –> 00:00:15,040
آناکوندا بروید و
10
00:00:15,040 –> 00:00:17,039
آن را به این ترتیب نصب کنید، زیرا اگر این کار را انجام دهید
11
00:00:17,039 –> 00:00:18,880
، حاوی
12
00:00:18,880 –> 00:00:20,480
تمام بسته هایی است که احتمالاً به آنها
13
00:00:20,480 –> 00:00:22,240
نیاز خواهید داشت، اگر پایتون را می شناسید و
14
00:00:22,240 –> 00:00:24,000
قبلاً آن را روی سیستم خود نصب کرده اید،
15
00:00:24,000 –> 00:00:25,680
پس عالی است. اگر از
16
00:00:25,680 –> 00:00:28,240
یک نوت بوک jupyter استفاده می کنید، مطمئن شوید
17
00:00:28,240 –> 00:00:28,880
که آن را
18
00:00:28,880 –> 00:00:30,400
نصب کرده اید، اگر آناکوندا دارید که به
19
00:00:30,400 –> 00:00:32,238
هر حال نصب
20
00:00:32,238 –> 00:00:34,480
می شود و وقتی آن را روی سیستم خود نصب کردید،
21
00:00:34,480 –> 00:00:35,660
ما آماده شروع به
22
00:00:35,660 –> 00:00:40,079
[Music
23
00:00:40,079 –> 00:00:42,000
] هستیم، فرض می کنم که شما آیا پایتون
24
00:00:42,000 –> 00:00:43,440
روی سیستم شما نصب شده
25
00:00:43,440 –> 00:00:46,399
است و همانطور که من پیشنهاد دادم anaconda
26
00:00:46,399 –> 00:00:48,079
راه خوبی برای انجام این کار است که این تنها
27
00:00:48,079 –> 00:00:50,320
راه نیست و اگر با روش دیگری آشنا هستید
28
00:00:50,320 –> 00:00:52,079
و می خواهید از
29
00:00:52,079 –> 00:00:54,160
مفسر پایتون
30
00:00:54,160 –> 00:00:55,760
دیگری استفاده کنید، کاملاً خوب است که من می خواهم
31
00:00:55,760 –> 00:00:58,079
از آناکوندا برای این آموزش استفاده کنید آل
32
00:00:58,079 –> 00:01:01,600
و ویدیوهای آینده در این مجموعه
33
00:01:01,600 –> 00:01:05,360
دقیقاً آنچه ما در اینجا داریم داده هایی است
34
00:01:05,360 –> 00:01:07,439
که می خواهم به آنها نگاهی بیندازیم یا
35
00:01:07,439 –> 00:01:08,960
حداقل داشبورد داده ها را بررسی کنیم، بنابراین ما می
36
00:01:08,960 –> 00:01:09,840
خواهیم به
37
00:01:09,840 –> 00:01:13,040
داده های Covet 19 از
38
00:01:13,040 –> 00:01:16,159
آنها نگاه کنیم. داشبورد خود را در اینجا دارند، امم،
39
00:01:16,159 –> 00:01:18,240
اما ما قرار است
40
00:01:18,240 –> 00:01:21,600
داده ها را دانلود کنیم و
41
00:01:21,600 –> 00:01:24,960
از این لینک اینجا نگاهی به آن بیندازیم، اکنون فقط می توانیم
42
00:01:24,960 –> 00:01:26,960
روی این لینک کلیک کرده و آن را دانلود کرده
43
00:01:26,960 –> 00:01:28,640
و در پوشه درست قرار
44
00:01:28,640 –> 00:01:30,560
دهیم، اما ما می توانیم همه کارها را انجام دهیم. این
45
00:01:30,560 –> 00:01:32,000
46
00:01:32,000 –> 00:01:34,799
همان کاری است که ما باید انجام دهیم، بنابراین کاری که
47
00:01:34,799 –> 00:01:36,880
من میخواهم انجام دهید این است که دفترچه یادداشت jupyter خود را باز کنید،
48
00:01:36,880 –> 00:01:39,520
اما شما این کار را
49
00:01:39,520 –> 00:01:42,720
در آناکوندا انجام دهید، در واقع قبل از انجام
50
00:01:42,720 –> 00:01:44,000
آن، فقط
51
00:01:44,000 –> 00:01:47,200
یک پوشه در جایی ایجاد کنید که بتوانید
52
00:01:47,200 –> 00:01:47,600
53
00:01:47,600 –> 00:01:50,640
این فایلها، این دادهها و این
54
00:01:50,640 –> 00:01:53,040
فایلهای نوتبوک jupyter را داشته باشید، بنابراین کاری که من
55
00:01:53,040 –> 00:01:55,280
میخواهم انجام دهم این است که اگر به دادههای سیدی برویم، یک درایو خارجی دارم و
56
00:01:55,280 –> 00:01:57,600
57
00:01:57,600 –> 00:02:00,799
58
00:02:00,799 –> 00:02:03,439
اگر نوتبوک jupyter خود را
59
00:02:03,439 –> 00:02:04,079
60
00:02:04,079 –> 00:02:06,960
از پوشه پروژه راهاندازی کنید، وجود دارد. که شما می توانید
61
00:02:06,960 –> 00:02:08,639
برای این آموزش استفاده کنید،
62
00:02:08,639 –> 00:02:10,560
ما اکنون به شما خواهیم پرداخت ”
63
00:02:10,560 –> 00:02:12,560
برای این کار به پاندا نیاز دارید، شما به ناتوانی
64
00:02:12,560 –> 00:02:12,959
نیاز
65
00:02:12,959 –> 00:02:16,879
خواهید داشت، ما همچنین از
66
00:02:16,879 –> 00:02:20,000
تعدادی از ماژول
67
00:02:20,000 –> 00:02:22,000
های استاندارد کتابخانه استاندارد استفاده خواهیم کرد، بنابراین اولین کاری که
68
00:02:22,000 –> 00:02:23,680
انجام می دهید ایده خوبی برای شما خواهد بود
69
00:02:23,680 –> 00:02:25,200
” هرگز از نوتبوکهای jupyter استفاده نکردهام
70
00:02:25,200 –> 00:02:25,840
71
00:02:25,840 –> 00:02:28,640
، این است که به کمک بروید و رابط کاربری را نیز مرور کنید،
72
00:02:28,640 –> 00:02:29,440
73
00:02:29,440 –> 00:02:31,200
زمانی که این کار را انجام دادید
74
00:02:31,200 –> 00:02:32,800
، به میانبرهای صفحهکلید نگاهی بیندازید، این
75
00:02:32,800 –> 00:02:33,760
یک منوی کاملاً مفید
76
00:02:33,760 –> 00:02:35,519
است، بنابراین
77
00:02:35,519 –> 00:02:37,280
رابط کاربری را نیز مرور کنید و
78
00:02:37,280 –> 00:02:39,040
اگر میخواهید همچنین به شما علاقه مند هستم که می
79
00:02:39,040 –> 00:02:40,720
دانید می توانید کل این پروژه را از یک
80
00:02:40,720 –> 00:02:43,280
محیط مجازی اجرا کنید، من در گذشته ویدیوهایی
81
00:02:43,280 –> 00:02:45,440
در مورد
82
00:02:45,440 –> 00:02:47,200
آن ساخته ام، اگر برای شما جالب است به آنها نگاهی بیندازید، ما
83
00:02:47,200 –> 00:02:48,560
این کار را
84
00:02:48,560 –> 00:02:50,319
برای این یکی انجام نمی دهیم. ما ممکن است
85
00:02:50,319 –> 00:02:51,760
در پروژههای آینده به انجام این کار نگاه کنیم، من واقعاً
86
00:02:51,760 –> 00:02:53,280
میخواهم این کار را در مورد جمعآوری
87
00:02:53,280 –> 00:02:54,239
دادهها
88
00:02:54,239 –> 00:02:57,680
و استفاده از پانداها برای کاوش در دادهها
89
00:02:57,680 –> 00:02:59,120
انجام دهم و در عین حال این کار
90
00:02:59,120 –> 00:03:00,720
را به شما آموزش
91
00:03:00,720 –> 00:03:02,959
میدهم که چگونه پانداها چگونه کار میکنند، بنابراین ما میخواهیم
92
00:03:02,959 –> 00:03:04,000
داشته باشیم. pandas
93
00:03:04,000 –> 00:03:07,760
numpy numpy معمولا وارداتی است d به عنوان mp
94
00:03:07,760 –> 00:03:10,000
panda معمولاً به صورت pd وارد میشود،
95
00:03:10,000 –> 00:03:12,000
شما اغلب میبینید که منظورم این است که میگویم
96
00:03:12,000 –> 00:03:13,680
معمولاً همیشه نمیتوانم به
97
00:03:13,680 –> 00:03:16,239
زمانی فکر کنم که سیستم عامل وارداتی نیست، زیرا ما
98
00:03:16,239 –> 00:03:18,159
فقط میخواهیم برخی
99
00:03:18,159 –> 00:03:21,200
از مسیرهای دانلود داده را مدیریت کنیم.
100
00:03:21,200 –> 00:03:25,120
و url lib کتابخانه url نیز
101
00:03:25,120 –> 00:03:28,480
به ما کمک می کند تا بتوانیم به
102
00:03:28,480 –> 00:03:31,120
وب سایت ها دسترسی داشته باشیم و محتوا و
103
00:03:31,120 –> 00:03:32,560
matplotlib درون خطی بارگیری
104
00:03:32,560 –> 00:03:34,959
کنیم که فقط به نوت بوک مشتری این امکان را می دهد که
105
00:03:34,959 –> 00:03:36,159
106
00:03:36,159 –> 00:03:38,159
نمودارها را در خود دفترچه ارائه دهد،
107
00:03:38,159 –> 00:03:39,360
ما در واقع
108
00:03:39,360 –> 00:03:41,680
در این مورد خاص نقشه ای انجام نمی دهیم. ویدیویی اما
109
00:03:41,680 –> 00:03:44,000
در ویدیوهای بعدی وجود خواهد داشت، بنابراین
110
00:03:44,000 –> 00:03:44,720
عادت خوبی
111
00:03:44,720 –> 00:03:46,319
است که وارد شوید، من فقط آن را طبق عادت در آنجا قرار می دهم،
112
00:03:46,319 –> 00:03:47,760
واقعاً همیشه آن را در آنجا قرار می دهم
113
00:03:47,760 –> 00:03:48,400
زیرا
114
00:03:48,400 –> 00:03:50,720
می دانید که همیشه از آن استفاده خواهم کرد
115
00:03:50,720 –> 00:03:52,080
، بنابراین چه چیزی در اینجا داریم،
116
00:03:52,080 –> 00:03:54,959
بیایید اجرا کنیم آن سلول اگر
117
00:03:54,959 –> 00:03:55,840
118
00:03:55,840 –> 00:03:58,400
برای بازدید از تور رابط کاربری وقت گذاشته
119
00:03:58,400 –> 00:04:00,000
اید، می دانید که چگونه یک
120
00:04:00,000 –> 00:04:03,599
سلول um را اجرا کنید، فقط shift را فشار دهید و وارد کنید
121
00:04:03,599 –> 00:04:06,000
که یک راه است یا فقط می توانید روی
122
00:04:06,000 –> 00:04:06,959
run here کلیک کنید
123
00:04:06,959 –> 00:04:08,319
اکنون چه چیزی خوب است. این
124
00:04:08,319 –> 00:04:10,239
وا را گرفتم riable به نام url و ما
125
00:04:10,239 –> 00:04:13,280
آن را برابر با آدرس اینترنتی
126
00:04:13,280 –> 00:04:15,920
از جایی که قرار است داده ها را دانلود کنیم، می کنیم،
127
00:04:15,920 –> 00:04:17,519
بنابراین این
128
00:04:17,519 –> 00:04:19,600
لینک به داده ها در اینجا است، ما
129
00:04:19,600 –> 00:04:20,720
متغیر دیگری به نام مسیر فایل داریم
130
00:04:20,720 –> 00:04:23,919
که متغیری
131
00:04:23,919 –> 00:04:27,120
است که این مسیر جدید را ذخیره می کند. که
132
00:04:27,120 –> 00:04:28,479
ما ایجاد می کنیم زیرا
133
00:04:28,479 –> 00:04:29,520
134
00:04:29,520 –> 00:04:32,800
دانلود را در پوشه ای به نام data قرار می دهیم
135
00:04:32,800 –> 00:04:34,240
و در آن پوشه
136
00:04:34,240 –> 00:04:36,880
پوشه ای به نام covid وجود دارد و دانلود
137
00:04:36,880 –> 00:04:37,759
138
00:04:37,759 –> 00:04:40,560
در آن پوشه زندگی می کند بنابراین باید آن را ایجاد کنیم
139
00:04:40,560 –> 00:04:42,160
و قبل از آن ما میتوانیم آن را ایجاد
140
00:04:42,160 –> 00:04:44,320
کنیم، خوب تمرین خوبی است
141
00:04:44,320 –> 00:04:46,479
که متغیری داشته باشیم که حاوی
142
00:04:46,479 –> 00:04:47,360
اطلاعاتی باشد،
143
00:04:47,360 –> 00:04:51,840
این کتابخانه OS واقعاً بسیار مفید
144
00:04:51,840 –> 00:04:54,560
است، بخشی از کتابخانه استاندارد پایتون است
145
00:04:54,560 –> 00:04:55,600
146
00:04:55,600 –> 00:04:57,360
147
00:04:57,360 –> 00:04:58,400
. من کاملاً مطمئن هستم که بخشی از
148
00:04:58,400 –> 00:04:59,840
کتابخانه استاندارد پایتون است
149
00:04:59,840 –> 00:05:02,320
و در مدیریت مسیرهای شما بسیار خوب است
150
00:05:02,320 –> 00:05:03,039
و
151
00:05:03,039 –> 00:05:04,880
این چیزی است که در نظر گرفته شده است تا
152
00:05:04,880 –> 00:05:06,639
اگر از این اسکریپت در
153
00:05:06,639 –> 00:05:07,759
سیستم عاملهای مختلف استفاده میکنید،
154
00:05:07,759 –> 00:05:09,759
این کار را برای شما انجام دهد.
155
00:05:09,759 –> 00:05:11,600
بیایید t را اجرا کنیم
156
00:05:11,600 –> 00:05:14,240
و اکنون در اینجا دوباره از کتابخانه OS استفاده می
157
00:05:14,240 –> 00:05:15,280
کنیم، می خواهیم
158
00:05:15,280 –> 00:05:17,120
دایرکتوری هایی ایجاد کنیم که
159
00:05:17,120 –> 00:05:20,320
داده های پوشه حاوی پوشه covid را داشته باشیم
160
00:05:20,320 –> 00:05:22,720
و این کاری است که این کار انجام می دهد و سپس
161
00:05:22,720 –> 00:05:24,560
این مسیر csv را ایجاد می کنیم.
162
00:05:24,560 –> 00:05:27,600
این مسیری است که
163
00:05:27,600 –> 00:05:29,520
به دادههایی که میخواهیم
164
00:05:29,520 –> 00:05:31,680
دانلود کنیم، بنابراین
165
00:05:31,680 –> 00:05:33,280
این همان چیزی است که این متغیر
166
00:05:33,280 –> 00:05:34,960
به ما میدهد، این
167
00:05:34,960 –> 00:05:38,000
مسیر را در اینجا به اضافه نام فایل به
168
00:05:38,000 –> 00:05:40,080
ما میدهد، بنابراین وقتی میخواهیم به آن دادهها دسترسی پیدا
169
00:05:40,080 –> 00:05:43,120
کنیم، میتوانیم از مسیر csv استفاده کنیم
170
00:05:43,120 –> 00:05:46,400
و در اینجا URL درخواست url lib
171
00:05:46,400 –> 00:05:47,440
بازیابی میشود،
172
00:05:47,440 –> 00:05:50,639
ما به این نشانی اینترنتی در اینجا میرویم و سپس
173
00:05:50,639 –> 00:05:53,280
آنچه را که در اینجا داریم در
174
00:05:53,280 –> 00:05:55,199
نام این مسیر در اینجا ذخیره میکنیم، بنابراین
175
00:05:55,199 –> 00:05:57,039
همه کارهایی که انجام میدهند این است.
176
00:05:57,039 –> 00:05:58,960
اجرا کنید پس اکنون اینجا جایی است که ما
177
00:05:58,960 –> 00:06:00,240
از پانداها استفاده می کنیم
178
00:06:00,240 –> 00:06:02,319
آیا شما به دنبال ایجاد حرفه ای
179
00:06:02,319 –> 00:06:03,520
در علم داده
180
00:06:03,520 –> 00:06:04,960
هستید اگر هستید پس من چیزی دارم که
181
00:06:04,960 –> 00:06:07,160
می تواند برای شما جالب باشد
182
00:06:07,160 –> 00:06:09,520
stratascratch.com پلتفرمی است که
183
00:06:09,520 –> 00:06:11,039
برای کمک به شما طراحی شده است. از
184
00:06:11,039 –> 00:06:13,440
طریق مصاحبه علم داده که بیش از
185
00:06:13,440 –> 00:06:15,520
هزار نفر دارد سوالات برگرفته از مصاحبههای واقعی
186
00:06:15,520 –> 00:06:16,479
علم داده
187
00:06:16,479 –> 00:06:18,960
و توسط دانشمندان داده ساخته شده است
188
00:06:18,960 –> 00:06:20,880
189
00:06:20,880 –> 00:06:24,400
190
00:06:24,400 –> 00:06:26,319
و آمار احتمال sql پایتون را پوشش میدهد و موارد بیشتری را بارگذاری میکند، اجازه دهید نگاهی دقیقتر
191
00:06:26,319 –> 00:06:27,680
192
00:06:27,680 –> 00:06:29,120
به پلتفرم بیندازیم.
193
00:06:29,120 –> 00:06:30,560
194
00:06:30,560 –> 00:06:32,080
صفحه اصلی که به
195
00:06:32,080 –> 00:06:34,639
شما نشان میدهد پلتفرم شامل چه چیزهایی است،
196
00:06:34,639 –> 00:06:35,840
زیرا نمیتوانم شما را در
197
00:06:35,840 –> 00:06:36,960
کل پلتفرم
198
00:06:36,960 –> 00:06:39,120
راهنمایی کنم، اما میدانید که بیش از 1000
199
00:06:39,120 –> 00:06:40,400
تمرین وجود دارد
200
00:06:40,400 –> 00:06:41,840
و اینها سؤالاتی هستند که
201
00:06:41,840 –> 00:06:43,680
از مصاحبههای واقعی با برخی از
202
00:06:43,680 –> 00:06:44,400
بزرگترین
203
00:06:44,400 –> 00:06:47,600
استخدامکنندگان علم داده گرفته شدهاند. و
204
00:06:47,600 –> 00:06:49,280
میدانید که
205
00:06:49,280 –> 00:06:52,160
طیف گستردهای از موضوعاتی را پوشش میدهد که
206
00:06:52,160 –> 00:06:53,599
در یک مصاحبه علم داده مطرح میشوند، میدانید
207
00:06:53,599 –> 00:06:55,280
بهترین راه برای آماده شدن برای
208
00:06:55,280 –> 00:06:56,080
مصاحبه علم
209
00:06:56,080 –> 00:06:58,319
داده، انجام سؤالات علم داده است، بنابراین
210
00:06:58,319 –> 00:06:59,919
اگر به پلتفرم واقعی نگاهی بیندازیم،
211
00:06:59,919 –> 00:07:02,080
بیایید انتخاب کنیم. سوالات پایتون و می
212
00:07:02,080 –> 00:07:03,759
توانید اینجا را ببینید که ما می توانیم سوالات مصاحبه را انتخاب کنیم
213
00:07:03,759 –> 00:07:04,560
214
00:07:04,560 –> 00:07:07,039
و سپس این شرکت هایی هستند
215
00:07:07,039 –> 00:07:08,479
که سوالات از آنجا هستند
216
00:07:08,479 –> 00:07:11,199
و ما همه را در آنجا انتخاب می کنیم و اگر این سوال
217
00:07:11,199 –> 00:07:12,720
را انجام دهیم آیا سوال airbnb در
218
00:07:12,720 –> 00:07:13,840
واقع این سوال بسیار جالب
219
00:07:13,840 –> 00:07:15,199
است زیرا پس از انجام
220
00:07:15,199 –> 00:07:16,000
آموزشی که اکنون در حال
221
00:07:16,000 –> 00:07:17,919
کار با آن هستید، می توانید به
222
00:07:17,919 –> 00:07:19,360
این سوال پاسخ دهید، بنابراین بیایید به آن
223
00:07:19,360 –> 00:07:20,400
نگاهی بیندازیم،
224
00:07:20,400 –> 00:07:22,639
یک سوال پیدا کردن 50 جستجو برای
225
00:07:22,639 –> 00:07:24,080
آپارتمان های جدید شهر
226
00:07:24,080 –> 00:07:25,120
یورک و محله هارلم
227
00:07:25,120 –> 00:07:27,360
اکنون به شما چارچوب داده داده شده است،
228
00:07:27,360 –> 00:07:29,360
بنابراین شما فقط باید از چارچوب داده عبور کنید
229
00:07:29,360 –> 00:07:31,120
تا اطلاعاتی را که
230
00:07:31,120 –> 00:07:33,280
آنها به دنبال آن هستند برگردانید، اگر
231
00:07:33,280 –> 00:07:34,240
به یکی نیاز دارید
232
00:07:34,240 –> 00:07:35,840
، به شما راهنمایی میکنند که خروجی مورد انتظار چیست.
233
00:07:35,840 –> 00:07:37,919
است و سپس راه حل مدل وجود دارد
234
00:07:37,919 –> 00:07:39,520
و سپس می توانید به راه حل های کاربران نگاه کنید، در
235
00:07:39,520 –> 00:07:42,960
اینجا فضایی
236
00:07:42,960 –> 00:07:45,680
برای آزمایش کد خود دارید، می توانید کد را اجرا کنید
237
00:07:45,680 –> 00:07:46,879
و پس از آماده شدن
238
00:07:46,879 –> 00:07:49,440
می توانید راه حل را بررسی کنید و
239
00:07:49,440 –> 00:07:50,479
در
240
00:07:50,479 –> 00:07:53,120
عین حال به این موضوع فکر کنید. دوباره این آموزش را مرور می
241
00:07:53,120 –> 00:07:53,919
کنم زیرا
242
00:07:53,919 –> 00:07:55,520
همه چیز را در آموزش آموزش می دهم که
243
00:07:55,520 –> 00:07:57,280
به شما امکان می دهد به
244
00:07:57,280 –> 00:08:00,080
این سوال پاسخ دهید، من محصولات زیادی را در این کانال توصیه نمی کنم،
245
00:08:00,080 –> 00:08:01,280
246
00:08:01,280 –> 00:08:02,879
اما اگر در مورد ورود به علم داده جدی هستید، توصیه
247
00:08:02,879 –> 00:08:05,039
می کنم شما
248
00:08:05,039 –> 00:08:06,400
به این نگاه کنید
249
00:08:06,400 –> 00:08:08,479
و این مقدمه ای برای پانداها است،
250
00:08:08,479 –> 00:08:10,400
مقدمه ای است برای کارهایی که می توانید با پانداها انجام دهید
251
00:08:10,400 –> 00:08:11,440
252
00:08:11,440 –> 00:08:13,919
و فکر می کنم وقتی
253
00:08:13,919 –> 00:08:14,639
254
00:08:14,639 –> 00:08:16,720
ببینید چه کاری می تواند انجام دهد آن را بسیار قدرتمند خواهید یافت و ما به
255
00:08:16,720 –> 00:08:18,720
تدریج در
256
00:08:18,720 –> 00:08:20,720
مورد آن یاد خواهیم گرفت پانداها چه کاری می توانند در
257
00:08:20,720 –> 00:08:21,759
طول این سری انجام
258
00:08:21,759 –> 00:08:24,639
دهند، به عنوان مثال در اینجا ما متغیری
259
00:08:24,639 –> 00:08:24,960
به
260
00:08:24,960 –> 00:08:28,639
نام df داریم که مخفف عبارت data frame است یک
261
00:08:28,639 –> 00:08:30,720
data frame یک شی پاندا است
262
00:08:30,720 –> 00:08:32,559
که اگر با آن آشنا نیستید
263
00:08:32,559 –> 00:08:34,559
به صفحه گسترده اکسل فکر کنید.
264
00:08:34,559 –> 00:08:36,399
صفحهگسترده اکسل
265
00:08:36,399 –> 00:08:39,440
اگر ستونها و ردیفهایی داشتید به نظر میرسید
266
00:08:39,440 –> 00:08:41,200
و واقعاً اگر بخواهید
267
00:08:41,200 –> 00:08:42,958
آن را در ذهن خود تجسم کنید اینطور است که یک
268
00:08:42,958 –> 00:08:43,839
قاب داده
269
00:08:43,839 –> 00:08:47,839
اکنون به نظر میرسد.
270
00:08:47,839 –> 00:08:51,120
271
00:08:51,120 –> 00:08:52,959
ما
272
00:08:52,959 –> 00:08:54,720
به پانداها اجازه میدهیم از همه چیز مراقبت کنند
273
00:08:54,720 –> 00:08:55,839
و تنها چیزی که میخواهیم
274
00:08:55,839 –> 00:08:59,360
در اینجا وارد کنیم مسیر CSV است و
275
00:08:59,360 –> 00:09:02,240
دادهها را به عنوان یک قاب داده میخواند،
276
00:09:02,240 –> 00:09:03,440
ما یک فایل CSV داریم
277
00:09:03,440 –> 00:09:05,360
که در آن خوانده میشود. به عنوان یک
278
00:09:05,360 –> 00:09:06,640
چارچوب داده اما
279
00:09:06,640 –> 00:09:09,440
پارامترهای دیگری وجود دارد e که می توانید تنظیم کنید،
280
00:09:09,440 –> 00:09:11,120
اما در حال حاضر ما این کار را انجام نمی دهیم،
281
00:09:11,120 –> 00:09:11,680
بنابراین
282
00:09:11,680 –> 00:09:14,480
اگر آن را اجرا کنیم، اکنون آن را بدون خطا انجام داده ایم،
283
00:09:14,480 –> 00:09:17,120
بنابراین این متغیر df thou
284
00:09:17,120 –> 00:09:19,760
data frame حاوی داده
285
00:09:19,760 –> 00:09:22,480
هایی است که ما به تازگی از وب سایت who دانلود کرده ایم،
286
00:09:22,480 –> 00:09:25,360
پس بیایید نگاهی گذرا بیندازید
287
00:09:25,360 –> 00:09:27,519
و ببینید چه چیزی داریم تا بتوانیم
288
00:09:27,519 –> 00:09:28,640
ببینیم که 28
289
00:09:28,640 –> 00:09:31,760
958 سطر و 8 ستون وجود دارد که می توانیم ستون ها را ببینیم
290
00:09:31,760 –> 00:09:33,519
، اما ما در
291
00:09:33,519 –> 00:09:34,160
292
00:09:34,160 –> 00:09:36,720
دیدن سطرها محدودیت داریم، بدیهی است که نمی توانیم 28
293
00:09:36,720 –> 00:09:39,440
000 یا 29 000 سطر داشته باشیم. حضور در
294
00:09:39,440 –> 00:09:41,120
اینجا فضای زیادی را اشغال میکند، بنابراین میتوانیم
295
00:09:41,120 –> 00:09:43,360
چند ردیف اول را در چند ردیف آخر ببینیم و
296
00:09:43,360 –> 00:09:45,279
فقط با بررسی بصری میتوانیم متوجه
297
00:09:45,279 –> 00:09:47,040
شویم که مفید است، اما میتوانیم
298
00:09:47,040 –> 00:09:48,320
خیلی بیشتر از آن انجام دهیم،
299
00:09:48,320 –> 00:09:51,680
فقط متوجه شوید که داریم. این
300
00:09:51,680 –> 00:09:54,399
در اینجا این شاخص اینجا صفر یک دو
301
00:09:54,399 –> 00:09:54,800
سه
302
00:09:54,800 –> 00:09:57,760
چهار در حال حاضر این توسط پانداها اضافه شده
303
00:09:57,760 –> 00:09:58,080
304
00:09:58,080 –> 00:10:01,360
است این بخشی از داده های اصلی نیست
305
00:10:01,360 –> 00:10:03,920
پانداها خود این را اضافه کرده اند و شما می توانید
306
00:10:03,920 –> 00:10:04,560
307
00:10:04,560 –> 00:10:06,720
نحوه عملکرد این را کنترل کنید اگر
308
00:10:06,720 –> 00:10:09,440
اکنون به داده های خام نگاهی بیندازیم و می توانید این کار را با
309
00:10:09,440 –> 00:10:12,320
کلیک بر روی صفحه اصلی نوت بوک jupyter انجام دهید
310
00:10:12,320 –> 00:10:12,880
311
00:10:12,880 –> 00:10:16,079
و سپس فقط روی
312
00:10:16,079 –> 00:10:17,680
دادههای اینجا دوبار کلیک کنید که باید
313
00:10:17,680 –> 00:10:20,480
دانلود میکردید، اگر این کار را انجام میدادید، اکنون
314
00:10:20,480 –> 00:10:22,079
روی این برگه کلیک میکنیم، در اینجا من قبلاً
315
00:10:22,079 –> 00:10:23,600
من را
316
00:10:23,600 –> 00:10:26,560
باز کردهام.
317
00:10:26,560 –> 00:10:30,480
ردیف این فایل csv
318
00:10:30,480 –> 00:10:31,120
319
00:10:31,120 –> 00:10:33,680
نام سرفصل های ستون است و
320
00:10:33,680 –> 00:10:35,519
pandas آن را تشخیص داده و
321
00:10:35,519 –> 00:10:37,040
آن ها را به ستون هایی
322
00:10:37,040 –> 00:10:39,600
در قاب داده تبدیل کرده است.
323
00:10:39,600 –> 00:10:40,959
324
00:10:40,959 –> 00:10:44,240
325
00:10:44,240 –> 00:10:47,040
326
00:10:47,040 –> 00:10:47,839
327
00:10:47,839 –> 00:10:50,079
در ویدیوهای آینده و
328
00:10:50,079 –> 00:10:51,760
اهمیت ایندکس و اینکه واقعا چه کاری انجام میدهد و
329
00:10:51,760 –> 00:10:53,519
چگونه کار میکند و چگونه میتوانید آن را دستکاری کنید،
330
00:10:53,519 –> 00:10:54,720
اما در حال حاضر
331
00:10:54,720 –> 00:10:57,839
ما فقط به پانداها اجازه میدهیم این را بخوانند زیرا
332
00:10:57,839 –> 00:10:58,320
فکر
333
00:10:58,320 –> 00:11:02,160
میکند بهترین کار است که میتوانیم به فهرست دسترسی
334
00:11:02,160 –> 00:11:05,680
داشته باشیم. بخواهید و
335
00:11:05,680 –> 00:11:07,120
با تایپ
336
00:11:07,120 –> 00:11:10,399
نام قاب داده در این مورد df
337
00:11:10,399 –> 00:11:14,000
dot index به نمایه دسترسی پیدا می کند و اگر این کار را انجام دهیم می
338
00:11:14,000 –> 00:11:16,880
بینیم که این شیء شاخص را در اینجا داریم
339
00:11:16,880 –> 00:11:18,480
که اطلاعاتی به ما می دهد اما
340
00:11:18,480 –> 00:11:20,560
به ما می گوید که این یک شاخص است. خود شاخص
341
00:11:20,560 –> 00:11:21,279
342
00:11:21,279 –> 00:11:24,959
یک سپتامبر است شی arate و در اینجا
343
00:11:24,959 –> 00:11:26,800
اگر بخواهیم به ستون ها نگاهی بیندازیم،
344
00:11:26,800 —